[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-ai-agent-workflows-context-actions-verification-zh":3,"tags-ai-agent-workflows-context-actions-verification-zh":33,"related-lang-ai-agent-workflows-context-actions-verification-zh":47,"related-posts-ai-agent-workflows-context-actions-verification-zh":51,"series-ai-agent-e69f860c-dee7-4831-9ebd-c4485a6fb56f":88},{"id":4,"title":5,"content":6,"summary":7,"source":8,"source_url":9,"author":10,"image_url":11,"keywords":12,"language":21,"translated_content":10,"views":22,"is_premium":23,"created_at":24,"updated_at":24,"cover_image":11,"published_at":25,"rewrite_status":26,"rewrite_error":10,"rewritten_from_id":27,"slug":28,"category":29,"related_article_id":30,"status":31,"google_indexed_at":32,"x_posted_at":10,"tweet_text":10,"title_rewritten_at":10,"title_original":10,"key_takeaways":10,"topic_cluster_id":10,"embedding":10,"is_canonical_seed":23},"e69f860c-dee7-4831-9ebd-c4485a6fb56f","AI Agent 工作流怎麼運作","\u003Cp>\u003Ca href=\"\u002Fnews\u002Fblockchain-in-ai-real-use-cases-zh\">AI\u003C\u002Fa> Agent 常被講得很神。講白了，它比較像流水線。真正能用的系統，靠的是 4 步：收集上下文、執行動作、驗證結果、再重試。\u003C\u002Fp>\u003Cp>這個循環比模型大小更重要。你給 200k token，也不代表會做對。讀錯檔案、跳過驗證，一樣會翻車。\u003C\u002Fp>\u003Cp>說真的，Agent 不是一段 prompt。它是系統。這篇我用 \u003Ca href=\"https:\u002F\u002Faibuilderhub.dev\u002Fen\u002Fblog\u002Fai-agent-workflow-loop\" target=\"_blank\" rel=\"noopener\">AI Builder Hub\u003C\u002Fa> 的工作流觀點，拆給你看。你如果用 \u003Ca href=\"https:\u002F\u002Fopenai.com\" target=\"_blank\" rel=\"noopener\">OpenAI\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\" target=\"_blank\" rel=\"noopener\">Anthropic\u003C\u002Fa>，或 \u003Ca href=\"https:\u002F\u002Fwww.langchain.com\" target=\"_blank\" rel=\"noopener\">LangChain\u003C\u002Fa>，重點都一樣：流程有沒有辦法自己抓錯、縮小範圍、把事情做完。\u003C\u002Fp>\u003Ch2>Agent loop 才是核心\u003C\u002Fh2>\u003Cp>最實用的說法很簡單。可靠的 Agent 會先拿對資料，再動手，接著驗證，最後根據結果修正。這聽起來很基本，但很多團隊就是卡在這裡。做了一個能聊天、能呼叫工具的介面，就以為自己做出 Agent。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775116338426-p13x.png\" alt=\"AI Agent 工作流怎麼運作\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>實際工作沒那麼浪漫。寫程式的 Agent，要先看檔案，再改檔案。研究型 Agent，要先讀資料，再下結論。客服型 Agent，要先查政策，再回覆。少了這個循環，模型講話再順，也可能是在亂猜。\u003C\u002Fp>\u003Cp>我覺得這裡最容易被忽略的，是順序。先找上下文，再做動作。不是反過來。很多失敗案例都不是模型不夠強，而是流程一開始就拿錯資訊。\u003C\u002Fp>\u003Cul>\u003Cli>先找上下文：檔案、log、文件、歷史訊息都算。\u003C\u002Fli>\u003Cli>再做動作：要真的用工具，不是只講建議。\u003C\u002Fli>\u003Cli>接著驗證：測試、schema、lint、人工檢查都行。\u003C\u002Fli>\u003Cli>最後重試：失敗後縮小範圍，再跑一次。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這也是為什麼，很多 Agent 反而在「限制自由」後變穩。工具少一點，邊界清楚一點，檢查嚴一點，常常比把所有規則塞進超長 prompt 更有用。\u003C\u002Fp>\u003Cp>還有一個現實問題。每多跑一輪，就多吃 token 和時間。重點不是不要迭代，而是每一輪都要更精準。這才是工程，不是許願。\u003C\u002Fp>\u003Ch2>上下文工程，比大 prompt 更重要\u003C\u002Fh2>\u003Cp>很多人愛吹 context window。可是一個大視窗，不代表會用得好。Agent 拿到整個 codebase，卻只需要 3 個檔案，這種做法很浪費。注意力被雜訊吃掉，最後還是漏掉真正的 bug。\u003C\u002Fp>\u003Cp>這也是現在 production 系統的做法。團隊會用搜尋、檢索、檔案掃描，把真正需要的資料撈出來。像 grep、vector search、文件查詢、前一步的歷史紀錄，都是常見做法。目標不是拿最多內容。目標是拿最相關的內容。\u003C\u002Fp>\u003Cp>這裡可以直接對照 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fanthropics\u002Fclaude-code\" target=\"_blank\" rel=\"noopener\">Claude Code\u003C\u002Fa> 這類工具。它們真正有價值的地方，不是單純能讀很多 token，而是能幫你把問題縮小。你給它 500 個檔案，它不一定更準。你給它 3 個關鍵檔案，通常反而更快。\u003C\u002Fp>\u003Cblockquote>“The future of AI is not about replacing human intelligence, but about augmenting human capabilities.” — Fei-Fei Li\u003C\u002Fblockquote>\u003Cp>Fei-Fei Li 這句話放在這裡很貼切。好的 Agent，不是一直猜。它會先問對問題，再用對資料。這比幻想模型自己腦補全部上下文，實際多了。\u003C\u002Fp>\u003Cp>如果你在做程式碼助手、文件助手、資料分析助手，這個差別超大。上下文抓得準，模型就像有方向感。上下文抓不準，再強的 LLM 也會像在迷路。\u003C\u002Fp>\u003Ch2>驗證，才是 Agent 值不值得信任的地方\u003C\u002Fh2>\u003Cp>很多人做 Agent，最常跳過的就是驗證。模型先生出一段看起來很漂亮的答案，大家就信了。這習慣很危險。講得順，不代表做得對。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775116364668-qyce.png\" alt=\"AI Agent 工作流怎麼運作\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>驗證可以有很多種。程式碼可以跑測試。API 回應可以對 schema。UI 可以比對截圖。高風險操作，可以走人工審核。重點不是找一種萬能檢查，而是讓系統有回饋，而不是只有信仰。\u003C\u002Fp>\u003Cp>這裡我很喜歡把 Agent 當成軟體流程看。不是一個回答機器，而是一個會失敗、會檢查、會修正、會再試一次的系統。這種東西才接近可上線。\u003C\u002Fp>\u003Cul>\u003Cli>規則檢查：格式、欄位、命名先擋掉。\u003C\u002Fli>\u003Cli>Lint：語法和風格錯誤先抓出來。\u003C\u002Fli>\u003Cli>測試：回歸問題最容易在這裡現形。\u003C\u002Fli>\u003Cli>人工審核：高風險決策別全交給模型。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>如果你已經在用 \u003Ca href=\"https:\u002F\u002Fwww.pydantic.dev\" target=\"_blank\" rel=\"noopener\">Pydantic\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fdocs.python.org\u002F3\u002Flibrary\u002Funittest.html\" target=\"_blank\" rel=\"noopener\">Python unittest\u003C\u002Fa>，或 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Ffeatures\u002Factions\" target=\"_blank\" rel=\"noopener\">GitHub Actions\u003C\u002Fa>，你其實已經有一半的 Agent 骨架了。差的只是把這些檢查，接進 Agent 自己的迴圈裡。\u003C\u002Fp>\u003Cp>我也想吐槽一下。很多團隊嘴上說要做可靠 Agent，結果驗證只有「看起來像對的」。這種做法在 demo 可以，進 production 就很容易爆。\u003C\u002Fp>\u003Ch2>子 Agent 不是萬靈丹\u003C\u002Fh2>\u003Cp>子 Agent 這件事，常被講得太神。其實它只是分工工具。當任務可以拆成幾個界線清楚的小工作時，子 Agent 才有價值。不是每個任務都需要一堆小代理人。\u003C\u002Fp>\u003Cp>想像一個 orche\u003Ca href=\"\u002Fnews\u002Ftrust-wallet-agent-kit-ai-trade-25-chains-zh\">st\u003C\u002Fa>rator Agent。它把工作丟給不同子 Agent。A 去找資料。B 查安全問題。C 看效能。最後 orchestrator 收回結果，再決定下一步。這種方式適合範圍大、子任務窄的工作。\u003C\u002Fp>\u003Cp>但代價也很明顯。Agent 越多，協調成本越高。token 用量會上升。不同子 Agent 也可能給出互相衝突的答案。所以子 Agent 不是越多越好，而是要剛好切得動。\u003C\u002Fp>\u003Cul>\u003Cli>搜尋工作：適合平行蒐集來源。\u003C\u002Fli>\u003Cli>程式碼審查：可分安全、效能、風格三路看。\u003C\u002Fli>\u003Cli>研究整理：先分開讀，再統一寫摘要。\u003C\u002Fli>\u003Cli>方案比較：讓不同子 Agent 各自評估。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這種架構最實際的地方，是它很像真實開發流程。不是一個模型包山包海，而是有人負責協調，有人負責查證，有人負責執行。說白了，就是把大型任務拆開。\u003C\u002Fp>\u003Cp>如果你用 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude\" target=\"_blank\" rel=\"noopener\">Claude\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fgpt-4o\" target=\"_blank\" rel=\"noopener\">GPT-4o\u003C\u002Fa>，或透過 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Flangchain-ai\u002Flanggraph\" target=\"_blank\" rel=\"noopener\">LangGraph\u003C\u002Fa> 做流程編排，重點不是「能不能多開幾個 Agent」。重點是哪些工作真的值得獨立出去。\u003C\u002Fp>\u003Ch2>這件事背後的產業脈絡\u003C\u002Fh2>\u003Cp>Agent 熱潮會一直出現，原因很簡單。大家都想把重複工作交給軟體。尤其是客服、資料整理、程式碼維護、內部知識查詢，這些場景都很適合做成流程。\u003C\u002Fp>\u003Cp>但產業裡真正落地的案例，幾乎都不是靠單一大 prompt。它們靠的是資料管線、權限控管、工具串接、驗證機制。也就是說，Agent 成功的關鍵，常常不是模型本身，而是周邊工程。\u003C\u002Fp>\u003Cp>這也是為什麼，很多 \u003Ca href=\"\u002Fnews\u002Ftrust-wallet-ai-trading-agents-220m-users-zh\">AI\u003C\u002Fa> 專案最後會回到傳統軟體工程。你還是得處理 log、錯誤、權限、版本控制、測試環境。模型只是新零件，不是整台機器。\u003C\u002Fp>\u003Cp>再看成本面也很現實。每一次呼叫 API 都有費用。每一次重試都要算 token。每一次工具調用都可能卡在延遲。Agent 不是越聰明越好，而是越少浪費越好。\u003C\u002Fp>\u003Cp>所以我會說，真正成熟的 Agent 團隊，會把注意力放在三件事：上下文怎麼取、動作怎麼做、結果怎麼驗。這三件事做好，模型才有機會發揮。\u003C\u002Fp>\u003Ch2>結論：先把一個流程做穩\u003C\u002Fh2>\u003Cp>如果你現在要做 Agent，我的建議很直接。先挑一個任務。把它拆成上下文、動作、驗證、重試四步。不要一開始就想做全能助手。那通常只是把複雜度往後延。\u003C\u002Fp>\u003Cp>我自己的判斷是，接下來大家會更在意「完成率」而不是「聰明度」。Agent 能不能一次做對，或第二次修對，會比它講話多漂亮更重要。這才是能不能上線的差別。\u003C\u002Fp>\u003Cp>所以你可以問自己一個很實際的問題：你手上第一個能被做成 loop 的工作是什麼？如果你能替它加上一個明確檢查點，你就已經比很多只會聊天的 Agent 走得更遠了。\u003C\u002Fp>","AI Agent 不是靠一句提示詞就能跑。真正好用的系統靠的是「收集上下文、執行動作、驗證結果、重試」的工作流。","aibuilderhub.dev","https:\u002F\u002Faibuilderhub.dev\u002Fen\u002Fblog\u002Fai-agent-workflow-loop",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775116338426-p13x.png",[13,14,15,16,17,18,19,20],"AI Agent","工作流","上下文工程","驗證機制","子 Agent","LangChain","Claude","GPT-4o","zh",1,false,"2026-04-02T07:03:33.780133+00:00","2026-04-02T07:03:33.573+00:00","done","ff21fb48-e77d-47a6-a10a-d18544fc5240","ai-agent-workflows-context-actions-verification-zh","ai-agent","c006ce9e-1c5e-4091-b99e-e13eb02b643e","published","2026-04-09T09:00:50.409+00:00",[34,36,38,39,41,43,45,46],{"name":20,"slug":35},"gpt-4o",{"name":18,"slug":37},"langchain",{"name":15,"slug":15},{"name":19,"slug":40},"claude",{"name":17,"slug":42},"子-agent",{"name":44,"slug":29},"AI agent",{"name":14,"slug":14},{"name":16,"slug":16},{"id":30,"slug":48,"title":49,"language":50},"ai-agent-workflows-context-actions-verification-en","How AI Agent Workflows Actually Work","en",[52,58,64,70,76,82],{"id":53,"slug":54,"title":55,"cover_image":56,"image_url":56,"created_at":57,"category":29},"38406a12-f833-4c69-ae22-99c31f03dd52","switch-ai-outputs-markdown-to-html-zh","怎麼把 AI 輸出改成 HTML","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778743243861-8901.png","2026-05-14T07:20:21.545364+00:00",{"id":59,"slug":60,"title":61,"cover_image":62,"image_url":62,"created_at":63,"category":29},"c7c69fe4-97e3-4edf-a9d6-a79d0c4495b4","anthropic-cat-wu-proactive-ai-assistants-zh","Cat Wu 談 Claude 的主動式 AI","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778735455993-gnw7.png","2026-05-14T05:10:30.453046+00:00",{"id":65,"slug":66,"title":67,"cover_image":68,"image_url":68,"created_at":69,"category":29},"e1d6acda-fa49-4514-aa75-709504be9f93","how-to-run-hermes-agent-on-discord-zh","如何在 Discord 執行 Hermes Agent","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778724655796-cjul.png","2026-05-14T02:10:34.362605+00:00",{"id":71,"slug":72,"title":73,"cover_image":74,"image_url":74,"created_at":75,"category":29},"4104fa5f-d95f-45c5-9032-99416cf0365c","why-ragflow-is-the-right-open-source-rag-engine-to-self-host-zh","為什麼 RAGFlow 是最適合自架的開源 RAG 引擎","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778674262278-1630.png","2026-05-13T12:10:23.762632+00:00",{"id":77,"slug":78,"title":79,"cover_image":80,"image_url":80,"created_at":81,"category":29},"7095f05c-34f5-469f-a044-2525d2010ce9","how-to-add-temporal-rag-in-production-zh","如何在正式環境加入 Temporal RAG","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778667053844-osvs.png","2026-05-13T10:10:30.930982+00:00",{"id":83,"slug":84,"title":85,"cover_image":86,"image_url":86,"created_at":87,"category":29},"10479c95-53c6-4723-9aaa-2fde5fb19ee7","github-agentic-workflows-ai-github-actions-zh","GitHub 把 AI 代理放進 Actions","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778551884342-8io7.png","2026-05-12T02:11:02.069769+00:00",[89,94,99,104,109,114,119,124,129,134],{"id":90,"slug":91,"title":92,"created_at":93},"4ae1e197-1d3d-4233-8733-eafe9cb6438b","claude-now-uses-your-pc-to-finish-tasks-zh","Claude 開始幫你操作電腦","2026-03-26T07:20:48.457387+00:00",{"id":95,"slug":96,"title":97,"created_at":98},"5bede67f-e21c-413d-9ab8-54a3c3d26227","googles-2026-ai-agent-report-decoded-zh","Google 2026 AI Agent 報告解讀","2026-03-26T11:15:22.651956+00:00",{"id":100,"slug":101,"title":102,"created_at":103},"2987d097-563f-46c7-b76f-b558d8ef7c2b","kimi-k25-review-stronger-still-not-legend-zh","Kimi K2.5 評測：更強，但還不是神作","2026-03-27T07:15:55.277513+00:00",{"id":105,"slug":106,"title":107,"created_at":108},"95c9053b-e3f4-4cb5-aace-5c54f4c9e044","claude-code-controls-mac-desktop-zh","Claude Code 也能操控 Mac 了","2026-03-28T03:01:58.58121+00:00",{"id":110,"slug":111,"title":112,"created_at":113},"dc58e153-e3a8-4c06-9b96-1aa64eabbf5f","cloudflare-100x-faster-ai-agent-sandbox-zh","Cloudflare 的 AI 沙箱跑超快","2026-03-28T03:09:44.142236+00:00",{"id":115,"slug":116,"title":117,"created_at":118},"1c8afc56-253f-47a2-979f-1065ff072f2a","openai-backs-isara-agent-swarm-bet-zh","OpenAI 挺 Isara 的 agent swarm …","2026-03-28T03:15:27.513155+00:00",{"id":120,"slug":121,"title":122,"created_at":123},"7379b422-576e-45df-ad5a-d57a0d9dd467","openai-plan-automated-ai-researcher-zh","OpenAI 想做自動化 AI 研究員","2026-03-28T03:17:42.090548+00:00",{"id":125,"slug":126,"title":127,"created_at":128},"48c9889e-86df-450b-a356-e4a4b7c83c5b","harness-engineering-ai-agent-reliability-2026-zh","駕馭工程：從「馬具」到「作業系統」，AI Agent 可靠性的終極密碼","2026-03-31T06:42:53.556721+00:00",{"id":130,"slug":131,"title":132,"created_at":133},"e41546b8-ba9e-455f-9159-88d4614ad711","openai-codex-plugin-claude-code-zh","OpenAI 把 Codex 放進 Claude Code","2026-04-01T09:21:54.687617+00:00",{"id":135,"slug":136,"title":137,"created_at":138},"96d8e8c8-1edd-475d-9145-b1e7a1b02b65","mcp-explained-from-prompts-to-production-zh","MCP 怎麼把提示詞變工作流","2026-04-01T09:24:39.321274+00:00"]