[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-glm-5-vibe-coding-agentic-engineering-zh":3,"article-related-glm-5-vibe-coding-agentic-engineering-zh":30,"series-ai-agent-9fc5b17b-77e0-442f-b40d-6c5d0c74a980":75},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":22,"views":26,"created_at":27,"published_at":28,"topic_cluster_id":29},"9fc5b17b-77e0-442f-b40d-6c5d0c74a980","glm-5-vibe-coding-agentic-engineering-zh","GLM-5 把 vibe coding 變工程","\u003Cp data-speakable=\"summary\">我拆 GLM-5 的長程 coding playbook，順手給你一份可直接貼進 \u003Ca href=\"\u002Ftag\u002Fagent\">agent\u003C\u002Fa> 的模板。\u003C\u002Fp>\u003Cp>我用 coding agent 一陣子了，越用越火大。Demo 看起來都很會，改一小段 code 也像模像樣，但一碰到多檔案、反覆修 bug、要追 tool output 的工作，它就開始亂跑。你丟一個半成品想法給它，它永遠說好；你叫它回頭檢查，它又像沒聽見。那種感覺很像把 autocomplete 包裝成 AI，還要你假裝這叫工程。\u003C\u002Fp>\u003Cp>我真正想要的不是「會寫 code」而已。我想要的是一個能撐住長任務的東西：知道自己可能錯、願意改策略、能把前面幾輪的 evidence 接起來，不要每次都像失憶。後來我去看了 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fzai-org\u002FGLM-5\">zai-org\u002FGLM-5\u003C\u002Fa>，才發現它們根本不是在賣一個單點模型，而是在講一套把 \u003Ca href=\"\u002Fnews\u002Fopen-source-tools-vibe-coding-cybersecurity-zh\">vibe\u003C\u002Fa> coding 拉回 agentic engineering 的方法。\u003C\u002Fp>\u003Cp>這篇就是我把那套方法拆開。不是宣傳文，不是幫它洗白。我只想看清楚：它到底在解決什麼\u003Ca href=\"\u002Fnews\u002Fdiffusiongemma-transparency-measured-zh\">問題\u003C\u002Fa>，哪些地方值得抄，哪些地方你自己也能做。\u003C\u002Fp>\u003Cp>Source anchor：我主要根據 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fzai-org\u002FGLM-5\">GLM-5 GitHub repo\u003C\u002Fa> 的 README 與公開說明來拆解。repo 裡有些數字我會照寫，沒提供的我就不亂補。\u003C\u002Fp>\u003Ch2>它不是更會寫 code，是更能撐住任務\u003C\u002Fh2>\u003Cblockquote>\"GLM-5.2, our latest flagship model for long-horizon tasks. It marks a substantial leap in long-horizon task capability over its predecessor GLM-5.1 and, for the first time, delivers that capability on a solid 1M-token context.\"\u003C\u002Fblockquote>\u003Cp>翻譯一下就是：它們不想只比誰 patch 寫得漂亮，而是比誰能把一個長任務從頭扛到尾。這個差別很大。會寫 code 的模型很多，能在一個亂七八糟的 repo 裡撐住十幾輪工具呼叫、還不把方向帶歪的，少很多。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781853513619-0z11.png\" alt=\"GLM-5 把 vibe coding 變工程\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>我自己最常碰到的痛點，就是 agent 一開始很聰明，後面越跑越散。前兩輪還知道自己在修什麼，第三輪看到一個新錯誤就整個被帶走，開始對最新輸出過度反應。這時候你就知道，它不是在做工程，它是在追聲音最大的那個訊號。\u003C\u002Fp>\u003Cp>GLM-5.2 強調 1M-token context，我不會天真到以為 context 大就等於會做事，但它至少解掉一個很現實的問題：模型不會那麼快把整個任務忘掉。對長任務來說，這不是小事。你要它看整個 codebase、看前面的實驗紀錄、看失敗原因，沒有足夠上下文，後面全是瞎忙。\u003C\u002Fp>\u003Cp>實操寫法很簡單：你不要拿短 prompt 去測 agent。要拿真的長任務去壓它，像是跨檔案 refactor、帶測試的 bug fix、或是中途需求改一次。看它會不會保留約束、會不會記得前面已經試過什麼、會不會在證據變了之後修正方向。\u003C\u002Fp>\u003Cul>\u003Cli>測 agent 時，先測「能不能持續」再測「會不會回答」。\u003C\u002Fli>\u003Cli>讓它跑多輪 tool call，觀察它有沒有失去任務主線。\u003C\u002Fli>\u003Cli>如果它每次都像第一次看到問題，這模型就不適合做長程工程。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>我會把這段當成整份 repo 的核心訊號：它不是在講更漂亮的輸出，而是在講更長時間的控制力。這才像工程，不像玩具。\u003C\u002Fp>\u003Ch2>Effort 可調，才像真的在管思考成本\u003C\u002Fh2>\u003Cblockquote>\"Advanced Coding with Flexible Effort: Stronger coding capabilities with multiple thinking effort levels to balance performance and latency\"\u003C\u002Fblockquote>\u003Cp>也就是說，它不是逼模型每次都用同一種腦力。這點我很買單，因為現實世界根本沒有一種任務吃同一種成本。修 typo 跟追 production bug，怎麼可能用同一個 thinking budget。\u003C\u002Fp>\u003Cp>repo 裡有 \u003Ccode>reasoning_effort\u003C\u002Fcode> 參數，提到 \u003Ccode>max\u003C\u002Fcode> 和 \u003Ccode>high\u003C\u002Fcode> 兩種層級，另外也說 \u003Ccode>enable_thinking=false\u003C\u002Fcode> 可以把思考關掉。這種設計我看了會點頭，因為它承認一件很基本的事：不是每次都要想很久，但該想久的時候也不能偷懶。\u003C\u002Fp>\u003Cp>我之前最煩的 agent，就是不是太慢就是太衝。太慢的會在簡單問題上拖一堆時間，太衝的則是第一個答案看起來像樣就直接衝出去，後面再補救。兩種都很煩，因為你最後還是得自己收尾。\u003C\u002Fp>\u003Cp>實操上，我會把 effort 切成工作層級。小修小補、可重現的 bug、單點 patch，用預設或低成本模式。跨模組改動、模糊需求、需要反覆驗證的工作，再升到高 effort。不要反過來，因為那只是在浪費 token 和時間。\u003C\u002Fp>\u003Cp>如果你做的是產品內建 agent，這個參數最好讓 orchestrator 能控制，不要埋死在 prompt 裡。因為 prompt 不能知道這次是「改一行」還是「查一整串失敗鏈」。系統應該知道，模型不該猜。\u003C\u002Fp>\u003Cul>\u003Cli>把 effort 當作工作階層，不要當作炫技設定。\u003C\u002Fli>\u003Cli>先用便宜模式跑，失敗再升級，不要一開始就灌滿成本。\u003C\u002Fli>\u003Cli>記錄每次 effort 與結果，才知道哪種任務值得花腦力。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這種設計我才會叫它像基礎設施。因為基礎設施就是要能管成本，不是只會秀結果。\u003C\u002Fp>\u003Ch2>IndexShare 這種不帥的優化，反而最像真的做過系統\u003C\u002Fh2>\u003Cblockquote>\"We propose IndexShare, which reuses the same indexer across every four sparse attention layers, reducing per-token FLOPs by 2.9× at a 1M context length.\"\u003C\u002Fblockquote>\u003Cp>翻譯一下就是：它們知道長上下文不是白吃的。你可以把 context 拉很長，但如果每個 token 的成本一起爆掉，那最後還是沒人敢用。這種話很樸素，可是很重要。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781853517676-9d5c.png\" alt=\"GLM-5 把 vibe coding 變工程\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>我喜歡這個點，因為它不像行銷詞。它比較像工程師坐在那邊算帳後說：好，這個東西要活下來，就得把重複成本壓掉。reusing indexer across layers 這種做法，聽起來不性感，但很像真的碰過部署壓力的人才會做的事。\u003C\u002Fp>\u003Cp>我以前踩過一個坑：團隊很愛 \u003Ca href=\"\u002Ftag\u002Flong-context\">long context\u003C\u002Fa>，因為 demo 很爽，結果一上線 latency 爆掉，成本也爆掉。最後大家才發現，能不能看得長是一回事，能不能一直看得長又是另一回事。前者是能力，後者是產品。\u003C\u002Fp>\u003Cp>實操寫法是這樣：你做 agent 或長上下文系統時，不要只看「能不能塞進去」。你要一起看 token 成本、延遲、記憶體、cache reuse、以及 repeated retrieval 的代價。只要有一個環節沒算，後面就會被現實打臉。\u003C\u002Fp>\u003Cul>\u003Cli>長上下文一定要做成本 profile，不要只做能力 demo。\u003C\u002Fli>\u003Cli>能重用的中間結果就重用，別每層都重算。\u003C\u002Fli>\u003Cli>如果你的 agent 要反覆讀同一批資訊，先想怎麼共享狀態。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這段我會直接翻成一句話：長上下文不是炫技，長上下文是帳單。帳單付得起，才叫能力。\u003C\u002Fp>\u003Ch2>Benchmark 不是裝飾，它是在看你會不會把活做完\u003C\u002Fh2>\u003Cblockquote>\"On standard coding benchmarks, GLM-5.2 is the strongest open-source model, improving on GLM-5.1 by a wide margin: 81.0 vs. 62.0 on Terminal-Bench 2.1 and 62.1 vs. 58.4 on SWE-bench Pro.\"\u003C\u002Fblockquote>\u003Cp>這句話的重點不是「誰最強」這麼膚淺。重點是它們拿來比的，是 terminal-heavy 和 repo-heavy 的任務。也就是說，它們在測的不是漂亮回答，而是能不能真的把軟體工作做完。\u003C\u002Fp>\u003Cp>我很在意這件事，因為很多模型在小題目上很像神，但一進到真實工程就露餡。你叫它修一個 bug，它先猜答案；你叫它跑測試，它開始自信地亂補；你叫它看 terminal output，它又只抓最後一行。這些都不是工程習慣，這些是幻覺。\u003C\u002Fp>\u003Cp>repo 還提到它在 Terminal-Bench 2.1 上接近 \u003Ca href=\"\u002Ftag\u002Fclaude\">Claude\u003C\u002Fa> Opus 4.8，並且在 \u003Ca href=\"\u002Ftag\u002Fswe-bench\">SWE-bench\u003C\u002Fa> Pro 上也有明確數字。這些 \u003Ca href=\"\u002Ftag\u002Fbenchmark\">benchmark\u003C\u002Fa> 本身有限，我不會把它們當宇宙真理，但它至少告訴我：這個模型不是只會說，它有在對準真實工作流。\u003C\u002Fp>\u003Cp>實操上，你自己的 agent 測試也要換腦袋。不要只餵單輪 prompt。要餵能失敗、能回頭、能被證據推翻的任務。像是 shell command 失敗、測試壞掉、文件過期、需求中途變更。看它會不會先查證，再動手，而不是先亂改。\u003C\u002Fp>\u003Cp>如果它在這種情境下還能穩住，那才值得進你的流程。否則 benchmark 再漂亮，也只是簡報上的裝飾。\u003C\u002Fp>\u003Ch2>GLM-5.1 的定位，其實是在教模型怎麼當工程師\u003C\u002Fh2>\u003Cblockquote>\"GLM-5.1, our next-generation flagship model for agentic engineering, with significantly stronger coding capabilities than its predecessor.\"\u003C\u002Fblockquote>\u003Cp>這句話很直白：它們把「寫 code」跟「做 agentic engineering」分開看了。這個分法我覺得對。因為會寫 code 不代表會做工程，會補 patch 也不代表會管理一個多輪任務。\u003C\u002Fp>\u003Cp>README 裡面提到，GLM-5.1 能處理模糊問題、拆解複雜任務、做實驗、讀結果、找 blocker，還能在數百輪、數千次 tool calls 裡維持最佳化。這才是我認為 agent 該有的樣子：不是只產生答案，而是能夠維持一個有節奏的工作流程。\u003C\u002Fp>\u003Cp>我之前最常看到的失敗模式，就是模型卡在第一個假設裡出不來。明明 evidence 已經變了，它還是死守原本那條路，像是怕承認自己錯。工程不是這樣。工程是你要會改，而且要知道什麼時候該改。\u003C\u002Fp>\u003Cp>實操寫法是把「修正」變成流程的一部分。不要只讓模型提案，還要逼它檢查結果、比較前後差異、寫下 blocker，再決定下一步。這樣它才不會把每一輪都當成獨立事件。\u003C\u002Fp>\u003Cp>我會把這個當成 GLM-5 系列最值得抄的地方：不是更會答，而是更會工作。這差很多。\u003C\u002Fp>\u003Ch2>Scale 不是重點，能不能持續迭代才是\u003C\u002Fh2>\u003Cblockquote>\"Compared to GLM-4.5, GLM-5 scales from 355B parameters (32B active) to 744B parameters (40B active), and increases pre-training data from 23T to 28.5T tokens.\"\u003C\u002Fblockquote>\u003Cp>翻譯一下就是：它們把模型做大，也把資料做多，但不是單純堆數字，而是把它放進一個更像系統工程的敘事裡。老實說，我平常看到這種 scale 數字會先翻白眼，因為很多團隊只會拿大數字嚇人，卻不談怎麼把它用在真實工作上。\u003C\u002Fp>\u003Cp>這份 repo 比較不一樣的地方，是它把 scale 跟 post-training、RL infrastructure、長任務能力綁在一起。它還提到 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fzai-org\u002Fslime\">slime\u003C\u002Fa> 這個 asynchronous RL infrastructure，意思很清楚：如果訓練迭代太慢，模型就算能學，也學不快。\u003C\u002Fp>\u003Cp>我自己踩過的坑也很像這樣。不是模型不行，是迭代成本太高。每多跑一輪都要等很久、花很多錢、還很難比較結果，最後團隊就懶得試了。然後大家再一起抱怨模型怎麼沒進步。不是沒進步，是你根本沒讓它有足夠次數進步。\u003C\u002Fp>\u003Cp>實操上，你如果在做自己的模型調整或 agent 改版，請把 iteration cost 當成第一級指標。不是只有 quality。因為一個很難反覆試的流程，通常最後都不會變好。你得讓自己付得起更多輪比較、更多次修正、更多次失敗。\u003C\u002Fp>\u003Cp>這就是我從 GLM-5 讀到的真正訊號：大不是重點，能不能持續改進才是。\u003C\u002Fp>\u003Ch2>可抄的模板\u003C\u002Fh2>\u003Cpre>\u003Ccode># GLM-5-style long-horizon coding agent template（可直接貼進你的 agent \u002F orchestrator \u002F system prompt）\n\n你是一個工程 agent，負責處理多步驟、長時間、會失敗的軟體任務。\n你的目標不是講得像懂了。\n你的目標是把工作做完，而且在 evidence 變動時願意修正。\n\n## 核心原則\n1. 持續保留任務主線，不要每輪都重開一個新故事。\n2. 把 tool output 當 evidence，不要當裝飾。\n3. 如果目前假設被推翻，先改 plan，再繼續做。\n4. 優先做最小可驗證變更，不要一開始就大改。\n5. 每一輪都記錄 blocker、假設、下一步。\n6. 不要重複做同一個失敗動作，除非你能說清楚為什麼這次不一樣。\n\n## Effort 控制\n- `reasoning_effort = max`：用在 baseline 工作、簡單修補、可重現的問題。\n- `reasoning_effort = high`：用在模糊需求、跨檔案 refactor、複雜 debug、長鏈條驗證。\n- `enable_thinking = false`：只用在你要低延遲、低風險、可預期輸出的情境。\n\n## 每輪工作流程\n1. 用一句話重述目標。\n2. 寫下目前假設。\n3. 選最小下一步。\n4. 執行 tool \u002F command \u002F patch。\n5. 讀結果。\n6. 如果 evidence 變了，更新 plan。\n7. 寫下 blocker 或下一步。\n\n## 回傳格式\n- Goal\n- Current hypothesis\n- Actions taken\n- Evidence observed\n- Updated plan\n- Blockers\n- Next step\n\n## 可直接用的 system instruction\n你可以檢查檔案、跑命令、比較輸出、修正計畫。\n不要在 evidence 很弱時裝作很有把握。\n不要優化成只會回一個漂亮答案。\n你要優化的是：在長任務裡正確完成工程工作。\n\n## 可直接用的 controller 設定\n- reasoning_effort: max | high\n- enable_thinking: true | false\n- max_iterations: 視任務而定\n- stop_condition: verified fix \u002F verified explanation \u002F explicit blocker\u003C\u002Fcode>\u003C\u002Fpre>\u003Cp>這段你可以直接拿去改成自己的 agent prompt，或拆成 orchestrator 規則。重點不是文筆，是行為。只要你能把「重述目標、記錄假設、讀 evidence、\u003Ca href=\"\u002Fnews\u002Frust-built-different-update-server-admins-zh\">更新\u003C\u002Fa> plan」這幾件事強制化，agent 就不會那麼容易開始胡扯。\u003C\u002Fp>\u003Cp>我也建議你不要只把它放在 prompt 裡而已。prompt 很脆，controller 才是把行為鎖住的地方。你要的是流程，不是祈禱。GLM-5 這份 repo 最有價值的地方，就是它讓我重新把 agent 想成工程系統，而不是聊天機器人。\u003C\u002Fp>\u003Cp>原始來源：\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fzai-org\u002FGLM-5\">https:\u002F\u002Fgithub.com\u002Fzai-org\u002FGLM-5\u003C\u002Fa>。文中拆解與模板是我根據公開 README 與 repo 結構整理出來的衍生內容，不是官方摘要。\u003C\u002Fp>","我拆 GLM-5 的長程 coding playbook，順手給你一份可直接貼進 agent 的模板。","github.com","https:\u002F\u002Fgithub.com\u002Fzai-org\u002FGLM-5",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781853513619-0z11.png","ai-agent","zh","a882d067-6acb-447d-993e-27a057d19e16",[17,18,19,20,21],"GLM-5","agentic engineering","long-horizon context","coding agents","reasoning effort",[23,24,25],"長上下文不是炫技，是讓 agent 不要太快失憶。","Effort 要可調，才像真的在管思考成本。","真正能抄走的是流程：重述目標、記錄假設、讀 evidence、更新 plan。",0,"2026-06-19T07:18:09.421228+00:00","2026-06-19T07:18:09.411+00:00","e3b68196-9e64-4c18-a3b6-a73e73bfb367",{"tags":31,"relatedLang":34,"relatedPosts":38},[32],{"name":17,"slug":33},"glm-5",{"id":15,"slug":35,"title":36,"language":37},"glm-5-vibe-coding-agentic-engineering-en","GLM-5 turns vibe coding into agentic engineering","en",[39,45,51,57,63,69],{"id":40,"slug":41,"title":42,"cover_image":43,"image_url":43,"created_at":44,"category":13},"61971c57-482e-4e7f-a79b-c3b304239065","kimi-k2-6-turns-agents-into-a-swarm-zh","Kimi K2.6 把 agent 變成群體","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781824691370-pud4.png","2026-06-18T23:17:47.818057+00:00",{"id":46,"slug":47,"title":48,"cover_image":49,"image_url":49,"created_at":50,"category":13},"4a0bdcd2-abcf-48a6-8cbb-38b6df8edf2d","lightrag-simple-defaults-beat-rag-complexity-zh","LightRAG 證明圖譜 RAG 需要更簡單的預設，而不是更複雜","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781812063993-vynr.png","2026-06-18T19:47:20.378166+00:00",{"id":52,"slug":53,"title":54,"cover_image":55,"image_url":55,"created_at":56,"category":13},"b8b8e12b-0e01-4204-bc59-eddef030606d","build-code-aware-rag-pipeline-langchain-zh","建立具程式感知的 RAG 管線","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781811179856-7o5s.png","2026-06-18T19:32:32.253731+00:00",{"id":58,"slug":59,"title":60,"cover_image":61,"image_url":61,"created_at":62,"category":13},"d27aa04b-7cd2-4a94-a7fd-1c1ce6874728","ebay-mcp-ai-assistants-ebay-sell-apis-zh","ebay-mcp 讓 AI 直接操控 eBay Sell API","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781809379605-oslg.png","2026-06-18T19:02:33.226473+00:00",{"id":64,"slug":65,"title":66,"cover_image":67,"image_url":67,"created_at":68,"category":13},"becd8e42-53b8-4250-8989-d3c8f60ea909","github-last30days-skill-ai-research-model-zh","GitHub 的 last30days skill 才是 AI 研究的正確模型","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781752672625-a8f4.png","2026-06-18T03:17:22.68358+00:00",{"id":70,"slug":71,"title":72,"cover_image":73,"image_url":73,"created_at":74,"category":13},"1459a665-b180-487b-b15b-65c046c6392c","tcs-anthropic-enterprise-ai-partnership-zh","TCS 和 Anthropic 企業 AI 合作成形","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781713081888-ob2e.png","2026-06-17T16:17:35.294583+00:00",[76,81,86,91,96,101,106,111,116,121],{"id":77,"slug":78,"title":79,"created_at":80},"4ae1e197-1d3d-4233-8733-eafe9cb6438b","claude-now-uses-your-pc-to-finish-tasks-zh","Claude 開始幫你操作電腦","2026-03-26T07:20:48.457387+00:00",{"id":82,"slug":83,"title":84,"created_at":85},"5bede67f-e21c-413d-9ab8-54a3c3d26227","googles-2026-ai-agent-report-decoded-zh","Google 2026 AI Agent 報告解讀","2026-03-26T11:15:22.651956+00:00",{"id":87,"slug":88,"title":89,"created_at":90},"2987d097-563f-46c7-b76f-b558d8ef7c2b","kimi-k25-review-stronger-still-not-legend-zh","Kimi K2.5 評測：更強，但還不是神作","2026-03-27T07:15:55.277513+00:00",{"id":92,"slug":93,"title":94,"created_at":95},"95c9053b-e3f4-4cb5-aace-5c54f4c9e044","claude-code-controls-mac-desktop-zh","Claude Code 也能操控 Mac 了","2026-03-28T03:01:58.58121+00:00",{"id":97,"slug":98,"title":99,"created_at":100},"dc58e153-e3a8-4c06-9b96-1aa64eabbf5f","cloudflare-100x-faster-ai-agent-sandbox-zh","Cloudflare 的 AI 沙箱跑超快","2026-03-28T03:09:44.142236+00:00",{"id":102,"slug":103,"title":104,"created_at":105},"1c8afc56-253f-47a2-979f-1065ff072f2a","openai-backs-isara-agent-swarm-bet-zh","OpenAI 挺 Isara 的 agent swarm …","2026-03-28T03:15:27.513155+00:00",{"id":107,"slug":108,"title":109,"created_at":110},"7379b422-576e-45df-ad5a-d57a0d9dd467","openai-plan-automated-ai-researcher-zh","OpenAI 想做自動化 AI 研究員","2026-03-28T03:17:42.090548+00:00",{"id":112,"slug":113,"title":114,"created_at":115},"48c9889e-86df-450b-a356-e4a4b7c83c5b","harness-engineering-ai-agent-reliability-2026-zh","駕馭工程：從「馬具」到「作業系統」，AI Agent 可靠性的終極密碼","2026-03-31T06:42:53.556721+00:00",{"id":117,"slug":118,"title":119,"created_at":120},"96d8e8c8-1edd-475d-9145-b1e7a1b02b65","mcp-explained-from-prompts-to-production-zh","MCP 怎麼把提示詞變工作流","2026-04-01T09:24:39.321274+00:00",{"id":122,"slug":123,"title":124,"created_at":125},"f2ca7720-b471-4ce5-9336-2a9ac2a876fd","amazon-bedrock-agents-multi-agent-workflows-zh","Amazon Bedrock Agents 進入多代理工作流","2026-04-01T09:30:29.945429+00:00"]