[IND] 5 分鐘閱讀OraCore 編輯部

5 個值得追蹤的 AI agent 論文主題

5 個主題把 AI agent 論文分成 harness、skills、survey、architecture、applications,適合快速決定先讀哪一類。

分享 LinkedIn
5 個值得追蹤的 AI agent 論文主題

這份整理把 AI agent 論文分成 5 類,讓你快速決定先讀哪個主題。

這個由 GitHub 收錄的論文清單以主題分桶、每兩週更新一次,目前有 1,494 顆星。若你想在不追完整個 arXiv 的情況下,先判斷該從 planning、skills、harness、survey 還是應用切入,這份清單會直接縮小閱讀範圍。

項目關注重點典型訊號
Harness代理執行時的 runtime 結構安全、搜尋、工作流
Skills可重複使用的能力模組技能生成、治理、評估
Survey領域總覽分類法、趨勢、基準
Architecture代理系統如何組織單代理、多代理、agent-ops
Applications代理實際落地場景Web、軟體、資料、研究

1. Harness 論文:先看執行層

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

如果你在意代理怎麼真的跑起來,harness 區塊是最好的起點。它收的是執行底座、安全檢查、搜尋行為與架構模式,重點不是提示詞,而是系統在真實流程中的運作方式。

5 個值得追蹤的 AI agent 論文主題

這一類特別適合做 agent ops、評估或安全設計的人。像 AI Harness Engineering: A Runtime Substrate for Foundation-Model Software AgentsIs Grep All You Need? How Agent Harnesses Reshape Agentic SearchHarness-Bench: Measuring Harness Effects across Models in Realistic Agent Workflows 都是在回答同一件事:代理的外層結構會怎麼改變結果。

  • 看的是執行與控制,不只是 prompting
  • 適合做 production、eval、safety
  • 常和 benchmark、survey 一起出現

2. Skills 論文:看可重用能力怎麼長出來

如果你想知道代理能反覆學會什麼,skills 區塊最有操作性。這裡聚焦技能生成、選擇、治理與自我演化,適合把 agent 視為可組裝系統的人。

SkillOS: Learning Skill Curation for Self-Evolving AgentsSkillsVote: Lifecycle Governance of Agent Skills from Collection, Recommendation to EvolutionSkillGrad: Optimizing Agent Skills Like Gradient Descent 這些題目,會把技能當成可管理、可評估、可更新的模組來看。

你會在這一區看到的關鍵字: - skill generation - skill memory and management - least-privilege enforcement - skill evaluation - self-evolving skill systems

3. Survey 論文:先建立地圖再深入

survey 區塊是最快掌握研究走向的方法。它不押單一方法,而是整理分類、技術路線與未解問題,適合在你還沒決定要鑽哪個子題前先看。

5 個值得追蹤的 AI agent 論文主題

A Comprehensive Survey on Agent Skills: Taxonomy, Techniques, and ApplicationsGenerate, Filter, Control, Replay: A Comprehensive Survey of Rollout Strategies for LLM Reinforcement Learning 都很符合這個資料庫的風格。它也會延伸到協作、失敗歸因、自我評估等相關工作,適合拿來做文獻綜述的第一層篩選。

  • 適合 literature review 和簡報整理
  • 幫你找出值得深讀的子領域
  • 搭配 benchmark 類論文最有效

4. Architecture 論文:決定系統長相

architecture 區塊把論文按單代理、多代理與 agent-ops 模式整理。這對正在設計產品的人很實用,因為這裡談的不只是模型能力,而是系統怎麼被組成。

當你要比較協作方式、分工結構或營運流程時,這一區最有幫助。它也方便你從大方向一路跳到更具體的場景,例如數位代理、企業代理或特定工作流。

  • 單代理適合聚焦任務
  • 多代理適合協作與分工
  • agent-ops 和 UX 會影響上線方式

5. Applications 論文:直接對準使用場景

applications 區塊是這份 repo 最貼近實作的一段。它把論文分到 embodied、web、mobile、software、data、research、API、deep research、enterprise、finance 等場景,讀者可以直接挑自己要做的環境。

如果你在做瀏覽器代理、寫作助手、程式助理或研究 copilot,這裡能最快縮短清單。你不用先看抽象理論再回頭找案例,而是直接從場景出發反推需要的能力。

常見的應用群組: - Web agents - GUI agents - Software agents - Research agents - Enterprise agents

怎麼挑

如果你在意執行與安全,先看 harness;如果你要的是可重用能力,先看 skills;如果你還在找方向,先讀 survey;如果你已經要做產品,就從 architecture 或 applications 下手。多數讀者最有效的順序是先 survey,再 harness 或 skills,最後進到對應場景。

這份 repo 每兩週更新一次,比起一次性的整理,更像會持續長大的閱讀地圖。