5 個值得追蹤的 AI agent 論文主題

OraCore Editors

返回首頁

[IND] 2026年6月18日5 分鐘閱讀OraCore 編輯部

5 個值得追蹤的 AI agent 論文主題

5 個主題把 AI agent 論文分成 harness、skills、survey、architecture、applications，適合快速決定先讀哪一類。

AI agent skills

分享 LinkedIn

這份整理把 AI agent 論文分成 5 類，讓你快速決定先讀哪個主題。

這個由 GitHub 收錄的論文清單以主題分桶、每兩週更新一次，目前有 1,494 顆星。若你想在不追完整個 arXiv 的情況下，先判斷該從 planning、skills、harness、survey 還是應用切入，這份清單會直接縮小閱讀範圍。

項目	關注重點	典型訊號
Harness	代理執行時的 runtime 結構	安全、搜尋、工作流
Skills	可重複使用的能力模組	技能生成、治理、評估
Survey	領域總覽	分類法、趨勢、基準
Architecture	代理系統如何組織	單代理、多代理、agent-ops
Applications	代理實際落地場景	Web、軟體、資料、研究

1. Harness 論文：先看執行層

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

如果你在意代理怎麼真的跑起來，harness 區塊是最好的起點。它收的是執行底座、安全檢查、搜尋行為與架構模式，重點不是提示詞，而是系統在真實流程中的運作方式。

這一類特別適合做 agent ops、評估或安全設計的人。像 AI Harness Engineering: A Runtime Substrate for Foundation-Model Software Agents、Is Grep All You Need? How Agent Harnesses Reshape Agentic Search、Harness-Bench: Measuring Harness Effects across Models in Realistic Agent Workflows 都是在回答同一件事：代理的外層結構會怎麼改變結果。

看的是執行與控制，不只是 prompting
適合做 production、eval、safety
常和 benchmark、survey 一起出現

2. Skills 論文：看可重用能力怎麼長出來

如果你想知道代理能反覆學會什麼，skills 區塊最有操作性。這裡聚焦技能生成、選擇、治理與自我演化，適合把 agent 視為可組裝系統的人。

像 SkillOS: Learning Skill Curation for Self-Evolving Agents、SkillsVote: Lifecycle Governance of Agent Skills from Collection, Recommendation to Evolution、SkillGrad: Optimizing Agent Skills Like Gradient Descent 這些題目，會把技能當成可管理、可評估、可更新的模組來看。

你會在這一區看到的關鍵字：
- skill generation
- skill memory and management
- least-privilege enforcement
- skill evaluation
- self-evolving skill systems

3. Survey 論文：先建立地圖再深入

survey 區塊是最快掌握研究走向的方法。它不押單一方法，而是整理分類、技術路線與未解問題，適合在你還沒決定要鑽哪個子題前先看。

像 A Comprehensive Survey on Agent Skills: Taxonomy, Techniques, and Applications、Generate, Filter, Control, Replay: A Comprehensive Survey of Rollout Strategies for LLM Reinforcement Learning 都很符合這個資料庫的風格。它也會延伸到協作、失敗歸因、自我評估等相關工作，適合拿來做文獻綜述的第一層篩選。

適合 literature review 和簡報整理
幫你找出值得深讀的子領域
搭配 benchmark 類論文最有效

4. Architecture 論文：決定系統長相

architecture 區塊把論文按單代理、多代理與 agent-ops 模式整理。這對正在設計產品的人很實用，因為這裡談的不只是模型能力，而是系統怎麼被組成。

當你要比較協作方式、分工結構或營運流程時，這一區最有幫助。它也方便你從大方向一路跳到更具體的場景，例如數位代理、企業代理或特定工作流。

單代理適合聚焦任務
多代理適合協作與分工
agent-ops 和 UX 會影響上線方式

5. Applications 論文：直接對準使用場景

applications 區塊是這份 repo 最貼近實作的一段。它把論文分到 embodied、web、mobile、software、data、research、API、deep research、enterprise、finance 等場景，讀者可以直接挑自己要做的環境。

如果你在做瀏覽器代理、寫作助手、程式助理或研究 copilot，這裡能最快縮短清單。你不用先看抽象理論再回頭找案例，而是直接從場景出發反推需要的能力。

常見的應用群組：
- Web agents
- GUI agents
- Software agents
- Research agents
- Enterprise agents

怎麼挑

如果你在意執行與安全，先看 harness；如果你要的是可重用能力，先看 skills；如果你還在找方向，先讀 survey；如果你已經要做產品，就從 architecture 或 applications 下手。多數讀者最有效的順序是先 survey，再 harness 或 skills，最後進到對應場景。

這份 repo 每兩週更新一次，比起一次性的整理，更像會持續長大的閱讀地圖。

// 相關文章

5 個值得追蹤的 AI agent 論文主題

1. Harness 論文：先看執行層

訂閱 AI 趨勢週報

2. Skills 論文：看可重用能力怎麼長出來

3. Survey 論文：先建立地圖再深入

4. Architecture 論文：決定系統長相

5. Applications 論文：直接對準使用場景

怎麼挑

90 分鐘下線把 AI 變成事故演練

GPT-5.6 可能先修再升級，5 個變化先看

Anthropic 付費 AI 落地路徑

GitHub 熱門倉庫都在做 AI agent 工具

Anthropic Fable 露出 AI 會鑽漏洞

OpenAI 的合作夥伴網路不是 Logo 計畫，而是交付策略