OraCore
.dev
新聞
趨勢
比較
排行
學習
Claude Code
更多
EN
更多
EN
新聞
趨勢
比較
排行
學習
Claude Code
返回首頁
標籤
AI coding agent
1 篇文章
AI Agent
/
4月3日
我測了 Devin 10 個任務,只做完 3 個
Devin 在 SWE-bench 只拿 13.86%,實測 10 個真實任務也只完成 3 個。這篇拆解它在哪些工作能用、哪些地方會亂掉。