Anthropic推10款金融AI Agent
Anthropic推出10款金融預建AI Agent,並發表Claude Opus 4.7。這次重點不是聊天,而是把研究、合規、檢索等金融流程直接產品化。

Anthropic 推出 10 款金融預建 AI Agent,並同步發表 Claude Opus 4.7,重點放在金融工作流落地。
5 月 5 日,Anthropic 在紐約辦了一場邀請制簡報會。主題很直白,就是金融業怎麼把 LLM 接進真實流程。不是做一個會聊天的 Bot。是做能跑流程的工具。
這次最有意思的地方,在於它把金融場景拆得很細。研究、合規、客服、文件處理,都被包成可直接試用的 Agent。說真的,這比空講模型強多了。
| 項目 | 數值 | 意義 |
|---|---|---|
| 金融 AI Agent 數量 | 10 款 | 覆蓋多個金融工作流 |
| 活動日期 | 5 月 5 日 | 紐約邀請制簡報會 |
| Vals AI Finance Agent 分數 | 64.37% | Claude Opus 4.7 的金融任務表現 |
這次賣的不是模型,是流程
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
金融機構買 AI,最在意的不是會不會講幹話。它們在意的是,能不能接現有系統,能不能留審計紀錄,能不能處理長文件。這些需求很現實,也很麻煩。

Claude Opus 4.7 和這 10 款 Agent 放在一起看,Anthropic 想賣的是工作流套件。講白了,就是把常見任務先標準化。客戶再依權限、資料和法規去調整。
這種打法很像企業軟體。它不追求什麼都能做。它追求的是,能先把 80% 的重複工作吃掉。剩下 20%,再交給人做判斷。
- 更適合銀行、券商、資管、研究、合規團隊
- 常見任務包括文件處理、摘要整理、內部檢索
- 交付形式從單一 API,變成可重用 Agent 套件
- 重點不是聊天,而是可控流程
64.37% 代表什麼
Anthropic 提到,Vals AI 的 Finance Agent 基準裡,Claude Opus 4.7 拿到 64.37%。這不是終局答案,但它有參考價值。
金融基準通常比一般問答難很多。它會考長上下文、格式限制、事實一致性,還有多步驟推理。模型如果只會講得像樣,分數通常不會漂亮。
64.37% 代表它已經不是只會聊天的模型了。它開始能在受限制任務裡,做出比較穩的結果。對金融業來說,這比華麗文案有用多了。
“Claude 3.5 Sonnet is the best model in the world for coding.” — Dario Amodei, Anthropic CEO
這句話來自 Dario Amodei。雖然講的是 coding,但邏輯很一致。Anthropic 一直在抓高價值、強約束、重穩定的任務。
金融 Agent 也是同一套路。先把最容易量化、最容易驗證的場景做深。再往更複雜的業務推。這種路線很務實,我覺得比喊口號有料。
和其他廠商比,差在哪
如果把這次發布放進整個 AI 戰場,OpenAI、Google Gemini 和 Anthropic 的路線差很明顯。前兩者更像在推通用能力。Anthropic 則更像在做企業工具包。

這會直接影響採購。金融客戶通常不想買一個什麼都能聊一點的東西。它們要的是能接權限系統、能做紀錄、能反覆執行固定任務的工具。能進生產環境,比 demo 漂亮重要太多。
這也是為什麼這次比較像企業軟體發表會。真正的問題不是模型參數多大,而是法務、風控、IT 能不能一起點頭。
- OpenAI 偏通用助手和開發者生態
- Google Gemini 偏多模態和搜尋整合
- Anthropic 這次更像在賣金融任務包
金融 Agent 先從哪裡落地
短期最容易落地的,通常是研究輔助、文件問答、內部知識檢索、客服支援。這幾類任務邊界清楚,錯了也能人工校正。
更難的是交易、授信、合規判斷。這些地方不是模型會不會答,而是答案能不能被審計、能不能被重複驗證。金融業在這裡很保守,這很合理。
所以預建 Agent 的價值,不只是省開發時間。它也在省整合成本、合規成本、溝通成本。對很多團隊來說,這三個成本才是真正的大頭。
這波對台灣開發者的意思
如果你在做金融軟體、內部知識庫,或 RAG 系統,這波很值得看。因為它告訴你一件事:客戶已經不只想買模型 API 了。客戶想買的是能直接上線的流程。
對台灣團隊來說,最實際的切入點可能是文件處理、法遵摘要、客服分流、研究整理。這些場景資料結構清楚,也比較容易做評測。先做出可量化結果,再談更大範圍導入,會比較穩。
我自己的判斷很簡單。接下來一年,金融 AI 的競爭重點,會從「誰模型更會講」轉成「誰更懂企業流程」。如果你是工程師,現在就該開始看權限、稽核、資料流這些老問題了。這些才是真正難的地方。