[MODEL] 4 分鐘閱讀OraCore 編輯部

Anthropic推10款金融AI Agent

Anthropic推出10款金融預建AI Agent,並發表Claude Opus 4.7。這次重點不是聊天,而是把研究、合規、檢索等金融流程直接產品化。

分享 LinkedIn
Anthropic推10款金融AI Agent

Anthropic 推出 10 款金融預建 AI Agent,並同步發表 Claude Opus 4.7,重點放在金融工作流落地。

5 月 5 日,Anthropic 在紐約辦了一場邀請制簡報會。主題很直白,就是金融業怎麼把 LLM 接進真實流程。不是做一個會聊天的 Bot。是做能跑流程的工具。

這次最有意思的地方,在於它把金融場景拆得很細。研究、合規、客服、文件處理,都被包成可直接試用的 Agent。說真的,這比空講模型強多了。

項目數值意義
金融 AI Agent 數量10 款覆蓋多個金融工作流
活動日期5 月 5 日紐約邀請制簡報會
Vals AI Finance Agent 分數64.37%Claude Opus 4.7 的金融任務表現

這次賣的不是模型,是流程

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

金融機構買 AI,最在意的不是會不會講幹話。它們在意的是,能不能接現有系統,能不能留審計紀錄,能不能處理長文件。這些需求很現實,也很麻煩。

Anthropic推10款金融AI Agent

Claude Opus 4.7 和這 10 款 Agent 放在一起看,Anthropic 想賣的是工作流套件。講白了,就是把常見任務先標準化。客戶再依權限、資料和法規去調整。

這種打法很像企業軟體。它不追求什麼都能做。它追求的是,能先把 80% 的重複工作吃掉。剩下 20%,再交給人做判斷。

  • 更適合銀行、券商、資管、研究、合規團隊
  • 常見任務包括文件處理、摘要整理、內部檢索
  • 交付形式從單一 API,變成可重用 Agent 套件
  • 重點不是聊天,而是可控流程

64.37% 代表什麼

Anthropic 提到,Vals AI 的 Finance Agent 基準裡,Claude Opus 4.7 拿到 64.37%。這不是終局答案,但它有參考價值。

金融基準通常比一般問答難很多。它會考長上下文、格式限制、事實一致性,還有多步驟推理。模型如果只會講得像樣,分數通常不會漂亮。

64.37% 代表它已經不是只會聊天的模型了。它開始能在受限制任務裡,做出比較穩的結果。對金融業來說,這比華麗文案有用多了。

“Claude 3.5 Sonnet is the best model in the world for coding.” — Dario Amodei, Anthropic CEO

這句話來自 Dario Amodei。雖然講的是 coding,但邏輯很一致。Anthropic 一直在抓高價值、強約束、重穩定的任務。

金融 Agent 也是同一套路。先把最容易量化、最容易驗證的場景做深。再往更複雜的業務推。這種路線很務實,我覺得比喊口號有料。

和其他廠商比,差在哪

如果把這次發布放進整個 AI 戰場,OpenAIGoogle Gemini 和 Anthropic 的路線差很明顯。前兩者更像在推通用能力。Anthropic 則更像在做企業工具包。

Anthropic推10款金融AI Agent

這會直接影響採購。金融客戶通常不想買一個什麼都能聊一點的東西。它們要的是能接權限系統、能做紀錄、能反覆執行固定任務的工具。能進生產環境,比 demo 漂亮重要太多。

這也是為什麼這次比較像企業軟體發表會。真正的問題不是模型參數多大,而是法務、風控、IT 能不能一起點頭。

金融 Agent 先從哪裡落地

短期最容易落地的,通常是研究輔助、文件問答、內部知識檢索、客服支援。這幾類任務邊界清楚,錯了也能人工校正。

更難的是交易、授信、合規判斷。這些地方不是模型會不會答,而是答案能不能被審計、能不能被重複驗證。金融業在這裡很保守,這很合理。

所以預建 Agent 的價值,不只是省開發時間。它也在省整合成本、合規成本、溝通成本。對很多團隊來說,這三個成本才是真正的大頭。

這波對台灣開發者的意思

如果你在做金融軟體、內部知識庫,或 RAG 系統,這波很值得看。因為它告訴你一件事:客戶已經不只想買模型 API 了。客戶想買的是能直接上線的流程。

對台灣團隊來說,最實際的切入點可能是文件處理、法遵摘要、客服分流、研究整理。這些場景資料結構清楚,也比較容易做評測。先做出可量化結果,再談更大範圍導入,會比較穩。

我自己的判斷很簡單。接下來一年,金融 AI 的競爭重點,會從「誰模型更會講」轉成「誰更懂企業流程」。如果你是工程師,現在就該開始看權限、稽核、資料流這些老問題了。這些才是真正難的地方。