Fable 停用逼你把模型收回來

OraCore Editors

返回首頁

[IND] 2026年6月17日11 分鐘閱讀OraCore 編輯部

Fable 停用逼你把模型收回來

Anthropic 停用 Fable 後，我拆出團隊該怎麼把模型依賴從供應商手上收回來，並附可直接複製的審查模板。

open-source AI

分享 LinkedIn

Anthropic 停用 Fable 後，我拆出團隊該怎麼把模型依賴從供應商手上收回來，並附可直接複製的審查模板。

我這陣子一直在看大家怎麼把 hosted model 接進產品，老實說，前面都很順。串 API、調 prompt、跑 eval，數字也還看得過去。可我心裡一直卡一個點：你做得越像樣，就越像把核心能力交給別人保管。平常沒事時這叫效率；一旦供應商改規則、改價格、改可用區域，這就不是效率了，這叫被人掐住脖子。我最不爽的就是，很多團隊直到出事才發現自己根本沒留退路。

這次 Anthropic 的 Fable 停用把這件事直接攤開來看。它不是單純的產品下架，而是讓大家重新面對一個很土但很真實的問題：你到底是在用模型，還是在租模型？我讀這件事時主要對照 CNBC 的報導，還有 Anthropic 的官方網站、Satya Nadella 的 X，以及 OpenRouter 的使用趨勢。真正值得拆的，不是戲劇性，而是下一步架構要怎麼改。

模型會消失，產品就只是租來的

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

Anthropic announced it had pulled access to its Fable 5 and Mythos 5 models to comply with an export control directive from the U.S. government that cited “national security authorities.”

翻譯一下就是：如果你的產品建立在封閉模型上，你的產品命運其實握在別人政策手上。不是只有 uptime，不是只有帳單，連能不能繼續用都不是你說了算。這種依賴最煩的地方在於，它平常不會炸給你看。你的服務照跑、前端照開、監控全綠，直到某個關鍵能力突然不見，整個流程才像被拔掉一塊骨頭。

CNBC 的敘述很直接，Anthropic 是直接把 Fable 5 和 Mythos 5 的存取關掉，其他模型還在。這個細節很重要，因為它告訴我風險不是「整個 vendor 掛掉」，而是「你最依賴的那一塊被單獨切掉」。這種情況在架構審查時最容易被忽略，因為系統表面上還活著，只有某條關鍵路徑在默默失血。

我自己碰過類似的事。之前有個客服摘要流程，模型換檔後沒有真的停機，但定價變了，成本模型整個歪掉。功能還在，可是商業上已經不好用了。這就是我現在最在意的點：依賴不只是技術問題，還是合約問題、成本問題、甚至風險問題。

實操寫法很簡單，先不要談優化，先做依賴盤點：

把每一次 model call 對應到哪個業務流程寫出來。
標記哪些流程一旦模型被停用就會壞掉。
把「好用」和「核心」分開，不要混成一團。

如果模型一斷，你的營收就停，那你需要的是備援，不是更漂亮的 prompt。

開源不是信仰，是退出門

An open-source model can be downloaded, run on a company’s own infrastructure, and customized for its data and needs.

也就是說，開源模型真正有價值的地方，不是情懷，是你有地方可退。你可以把模型放進自己的環境，自己控權限、自己控版本、自己控部署節奏。這不是要你一開始就全自建，而是你至少要有一條離開供應商的路。沒有這條路，所謂的技術選型其實只是把風險包裝得比較好看。

我不會把 open source 講成神主牌。自己跑模型一定有代價：infra、維運、監控、升級、效能調校，通通都要錢。可問題是，很多團隊把「我們之後再換」當成策略，結果真的要換時，prompt 已經漂了、eval 已經陳舊了、工具呼叫也綁死了。那時候才是最貴的。

這次事件讓我更確定一件事：如果 AI 功能碰到敏感資料、客戶流程、或是公司會拿來算錢的核心邏輯，就不能只看 hosted 版本。你至少要有一個 self-hostable 候選方案，先能跑，再談好不好看。

我會這樣落地：

挑一個你能自己部署的模型家族，不要只看榜單。
同一個工作流，hosted 和 self-hosted 都跑一次。
比較品質差多少、成本差多少、控制權差多少。

你會發現，當風險夠大時，控制權本身就是一種性能指標。

真正的 lock-in 不是 API，是習慣

“The last thing any of us want is a world where every company across every sector is ceding value to a few models that eat everything they see,” Satya Nadella wrote on X.

這句話有點誇張，但我懂他在講什麼。大家以為 lock-in 是 API key 或合約條款，其實更可怕的是團隊開始習慣某個模型的脾氣。prompt 會跟著它調，guardrail 會跟著它調，產品邏輯也會跟著它調。最後不是你綁住模型，是模型綁住你的設計方式。

翻譯一下就是，切換成本很多時候不是技術成本，而是心理成本。團隊會開始問：「怎麼改最不會壞？」而不是「哪個模型最適合這件事？」這差很多。前者是在維持現狀，後者才是在做選型。

我在 agent workflow 上看過這種黏性特別重。你一旦把工具呼叫、輸出格式、錯誤重試都調成某個模型的習慣，換 vendor 就不是換 endpoint 而已，是整個行為邊界要重做。這也是為什麼我現在更偏向把模型差異收斂在 adapter，而不是讓整個產品直接吃 vendor 的脾氣。

實際上可以這樣做：

把 prompt、tool schema、輸出格式都版本化。
把模型特有的邏輯包進 adapter，不要散在各處。
不要讓整個產品都依賴同一個供應商的怪癖。

如果你能換模型而不用重寫 app，才算真的有選擇權。

便宜不是省錢，是把模型分層

“The era of token maxing is over,” Yash Patel said.

這句我聽了直接笑出來，因為它很粗，但也很準。意思很簡單：大家不想再為每一個 token 都付高價了，尤其是那些其實不需要頂級模型的工作。市場成熟之後，預算會逼著你誠實面對一件事：不是每個步驟都值得用最貴的模型。

CNBC 裡提到的重點是，企業現在在找 better, cheaper, faster models。這不是採購部門在碎念，這會直接改架構。你一旦接受「不是所有任務都要最強模型」，就可以把工作流拆層：便宜模型做分類、中階模型做草稿、昂貴模型只處理真正難的推理。

我自己重構過幾次這種系統。第一版通常很浪費，因為大家怕出錯，乾脆全部丟給最強模型。等帳單來了，大家又突然很懂 routing。這種劇本我看太多次了。

可以直接這樣做：

先做 task router，再談擴量。
高頻、低風險步驟用小模型或開源模型。
把昂貴模型保留給真正卡關的部分。

如果你的架構不能在成本上優雅降級，那它不是 production-ready，它只是 demo 長得比較像真的。

中國開源模型受歡迎，不是偶然

Models from DeepSeek, Tencent, Xiaomi, and MiniMax all rank among OpenRouter’s most-used this month, even against closed competitors.

這段很值得台灣團隊注意。CNBC 提到，投資人押注這次停用事件會把需求推向 open models，而 DeepSeek、Tencent、Xiaomi、MiniMax 這些名字也真的在使用榜上往前。這不是口號，這是使用者行為。人最後還是會選好用、可得、便宜的東西，不太會因為品牌故事就一直死撐。

翻成工程語言就是：如果模型夠好、夠便宜、夠容易跑，團隊就會用。你可以嘴上說自己偏好某家大廠，但真正在 work queue 裡被呼叫的，通常是那個最順手、最能交差的方案。這跟基礎設施工具一樣，最後贏的常常不是最會講故事的，而是最少讓你加班的。

我會建議團隊把這件事當成選型而不是立場。不要先問「哪個陣營比較對」，先問「哪個模型在我們自己的資料和任務上過關」。OpenRouter 這類平台的價值就在這裡，它反映的是實際呼叫行為，不是誰在社群上喊得最大聲。

落地方式：

建立一份自己的 benchmark 集合，不要只看公開榜單。
把多語言、多模態、領域任務分開測。
模型沒打過你的 eval 之前，別先下結論。

最強的模型不是聲量最大那個，是最符合你工作負載那個。

我會先問退出策略，不先問 prompt

如果是我在看一個 AI stack，我現在第一個問題不會是 prompt 寫得漂不漂亮，而是：你怎麼退出？這個問題很土，但很有效。因為你只要開始問退出策略，整個團隊的思考就會從「怎麼把模型用滿」轉成「怎麼不要被模型綁死」。

這代表架構要先設計可攜性。模型最好放在內部介面後面，prompt 和 eval 進版控，provider-specific 的東西全部收斂到 adapter。再來就是至少保留一個可 self-host 的候選模型，哪怕一開始不是主力，也要能在緊急時接手。

我也會把對外承諾講清楚：我們不把任何外部模型當成單點故障。這句話聽起來像內控文件，但其實很實用。因為它逼你去做 fallback、做測試、做切換演練，而不是把風險藏在簡報裡。

我會用這份檢查表：

我們能不能在自己的 infra 上跑 fallback 模型？
換供應商時，產品要改多少 code？
哪些 workflow 最怕政策、區域、價格變動？
我們有沒有同時比較 hosted、open、self-hosted 的 eval？

如果大多數答案都是否，那這個 stack 其實比看起來脆很多。

可抄的模板

# AI 模型依賴審查模板（可直接貼進 Notion / GitHub / Confluence）

## 1) 模型清單
- Provider:
- Model name:
- 用途:
- 資料敏感度:
- 業務重要性:
- Fallback model:
- 是否可 self-host: yes/no

## 2) 風險盤點
- 如果存取被撤銷，哪些流程會壞？
- 如果價格翻倍，哪些流程會先爆？
- 如果模型行為改變，哪些輸出會失真？
- 哪些地區 / 政策會影響可用性？

## 3) 架構規則
- 模型必須放在內部介面後面。
- prompt 必須進版控。
- tool schema 必須版本化。
- provider-specific 邏輯只能放在 adapter。
- 高頻低風險任務優先走便宜模型。
- 真正困難的任務才用高價模型。

## 4) 評估計畫
- Hosted benchmark:
- Open benchmark:
- Self-hosted benchmark:
- Accuracy target:
- Latency target:
- Cost target:
- 要監控的失敗類型:

## 5) 退出策略
- Primary provider:
- Backup provider:
- Self-hosted deployment plan:
- Model replacement RTO:
- Prompt / eval artifacts RPO:
- Owner:

## 6) 決策
- 保持 hosted:
- 增加 fallback:
- 轉向 open / self-hosted:
- 下次重評日期:

## 7) 可直接貼到團隊規範
我們不把任何外部模型當成單點故障。
每個 production AI workflow 都必須有文件化 fallback。
任何使用敏感或 mission-critical 資料的 workflow，都必須有 self-hostable 路徑，或經過明確例外核准。

這份模板的價值不是叫你反供應商，而是叫你少一點驚嚇。你可以拿它去做架構審查、採購審查、甚至 incident postmortem。它會把原本很空泛的「我們應該更有韌性」變成可以逐條回答的清單。

我這篇的拆解主要是從 CNBC 的 Anthropic’s Fable shutdown is a big moment for open-source AI 來的，外加我自己對模型依賴、架構切分與 fallback 設計的整理。原始事實、引述與人物名稱來自來源文章；模板、判讀方式和實操建議是我另外整理出來的。

// 相關文章

Fable 停用逼你把模型收回來

模型會消失，產品就只是租來的

訂閱 AI 趨勢週報

開源不是信仰，是退出門

真正的 lock-in 不是 API，是習慣

便宜不是省錢，是把模型分層

中國開源模型受歡迎，不是偶然

我會先問退出策略，不先問 prompt

可抄的模板

OpenAI 進 Oracle 企業採購圈

4 層規範決定企業版 ChatGPT 可怎麼用

OpenAI 服務條款把第三方 App 風險留給使用者

DARA把智庫 AI 透明化

Chrome V8 零日要立刻重啟瀏覽器

WASI 0.3 正式版讓 WebAssembly 協作更順