Copilot Studio 預設改用 GPT-4.1
Microsoft 將 Copilot Studio 的生成式編排預設模型改成 GPT-4.1,GPT-4o 會在 2025 年 10 月底退場,企業要儘快測試相容性。

Microsoft 將 Copilot Studio 的生成式編排預設模型改成 GPT-4.1,GPT-4o 會在 2025 年 10 月底退場。
講白了,這不是小改版。它會直接影響 agent 怎麼規劃、怎麼選工具、怎麼回話。對做客服、內部助理、流程自動化的人來說,這種預設值一換,測試清單就得重跑。
而且 Microsoft 還留了一段緩衝期。你可以暫時開啟保留舊模型的選項,撐到 2025 年 11 月 26 日。只是拖越久,最後要處理的相容性問題就越集中。
| 項目 | Microsoft 說法 | 日期/狀態 |
|---|---|---|
| GPT-4o 退場 | 從生成式編排移除 | 2025/10/27–10/31 |
| 預設模型 | GPT-4.1 | 已成預設 |
| 舊模型緩衝期 | 可用「Continue using retired models」 | 到 2025/11/26 |
| GCC 例外 | GPT-4o 繼續可用 | 持續中 |
Copilot Studio 到底改了什麼
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
這次變動的核心很直接。只要你的 agent 用的是 Microsoft Copilot Studio 的生成式編排,GPT-4o 就會逐步被移除,GPT-4.1 變成新預設。Microsoft 也明講,GPT-4.1 在效能、穩定性、一致性上更好。

生成式編排不是單純換一句 prompt。它是 agent 的決策層。它會影響模型怎麼拆解任務、怎麼挑工具、怎麼接續上下文。你改的是底層行為,不是表面文字。
這也是為什麼很多團隊會踩雷。你以為只是模型版本升級,結果客服話術、工具呼叫順序、甚至拒答風格都變了。對使用者來說,差一點點,營運端就可能差很多。
- GPT-4o 退場窗口:2025/10/27–10/31
- 保留舊模型到:2025/11/26
- 新預設模型:GPT-4.1
- GCC 客戶仍可用 GPT-4o
Microsoft 還保留了一個過渡選項。只要啟用 Continue using retired models,GPT-4o 就能再撐一段時間。這對還沒做回歸測試的團隊很重要,但它不是長期解法。
我覺得這種設計很像在提醒你:別把模型當固定零件。今天是 GPT-4o,明天可能又換別的版本。你如果沒做版本驗證,最後就是靠運氣上線。
“GPT-4.1 delivers improved performance, reliability, and consistency across experiences.” — Microsoft Learn, Copilot Studio update page
為什麼 Microsoft 要換成 GPT-4.1
先講最現實的。企業平台最怕不穩。當你的產品要服務大量 agent,預設模型就不能只看單次答案品質,還要看 latency、工具呼叫成功率、輸出一致性。
GPT-4.1 變成預設,表示 Microsoft 想把平台行為收斂得更一致。這對大企業很重要,因為很多 agent 不是 demo。它們真的會碰客訴、工單、報表、內部流程,出錯就是成本。
另一個原因是治理。Microsoft 在 release notes 裡一直強調區域、環境、GCC 這些字眼。這代表模型選擇早就不是單純的技術題,而是合規題。資料在哪裡跑,誰能存取,這些都要交代清楚。
- 企業在意的是穩定,不是只看單次輸出
- GPT-4.1 比較適合做預設編排層
- GCC 與地區限制,反映合規壓力
- 模型選擇已經變成治理問題
Microsoft 這幾個月的節奏也很明顯。它不是只換模型,還在加 agent evaluations、版本比較、分析工具、語音功能。整體方向就是讓開發者更容易測,也更難偷懶。
說真的,這很像把「你自己看著辦」改成「你最好真的有測過」。對做產品的人來說,這才是重點。
這次更新和其他模型選項怎麼比
Copilot Studio 現在不是單一模型世界。Microsoft 也提到,團隊可以測試 GPT-5 系列模型,還有 Claude Sonnet 4.5、Claude Sonnet 4.6、Claude Opus 等選項,在 GCC 以外的環境也能用。

這種多模型配置很實際。不同模型有不同強項。有的比較會推理,有的比較快,有的比較適合結構化工作流。你要做的是選對場景,不是迷信單一模型。
但多模型也有代價。模型一多,測試矩陣就爆開。你不只要測答案對不對,還要測工具呼叫、格式穩定度、token 成本、回應延遲。這些東西一疊上來,PM 和工程師都會頭痛。
- GPT-5 可在 Copilot Studio 測試
- Claude Sonnet 4.5、4.6、Opus 可在部分環境使用
- GPT-4.1 成為預設編排模型
- GPT-4o 可暫時用到 2025/11/26
如果你問我哪個最重要,我會說是測試方法。Microsoft 已經把 agent evaluations、multi-turn tests、版本比較放進工具鏈。這其實是在告訴你,模型升級不能只靠人工抽查。
你可以把這件事想成軟體版控。模型不是魔法。它是依賴項。依賴項換版,就該跑測試,還要留 rollback 計畫。
台灣團隊現在該怎麼做
第一步很簡單。先找出哪些 agent 還綁在 GPT-4o。尤其是客服、銷售、法務、財務這類高風險流程。這些地方最怕輸出風格變掉。
第二步是做對照測試。拿同一批 prompts 跑 GPT-4o 和 GPT-4.1。看工具呼叫是否一致,看格式有沒有跑掉,看回覆是否更短或更囉唆。不要只看「答對沒」,還要看「能不能上線」。
第三步是確認權限與區域。若你有用外部模型,或部署牽涉資料跨區,就要再看一次法遵和資安。這不是多事。這是避免後面被稽核追著跑。
- 先盤點還在用 GPT-4o 的 agent
- 做 GPT-4o 與 GPT-4.1 對照測試
- 檢查工具呼叫與格式穩定度
- 確認資料區域與合規要求
我會建議把這次更新當成一個 release。不是公告。不是新聞。就是一個會影響產品行為的版本變更。你有 CI/CD,就該有模型驗證流程。
如果團隊現在還沒測,至少先把高流量 agent 拉出來。因為等到 11 月底再處理,通常只會更亂。那時候大家都在救火,沒人想慢慢 debug。
Copilot Studio 走向更像模型控制台
從產品走向來看,Copilot Studio 已經不像早期那種單純 bot builder。它越來越像一個模型控制台。你可以挑模型,也可以看評估,還能管版本。
這對開發者其實是好事。因為你終於不用把所有責任都壓在 prompt 上。模型、工具、評估、治理,現在都能拆開看。問題是,責任也更清楚了。你不能再說「AI 自己亂答」。
所以這次 GPT-4o 退場,表面上是換預設。實際上是 Microsoft 在逼大家接受一件事:agent 也要像軟體一樣維護。你不維護,它就會在某天默默變樣。
接下來最值得觀察的,不是 GPT-4o 什麼時候完全消失,而是各團隊要多久才能把 GPT-4.1 的測試流程補齊。這才是決定你會不會在月底爆炸的關鍵。