[MODEL] 7 分鐘閱讀OraCore 編輯部

MiniMax M2 開源,代理編碼變便宜

MiniMax 開源 M2,主打代理編碼與工具使用,輸入每百萬 Token 只要 0.30 美元,還有限時免費試用。

分享 LinkedIn
MiniMax M2 開源,代理編碼變便宜

MiniMax 開源 M2,主打代理編碼與工具使用,價格低、速度快,適合做長流程軟體任務。

MiniMax 這次很直接。它把賭注押在一件事上:代理式工作要真的能落地,模型就得快、便宜、夠穩。官方說 MiniMax M2 已經開源,輸入每百萬 Token 只要 0.30 美元。限時免費試用到 11 月 7 日 00:00 UTC。

這種價格很有感。官方還說,線上推理速度大約 100 tokens per second,輸出每百萬 Token 1.20 美元。它也搭配新的 MiniMax Agent,用途包含寫程式、研究、長流程工具操作。

講白了,MiniMax 不是在賣聊天機器人。它是在賣一個能跑任務的 LLM。這種東西一旦便宜,開發者就會開始算帳。因為代理不是打一兩句話就收工,而是會一直呼叫 API、一直重試、一直吃 Token。

指標MiniMax M2官方說法
輸入價格0.30 美元 / 百萬 Token約 Claude Sonnet 的 8%
輸出價格1.20 美元 / 百萬 Token約 Claude Sonnet 的 8%
線上推理速度約 100 TPS約比 Claude Sonnet 快 2 倍
免費試用截止11 月 7 日 00:00 UTC限時開放

為什麼 M2 直接對準代理

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

MiniMax 這份公告,味道很像自己先踩過坑。它說內部已經拿代理做資料分析、技術研究、程式開發、使用者回饋整理,還有履歷篩選。這些工作看起來平常,實際上很吃模型穩定度。

MiniMax M2 開源,代理編碼變便宜

因為代理和一般聊天不同。聊天只要答得像樣就好。代理要能拆解任務,接工具,跑 Shell,開 Browser,寫 Python,還要在失敗後自己回來。這不是單次問答。這是長時間協作。

MiniMax 說 M2 就是為這種場景設計的。它把重點放在程式、工具使用、邏輯推理和知識工作。這個方向其實很務實。因為真正的企業需求,常常不是要最會講幹話的模型,而是要能把工做完的模型。

  • MiniMax 說 M2 對準端到端開發流程。
  • 官方強調 Shell、Browser、Python、MCP 工具。
  • 限時免費,方便開發者先測再說。
  • 權重已放到 Hugging Face,可本地部署。

它跟其他模型怎麼比

MiniMax 的說法算是有節制。它沒有硬吹自己是程式最強。它說 M2 在工具使用和深度搜尋上,接近海外領先模型,但在程式能力上還略落後最頂尖那群。這種講法反而比較可信。

因為代理模型的重點,不是單一 benchmark。它要能在多步驟流程裡活下來。你今天讓它寫一段 code,明天讓它查資料,後天讓它改 bug。只要其中一環常掉鏈子,整個工作流就會爛掉。

MiniMax 還提到 Artificial Analysis 的綜合評測。它說 M2 擠進全球前五。這個數字值得看,但也要看清楚。那不是單一 coding 分數,而是 10 個任務的綜合表現。

“Today, we are officially open-sourcing and launching MiniMax M2, a model born for Agents and code.” — MiniMax

這句話很直白。它等於在說,M2 的定位不是陪聊,也不是純寫文。它就是要服務代理和程式。這種定位很清楚,也很適合現在的市場。

  • MiniMax 說 M2 在工具使用與深搜表現接近前段班。
  • 官方承認程式能力還不是最頂。
  • Artificial Analysis 是 10 任務綜合評測。
  • 內部 dogfooding 涵蓋工程、後端、商務流程。

MiniMax Agent 也一起升級

MiniMax 不只丟模型。它還升級了 MiniMax Agent。中國版和海外版都更新了。產品現在分成兩種模式。Lightning Mode 偏快,適合問答、輕量搜尋、小型 coding。Pro Mode 則偏長任務,像深度研究、全端開發、報告、PPT、網站製作。

MiniMax M2 開源,代理編碼變便宜

這個切法我覺得合理。很多代理產品最愛把所有任務塞進同一種介面。結果就是,輕任務嫌慢,重任務嫌淺。MiniMax 直接切兩條路,反而比較像真實使用情境。

官方還說,新 Agent 目前免費,直到伺服器撐不住。這句話很有意思。它一方面是在吸流量,另一方面也在測市場反應。想試 coding 工作流的人,應該會先衝一波。

如果你想直接碰模型,官方提供 MiniMax Open Platform API 文件,也有 tool calling guide。本地部署則可看 vLLMSGLang

價格和速度到底改變什麼

這次最有意思的,不是 benchmark。是成本。MiniMax 說 M2 的價格只有 Claude Sonnet 的 8%,速度還接近快 2 倍。這種組合,會直接改變團隊的算帳方式。

因為代理產品最怕的就是「每次看起來不貴,總帳嚇死人」。只要你讓模型反覆呼叫工具、反覆修正、反覆搜尋,Token 就會像水一樣流掉。價格一低,團隊才敢把代理放進真實流程。

這對新創和內部工具都很重要。很多公司不是不用 AI,而是怕成本失控。M2 這種定價,會讓更多團隊敢做長流程任務。像自動修 bug、整理客服資料、抓研究摘要,這些都很吃 Token。

  • 輸入 0.30 美元 / 百萬 Token,壓力小很多。
  • 輸出 1.20 美元 / 百萬 Token,也比高價模型友善。
  • 約 100 TPS,適合高頻互動流程。
  • 開源權重可讓團隊自己控資料與延遲。

這波對開發者有什麼意思

開源權重這件事很重要。因為它不是只有 API 可用。你可以自己部署、自己調整、自己接內部系統。對重視資料安全的團隊來說,這比單純租一個雲端 API 更好談。

另一個重點是,M2 讓代理編碼的價格帶往下掉。以前大家談 agentic coding,常常先想到昂貴訂閱。現在如果開源模型夠快,很多團隊會開始考慮自建流程。尤其是要跑大量任務的公司,差異會很明顯。

我覺得真正的測試,會在真實工作流。不是 demo,也不是單次寫程式。是你把它接進 CI、issue tracker、browser automation、MCP 工具之後,它會不會一直出包。這才是關鍵。

如果它能穩定跑在這些場景,MiniMax 這次就不是單純發一個模型,而是把代理式工作拉進更便宜的區間。這會逼其他家也跟著調整價格和產品設計。

背景脈絡:為什麼大家都在做代理模型

代理模型這幾年會紅,不是偶然。因為單純聊天已經不夠用了。大家要的是能做事的 AI。能找資料、能寫 code、能操作工具、能回報結果。這才有機會進企業流程。

但代理很吃基礎設施。模型要夠穩,伺服器要夠快,工具介面要夠清楚,錯誤處理也要夠好。少一個環節,體驗就會很差。所以現在各家都在拚,不只是模型能力,還有整套執行成本。

MiniMax 的做法很像在回應這個現實。它沒有只談參數,也沒有只談對話品質。它直接談價格、速度、工具、開源、部署。這些才是開發者每天真的會碰到的東西。

下一步看什麼

接下來最值得看的,不是官方再發一次宣傳稿。是第三方開發者會不會真的把 M2 接進專案。像 Hugging FacevLLMSGLang 這些地方,會不會很快出現可用部署方案。

如果社群實測後,M2 在 coding、browser automation、multi-step agent 這幾種任務都站得住腳,那它會很快變成一個很實用的選項。反過來說,如果一上真實工作流就開始亂掉,那便宜也救不了。

我自己的判斷很簡單。這波最值得關注的,不是它能不能贏過所有 benchmark,而是它能不能讓普通團隊也玩得起代理編碼。你如果在做產品,現在就該拿它跑一輪自己的工作流。