[MODEL] 9 分鐘閱讀OraCore 編輯部

MiMo V2 Pro、Omni、Flash 怎麼選

MiMo 2026 三款模型分工很清楚:Flash 主打開源與 coding,Pro 提供 1M context,Omni 則處理圖像、音訊與影片。這篇直接比 benchmark、價格與適用場景。

分享 LinkedIn
MiMo V2 Pro、Omni、Flash 怎麼選

MiMo 2026 這組模型很有意思。它不是一顆模型打天下,而是直接拆成三條線。MiMo V2 Flash 在 2025 年 12 月 16 日先上線,Xiaomi 又在 2026 年 3 月 18 日推出 MiMo V2 ProMiMo V2 Omni。如果你在做產品,重點不是誰分數最高,而是誰最省錢、最順手、最不浪費 context。

講白了,這三顆模型各做各的事。Flash 偏向高效率開源推理與 coding。Pro 走長 context 和長流程任務。Omni 則把文字、圖片、影片、音訊放進同一套系統。對開發者來說,這種切法很實際,因為你不用拿一顆萬用模型硬扛所有場景。

更重要的是,MiMo V2 很明顯在往 agent 方向走。它不是只想回答問題。它想讀資料、呼叫工具、追蹤狀態,然後繼續做下一步。這種設計很適合現在的軟體專案,因為大家都在做工作流、自動化、客服助理和 coding agent。

MiMo V2 到底改了什麼

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

這一代最明顯的變化,是 Xiaomi 不再把所有能力塞進同一顆模型。它把家族切成三個產品,角色很清楚。這對開發者是好事,因為你可以直接對應需求,不用先猜模型到底適不適合。

MiMo V2 Pro、Omni、Flash 怎麼選

MiMo V2 採用 Mixture-of-Experts,也就是 MoE。簡單說,模型總參數很大,但每次只啟用其中一部分。這樣可以把容量拉高,卻不讓每個 token 都付全額算力成本。對雲端 API 來說,這就是價格和效能的拉扯。

它也很明顯在強化工具使用。這不是空話。你看它的定位就知道,MiMo V2 想做的是能跑流程的模型,不是只會寫一段漂亮回答的聊天機器人。這種差別,做過 agent 的人都懂,能不能穩定呼叫工具,差很多。

  • Flash:309B 總參數,15B active,256K context,開源
  • Pro:約 1T 總參數,42B active,1M context,API-only
  • Omni:支援文字、圖片、影片、音訊
  • Flash 價格:約 $0.09 input、$0.29 output / 1M tokens
  • Pro 價格:256K 內約 $1/$3,超過後約 $2/$6
  • Omni 價格:約 $0.40 input、$2 output / 1M tokens

這組數字很直白。Flash 是便宜。Pro 是長記憶。Omni 是多模態。你不用猜,直接看需求就好。這種產品切法,比起把一顆模型包成全能型,反而更容易讓團隊採用。

Flash 為什麼特別適合 coding

如果你的工作多半是文字、程式碼、或 agent loop,MiMo V2 Flash 很值得看。它是這組裡最像「高流量工作馬」的角色。官方和評測都把它放在效率、成本、開源可用性這幾個點上。

最亮眼的數字是 SWE-bench Verified。Flash 在這項拿到 73.4%。這個分數很有份量,因為它直接對準真實 code fixing 任務。它在 SWE-bench Multilingual 也有 71.7%,代表不只英文 code 能打,其他語言場景也不差。

再看 AIME 2025,Flash 也有 94.1%。這代表 active parameter 少,不等於推理就弱。說真的,這點很打臉一些只看參數量的人。MoE 的價值就在這裡,總參數大,不代表每次都要全開。

“The fastest way to kill a good idea is to make it too expensive to test.” — Sam Altman

這句話很適合 Flash。你要做大量 prompt 實驗、批次測試、客服自動化、內部 coding assistant,成本就是核心。Flash 的 API 價格約 $0.09 input、$0.29 output / 1M tokens。這種價位,拿來跑大規模測試會舒服很多。

而且 Flash 還有一個很實際的優勢。它是開源權重,能在 Hugging Face 找到。這代表你可以先做本地驗證,再決定要不要上雲。對重視資料控管的團隊,這點很重要。

  • SWE-bench Verified:73.4%
  • SWE-bench Multilingual:71.7%
  • AIME 2025:94.1%
  • 價格:約 $0.09 / $0.29 每 1M tokens
  • 適合:coding copilot、批次 agent、內部工具
  • 優勢:開源、便宜、好做大量實驗

我覺得 Flash 的定位很清楚。它不是要當最全能的那顆。它是要讓你用最低成本,把一個可用的 agent 或 coding 流程先跑起來。這對產品團隊來說,超重要。

Pro 為什麼是長流程任務首選

MiMo V2 Pro 是那種一看就知道給重任務用的模型。它的總參數超過 1 兆,active 參數 42B。更關鍵的是它有 1M token context。這個數字很兇,因為它直接改變你能塞多少資料進同一個 session。

MiMo V2 Pro、Omni、Flash 怎麼選

如果你做的是大型 codebase 分析、長文件摘要、跨很多步驟的 agent 流程,1M context 很有感。你不用一直切段,也不用頻繁重置狀態。這對工具鏈很友善,因為模型比較不容易在中途忘記前文。

從評測看,Pro 也是三者裡最穩的那顆。它在一般推理、工具調用、長任務控制上都更強。文章裡提到的 Artificial Analysis Intelligence Index 約 49,Flash 大概落在 39 到 41。這差距不算小,尤其是在複雜工作流裡。

  • 1M context,適合超長文件與大型 codebase
  • SWE-bench Verified:78.0%
  • ClawEval:約 61.5 到 81.0
  • hallucination rate:約 30%
  • 價格:256K 內約 $1/$3,之後約 $2/$6
  • 模式:API-only,適合產品團隊

Pro 的 hallucination rate 也比較低。文章給的數字大約是 30%,Flash 則接近 48%。這種差距在 production 很有感。因為你不是只看一次答對,而是看它能不能連做 20 步還不翻車。

如果你在做企業級 coding assistant、長時間 browser agent、或多輪工作流系統,我會直接偏向 Pro。它貴一點沒錯,但少掉的 retry 和人工修正,常常比模型價差更值錢。

Omni 為什麼是多模態產品的重點

MiMo V2 Omni 是這組裡最像「感知型 agent」的模型。它吃文字、圖片、影片、音訊,然後把這些資料放在同一個推理架構裡。這種設計很適合要看畫面、聽聲音、再做動作的產品。

你可以把它想成 UI agent、視覺助理、語音助理的底層。像是讀截圖、看儀表板、聽客服錄音、分析影片片段,這些都不該再拆成好幾個獨立模組。拆太多,延遲和錯誤機率都會上升。

文章提到 Omni 能處理超過 10 小時的連續音訊。這個能力很實用。因為很多真實場景不是 30 秒短音檔,而是會議錄音、客服通話、長時間監控。你要的是穩定接住資料,不是只會做 demo。

  • 支援文字、圖片、影片、音訊
  • 價格:約 $0.40 input、$2 output / 1M tokens
  • 適合 browser agent、mobile agent、視覺助理
  • 可處理長音訊,超過 10 小時
  • 強項是 UI grounding 和 structured tool calling

Omni 的價格也不算離譜。對多模態 API 來說,$0.40 input、$2 output / 1M tokens 算是能談的區間。很多團隊不是不想做多模態,是怕成本炸掉。這顆至少讓你有機會先做 MVP。

如果 Flash 是高吞吐 worker,Pro 是長記憶分析師,那 Omni 就是能看見使用者世界的那顆。這差別很現實。很多產品卡住,不是因為文字模型不夠強,而是它根本看不懂畫面。

三顆模型怎麼選,差在哪裡

先講最簡單的選法。你要便宜、快、開源,就選 Flash。你要超長 context 和更穩的流程控制,就選 Pro。你要圖像、音訊、影片一起處理,就選 Omni。這不是學術題,這是成本題。

如果你做的是 coding copilot,Flash 會很香。因為它便宜,還有不錯的 SWE-bench 成績。你可以拿它來做大量測試,先把產品驗證出來。等 workflow 變複雜,再升到 Pro。

如果你做的是看螢幕、讀文件、聽聲音的 agent,Omni 才是正解。你不需要把影像模型、ASR、LLM 拆開串。那樣做很累,延遲也高。直接用 Omni,架構會乾淨很多。

  • Flash:最適合大量文字與 code 任務
  • Pro:最適合長上下文與多步驟工作流
  • Omni:最適合多模態 agent
  • Flash:開源,方便本地測試
  • Pro:API-only,適合正式產品
  • Omni:適合感知加行動的介面

如果你問我哪顆最值得先試,我會先從 Flash 開始。原因很簡單,便宜又好測。等你真的卡在長 context,或需要看圖聽音,再切 Pro 或 Omni。這樣比較不會一開始就把成本拉爆。

MiMo 的市場位置,還有台灣團隊該注意什麼

MiMo 這次的打法,跟很多模型家族不太一樣。它不是只在 benchmark 上拼最高分,而是直接把應用場景切開。這對現在的 LLM 市場很合理,因為大家都在找更準的成本模型,而不是只看分數表。

從產業角度看,Flash 對開源社群很有吸引力。Pro 對企業級 agent 很有吸引力。Omni 則對做 UI、自動化、影音理解的團隊很有吸引力。這三條線都很清楚,也讓 Xiaomi 在模型市場有自己的位子。

台灣開發者如果要導入,我會建議先做三件事。第一,拿自己的資料測。第二,算 token 成本。第三,先看失敗案例。模型分數只是起點,真正決定能不能上線的,還是你的資料分布和工作流設計。

如果你有大量中文、英文混合內容,Flash 和 Pro 都值得試。若你有客服錄音、操作截圖、影片教學,Omni 會更直接。講白了,別只看模型名氣。看你的產品到底要什麼。

結論:先用任務選模型,不要反過來

MiMo 2026 這三顆模型,最有價值的地方是分工明確。Flash 是開源、便宜、適合 coding。Pro 是長 context、適合複雜流程。Omni 是多模態、適合看圖聽音的 agent。

我的建議很直接。先拿你自己的 20 到 50 個真實案例跑一輪。看哪顆模型的成功率最高,再看單次成本。最後你會發現,最好的模型通常不是分數最高那顆,而是最符合你任務邊界那顆。

如果你現在就要選一顆起手式,我會先選 Flash。因為它最便宜,也最容易做大規模測試。等需求變複雜,再往 Pro 或 Omni 升。這樣比較務實,也比較不會踩坑。