[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-xiaomi-mimo-v2-pro-1t-moe-agents-zh":3,"tags-xiaomi-mimo-v2-pro-1t-moe-agents-zh":32,"related-lang-xiaomi-mimo-v2-pro-1t-moe-agents-zh":50,"related-posts-xiaomi-mimo-v2-pro-1t-moe-agents-zh":54,"series-model-release-9e1044b4-946d-47fe-9e2a-c2ee032e1164":91},{"id":4,"title":5,"content":6,"summary":7,"source":8,"source_url":9,"author":10,"image_url":10,"keywords":11,"language":20,"translated_content":10,"views":21,"is_premium":22,"created_at":23,"updated_at":23,"cover_image":24,"published_at":23,"rewrite_status":25,"rewrite_error":10,"rewritten_from_id":26,"slug":27,"category":28,"related_article_id":29,"status":30,"google_indexed_at":31,"x_posted_at":10,"tweet_text":10,"title_rewritten_at":10,"title_original":10,"key_takeaways":10,"topic_cluster_id":10,"embedding":10,"is_canonical_seed":22},"9e1044b4-946d-47fe-9e2a-c2ee032e1164","小米 MiMo-V2-Pro 登場：1T MoE 模型","\u003Cp>小米這次真的把牌面打很大。\u003Ca href=\"https:\u002F\u002Fawesomeagents.ai\u002Fmodels\u002Fmimo-v2-pro\u002F\" target=\"_blank\" rel=\"noopener\">MiMo-V2-Pro\u003C\u002Fa> 總參數超過 1 兆，單次啟用 420 億。它還給你 100 萬 token context，起價每百萬 input token 1 美元。\u003C\u002Fp>\u003Cp>講白了，這不是拿來聊天裝可愛的模型。它是衝著 agentic coding 來的。成本、延遲、長上下文，這三個痛點一次全碰上。小米直接把它們攤在桌上。\u003C\u002Fp>\u003Cp>在 \u003Ca href=\"https:\u002F\u002Fwww.swebench.com\u002F\" target=\"_blank\" rel=\"noopener\">SWE-bench Verified\u003C\u002Fa> 上，小米宣稱它拿到 78.0%。這個分數很接近 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude-sonnet\" target=\"_blank\" rel=\"noopener\">Claude Sonnet 4.6\u003C\u002Fa> 的 79.6%。和 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude-opus\" target=\"_blank\" rel=\"noopener\">Claude Opus 4.6\u003C\u002Fa> 的 80.8% 也只差一點點。\u003C\u002Fp>\u003Ch2>小米到底端出什麼\u003C\u002Fh2>\u003Cp>MiMo-V2-Pro 是小米第二代 MiMo 系列的旗艦文字模型。它採用 Mixture-of-Experts，也就是 MoE。簡單說，總參數很大，但每個 token 只喚起其中一部分。\u003C\u002Fp>\u003Cp>這招很實際。你不用真的讓 1T 參數每次都跑一遍。那樣伺服器會先哭。MiMo-V2-Pro 每個 token 啟用 42B 參數，比較像是把大腦分工切開，讓不同專家輪流上場。\u003C\u002Fp>\u003Cp>小米還加了 7:1 hybrid attention pattern，外加輕量 Multi-Token Prediction 層。這些設計都指向同一件事。它想讓 agent loop 跑得更順，少一點卡頓，多一點連續操作。\u003C\u002Fp>\u003Cp>對開發者來說，最重要的不是架構圖，是能不能直接接。MiMo-V2-Pro 目前是 API only，沒有公開權重可抓。你可以從 \u003Ca href=\"https:\u002F\u002Fplatform.xiaomimimo.com\" target=\"_blank\" rel=\"noopener\">platform.xiaomimimo.com\u003C\u002Fa> 下手，也能走 OpenAI 相容端點 \u003Ca href=\"https:\u002F\u002Fapi.xiaomimimo.com\u002Fv1\" target=\"_blank\" rel=\"noopener\">api.xiaomimimo.com\u002Fv1\u003C\u002Fa>。它也上了 \u003Ca href=\"https:\u002F\u002Fopenrouter.ai\u002Fxiaomi\u002Fmimo-v2-pro\" target=\"_blank\" rel=\"noopener\">OpenRouter\u003C\u002Fa>。\u003C\u002Fp>\u003Cul>\u003Cli>總參數超過 1T\u003C\u002Fli>\u003Cli>每 token 啟用 42B\u003C\u002Fli>\u003Cli>標準 context 256K，延伸到 1M\u003C\u002Fli>\u003Cli>最大 completion 131,072 token\u003C\u002Fli>\u003Cli>標準 context 價格：input $1、output $3 \u002F 百萬 token\u003C\u002Fli>\u003Cli>256K 到 1M context：input $2、output $6 \u002F 百萬 token\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>為什麼 Hunter Alpha 會鬧這麼大\u003C\u002Fh2>\u003Cp>在小米正式揭曉前，AI 圈先被一個匿名模型搞得很熱。它叫 \u003Ca href=\"https:\u002F\u002Fopenrouter.ai\u002F\" target=\"_blank\" rel=\"noopener\">OpenRouter\u003C\u002Fa> 上的 Hunter Alpha。它大概在 2026 年 3 月 11 日出現，接著就開始吃掉大量流量。\u003C\u002Fp>\u003Cp>那個流量不是小數字。外界估計它每週處理約 5000 億 token。這種用量，通常不是小模型能扛的。大家自然會開始猜，背後是不是藏著什麼大傢伙。\u003C\u002Fp>\u003Cp>最先被拿來猜的，是 DeepSeek V4。原因也不難懂。小米研究主管羅福莉之前就在 DeepSeek 工作過。這讓整件事更像一場業界八卦接力。直到小米在 3 月 18 日確認，Hunter Alpha 就是 MiMo-V2-Pro，話題才從「這是誰」變成「小米怎麼做到這個價格」。\u003C\u002Fp>\u003Cblockquote>“I am a Chinese AI model primarily trained in Chinese.”\u003C\u002Fblockquote>\u003Cp>這句話就是當時的名場面。當模型被問自己是誰，它只回了這句。說真的，這種回答很像故意吊胃口。也很像一台還沒想好要不要自曝身分的 AI。\u003C\u002Fp>\u003Cp>小米還順手做了開發者拉新。像 \u003Ca href=\"https:\u002F\u002Fcline.bot\u002F\" target=\"_blank\" rel=\"noopener\">Cline\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.blackbox.ai\u002F\" target=\"_blank\" rel=\"noopener\">Blackbox\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.kilocode.ai\u002F\" target=\"_blank\" rel=\"noopener\">KiloCode\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.openclaw.ai\u002F\" target=\"_blank\" rel=\"noopener\">OpenClaw\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.opencode.ai\u002F\" target=\"_blank\" rel=\"noopener\">OpenCode\u003C\u002Fa> 這些工具，發表週都有免費 API 可試。這招很務實。真實開發者丟進去的 repo，才會把模型的毛病逼出來。\u003C\u002Fp>\u003Ch2>數字怎麼看，跟誰比才有感\u003C\u002Fh2>\u003Cp>如果只看宣傳詞，大家很容易麻木。還是得拿數字對照。MiMo-V2-Pro 最有感的地方，是它把接近頂級 coding 模型的分數，壓到更低的價格帶。\u003C\u002Fp>\u003Cp>在 SWE-bench Verified 上，小米給的成績是 78.0%。\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude-sonnet\" target=\"_blank\" rel=\"noopener\">Claude Sonnet 4.6\u003C\u002Fa> 是 79.6%。\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude-opus\" target=\"_blank\" rel=\"noopener\">Claude Opus 4.6\u003C\u002Fa> 是 80.8%。分數差距不大，價格差距就很有感。\u003C\u002Fp>\u003Cp>標準 context 下，MiMo-V2-Pro 是 input $1、output $3。Sonnet 4.6 是 $3 和 $15。Opus 4.6 則是 $5 和 $25。這種差距放到大量 agent traffic，帳單會很誠實地告訴你誰比較兇。\u003C\u002Fp>\u003Cp>在 agentic 任務上，小米還丟出 ClawEval 61.5。這個 benchmark 看的是多輪工具使用、錯誤修正、長程規劃。這些就是 coding agent 最常翻車的地方。MiMo-V2-Pro 在這裡高於 GPT-5.2 的 50.0，低於 Opus 4.6 的 66.3。\u003C\u002Fp>\u003Cul>\u003Cli>SWE-bench Verified：MiMo-V2-Pro 78.0%，Sonnet 4.6 79.6%，Opus 4.6 80.8%\u003C\u002Fli>\u003Cli>ClawEval：MiMo-V2-Pro 61.5，GPT-5.2 50.0，Opus 4.6 66.3\u003C\u002Fli>\u003Cli>Terminal-Bench 2.0：MiMo-V2-Pro 86.7\u003C\u002Fli>\u003Cli>GPQA Diamond：MiMo-V2-Pro 87%\u003C\u002Fli>\u003Cli>VentureBeat 引用的測試總成本：MiMo-V2-Pro $348，GPT-5.2 $2,304，Claude Opus 4.6 $2,486\u003C\u002Fli>\u003C\u002Ful>\u003Cp>我覺得最刺眼的是成本。VentureBeat 報的 benchmark 總帳單，MiMo-V2-Pro 只有 $348。GPT-5.2 是 $2,304。Claude Opus 4.6 是 $2,486。這不是差一點，是直接差一個級距。\u003C\u002Fp>\u003Ch2>它適合放進哪種產品\u003C\u002Fh2>\u003Cp>MiMo-V2-Pro 不是小米唯一的模型。這次它一次丟出三款。這很像在告訴你：別只看旗艦，整條產品線都有分工。\u003C\u002Fp>\u003Cp>\u003Ca href=\"https:\u002F\u002Fhuggingface.co\u002FXiaomiMiMo\" target=\"_blank\" rel=\"noopener\">MiMo-V2-Flash\u003C\u002Fa> 是可自架的版本。它有 310B 總參數、15B active parameters，而且在 Hugging Face 上給了 MIT 授權。這對想控成本、控資料、控部署的人，吸引力很直接。\u003C\u002Fp>\u003Cp>小米還發了 \u003Ca href=\"https:\u002F\u002Fhuggingface.co\u002FXiaomiMiMo\" target=\"_blank\" rel=\"noopener\">MiMo-V2-Omni\u003C\u002Fa>。它走多模態，能處理文字、圖片、影片、音訊。小米說它可以一次處理 10 小時以上連續音訊。價格則是 input $0.40、output $2.00 \u002F 百萬 token。\u003C\u002Fp>\u003Cp>所以三款的定位其實很清楚。你要本地控制，就看 Flash。你要多模態，就先試 Omni。你要最強 agentic coding 表現，就先拿 Pro 去跑你的流水線。\u003C\u002Fp>\u003Cp>但也別太快高潮。MiMo-V2-Pro 目前還有幾個空白。它沒有公開權重。完整總參數拆法也沒全公開。跨所有知識 benchmark 的對照表也不算完整。它也沒有多模態輸入。做文件理解或媒體流程的人，還是得另找模型。\u003C\u002Fp>\u003Cp>如果你問我值不值得試，我會說值得。不是因為它神。是因為它把「接近頂級 coding 成績」和「便宜很多」放在一起。這種組合，對 SaaS、內部工具、客服自動化、repo 修補 agent，都很有吸引力。\u003C\u002Fp>\u003Ch2>這波對開發圈代表什麼\u003C\u002Fh2>\u003Cp>中國模型廠現在很常做一件事。先把參數數字拉高，再把價格壓低。這招不新，但很有效。因為開發者最後看的是每次呼叫的成本，不是簡報封面。\u003C\u002Fp>\u003Cp>MiMo-V2-Pro 的出現，也讓 agent 模型的競爭更直接。以前大家比的是聊天品質。現在比的是能不能在長 context 裡穩定做事。能不能接工具。能不能修 repo。能不能在一堆失敗後還撐住。\u003C\u002Fp>\u003Cp>這也是為什麼 1M context 很重要。很多真實工作不是一問一答。是整包資料、整個專案、整段對話、整串 log 一起丟。你要的是記得住，也要跑得動。這兩件事常常互相打架。\u003C\u002Fp>\u003Cp>現在的關鍵問題很簡單。你的 agent stack，能不能把一部分 coding 流量切到 MiMo-V2-Pro，然後真的省下錢，還不掉穩定性？如果可以，那它就不是新聞而已。它會變成你月底帳單上的差異。\u003C\u002Fp>\u003Ch2>最後怎麼看\u003C\u002Fh2>\u003Cp>我會先把 MiMo-V2-Pro 當成一個值得測的高性價比選項。不是直接換掉現有主力，而是拿 20% 到 30% 的 coding 流量做 A\u002FB test。看修 bug 成功率、工具呼叫失敗率、平均 completion 成本。\u003C\u002Fp>\u003Cp>如果你的團隊現在就有大量 agent 工作，這款模型很適合放進試跑清單。尤其是那些要長上下文、要多輪操作、又很在意帳單的案子。先測，再決定要不要放大。\u003C\u002Fp>\u003Cp>說真的，這類模型現在比的是實戰，不是口號。你手上的 repo、log、ticket、CI 失敗紀錄，才是最好的考場。MiMo-V2-Pro 值不值得留下來，答案應該會很快出來。\u003C\u002Fp>","小米推出 MiMo-V2-Pro，總參數超過 1T、每 token 啟用 42B，還有 1M context。SWE-bench 成績逼近 Claude Sonnet 4.6，價格卻低很多。","awesomeagents.ai","https:\u002F\u002Fawesomeagents.ai\u002Fmodels\u002Fmimo-v2-pro\u002F",null,[12,13,14,15,16,17,18,19],"小米","MiMo-V2-Pro","MoE","agentic coding","SWE-bench","Claude Sonnet 4.6","LLM","API","zh",3,false,"2026-03-28T03:06:19.002353+00:00","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1774597397882-x4i9.png","done","5909303e-95ba-4af2-826b-68b138a6422f","xiaomi-mimo-v2-pro-1t-moe-agents-zh","model-release","f063d8d1-41d1-4de4-8ebc-6c40511b9369","published","2026-04-09T09:00:59.403+00:00",[33,36,38,41,43,45,47,49],{"name":34,"slug":35},"研究整理","-",{"name":17,"slug":37},"claude-sonnet-4-6",{"name":39,"slug":40},"SWE-Bench","swe-bench",{"name":18,"slug":42},"llm",{"name":15,"slug":44},"agentic-coding",{"name":13,"slug":46},"mimo-v2-pro",{"name":14,"slug":48},"moe",{"name":12,"slug":12},{"id":29,"slug":51,"title":52,"language":53},"xiaomi-mimo-v2-pro-1t-moe-agents-en","Xiaomi MiMo-V2-Pro: 1T MoE Model for Agents","en",[55,61,67,73,79,85],{"id":56,"slug":57,"title":58,"cover_image":59,"image_url":59,"created_at":60,"category":28},"5b5fa24f-5259-4e9e-8270-b08b6805f281","minimax-m1-open-hybrid-attention-reasoning-model-zh","MiniMax-M1：開源 1M Token 推理模型","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778797859209-ea1g.png","2026-05-14T22:30:38.636592+00:00",{"id":62,"slug":63,"title":64,"cover_image":65,"image_url":65,"created_at":66,"category":28},"b1da56ac-8019-4c6b-a8dc-22e6e22b1cb5","gemini-omni-video-review-text-rendering-zh","Gemini Omni 影片模型怎麼了","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778779280109-lrrk.png","2026-05-14T17:20:42.608312+00:00",{"id":68,"slug":69,"title":70,"cover_image":71,"image_url":71,"created_at":72,"category":28},"d63e9d93-e613-4bbf-8135-9599fde11d08","why-xiaomi-mimo-v25-pro-changes-coding-agents-zh","為什麼 Xiaomi 的 MiMo-V2.5-Pro 改變的是 Coding …","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778689858139-v38e.png","2026-05-13T16:30:27.893951+00:00",{"id":74,"slug":75,"title":76,"cover_image":77,"image_url":77,"created_at":78,"category":28},"8f0c9185-52f9-46f2-82c6-5baec126ba2e","openai-realtime-audio-models-live-voice-zh","OpenAI 即時音訊模型瞄準語音互動","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778451657895-2iu7.png","2026-05-10T22:20:32.443798+00:00",{"id":80,"slug":81,"title":82,"cover_image":83,"image_url":83,"created_at":84,"category":28},"52106dc2-4eba-4ca0-8318-fa646064de97","anthropic-10-finance-ai-agents-zh","Anthropic推10款金融AI Agent","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778389843399-vclb.png","2026-05-10T05:10:22.778762+00:00",{"id":86,"slug":87,"title":88,"cover_image":89,"image_url":89,"created_at":90,"category":28},"6ee6ed2a-35c6-4be3-ba2c-43847e592179","why-claudes-infinite-context-window-wont-autonomous-zh","為什麼 Claude 的「無限」上下文窗口，仍然不會讓 AI 自主運作","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778350250836-d5d5.png","2026-05-09T18:10:27.004984+00:00",[92,97,102,107,112,117,118,123,128,133],{"id":93,"slug":94,"title":95,"created_at":96},"58b64033-7eb6-49b9-9aab-01cf8ae1b2f2","nvidia-rubin-six-chips-one-ai-supercomputer-zh","NVIDIA Rubin 把六顆晶片塞進 AI 機櫃","2026-03-26T07:18:45.861277+00:00",{"id":98,"slug":99,"title":100,"created_at":101},"0dcc2c61-c2a6-480d-adb8-dd225fc68914","march-2026-ai-model-news-what-mattered-zh","2026 年 3 月 AI 模型新聞重點","2026-03-26T07:32:08.386348+00:00",{"id":103,"slug":104,"title":105,"created_at":106},"214ab08b-5ce5-4b5c-8b72-47619d8675dd","why-small-models-are-winning-on-device-ai-zh","小模型為何吃下裝置端 AI","2026-03-26T07:36:30.488966+00:00",{"id":108,"slug":109,"title":110,"created_at":111},"785624b2-0355-4b82-adc3-de5e45eecd88","midjourney-v8-faster-images-higher-costs-zh","Midjourney V8 變快了，也變貴了","2026-03-26T07:52:03.562971+00:00",{"id":113,"slug":114,"title":115,"created_at":116},"cda76b92-d209-4134-86c1-a60f5bc7b128","xiaomi-mimo-trio-agents-robots-voice-zh","小米 MiMo 三模型瞄準代理、機器人與語音","2026-03-28T03:05:08.779489+00:00",{"id":4,"slug":27,"title":5,"created_at":23},{"id":119,"slug":120,"title":121,"created_at":122},"d68e59a2-55eb-4a8f-95d6-edc8fcbff581","cursor-composer-2-started-from-kimi-zh","Cursor Composer 2 其實從 Kimi 起步","2026-03-28T03:11:58.893796+00:00",{"id":124,"slug":125,"title":126,"created_at":127},"c4b6186f-bd84-4598-997e-c6e31d543c0d","cursor-composer-2-agentic-coding-model-zh","Cursor Composer 2 走向代理式寫碼","2026-03-28T03:13:06.422716+00:00",{"id":129,"slug":130,"title":131,"created_at":132},"45812c46-99fc-4b1f-aae1-56f64f5c9024","openai-shuts-down-sora-video-app-api-zh","OpenAI 關閉 Sora App 與 API","2026-03-29T04:47:48.974108+00:00",{"id":134,"slug":135,"title":136,"created_at":137},"e112e76f-ec3b-408f-810e-e93ae21a888a","apple-siri-gemini-distilled-models-zh","Apple Siri 牽手 Gemini 的真相","2026-03-29T04:52:57.886544+00:00"]