[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-nvidia-rubin-six-chips-one-ai-supercomputer-zh":3,"article-related-nvidia-rubin-six-chips-one-ai-supercomputer-zh":30,"series-model-release-58b64033-7eb6-49b9-9aab-01cf8ae1b2f2":91},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":11,"views":27,"created_at":28,"published_at":29,"topic_cluster_id":11},"58b64033-7eb6-49b9-9aab-01cf8ae1b2f2","nvidia-rubin-six-chips-one-ai-supercomputer-zh","NVIDIA Rubin 把六顆晶片塞進 AI 機櫃","\u003Cp>NVIDIA 在 CES 2026 端出 Rubin，先丟兩個很大的數字。官方說，推論每個 Token 的成本，最高可比 Blackwell 低 10 倍。訓練 mixture-of-experts，也就是 MoE 模型，GPU 用量可降到原本的 1\u002F4。\u003C\u002Fp>\u003Cp>講白了，這次重點不是單一晶片跑多快。NVIDIA 想賣的是整套 AI 基礎設施。從 CPU、GPU、網卡、DPU 到乙太網路交換器，全部綁在一起賣，直接變成機櫃級產品。\u003C\u002Fp>\u003Cp>這個時間點也很現實。前兩年大家都在比誰能訓練更大的模型，現在麻煩的是推論成本。模型上下文越拉越長，推理步驟越來越多，電費和伺服器成本也跟著往上噴。Rubin 就是 NVIDIA 給這個問題的答案。\u003C\u002Fp>\u003Ch2>Rubin 不是一顆晶片，是整疊系統\u003C\u002Fh2>\u003Cp>先講清楚，Rubin 不是只有 GPU。它是一個六晶片平台，核心元件包含 Vera CPU、Rubin GPU、NVLink 6 switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch。這六個東西一起上，才是 NVIDIA 定義的 Rubin。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1774516131100-fn1e.png\" alt=\"NVIDIA Rubin 把六顆晶片塞進 AI 機櫃\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>這種做法反映一個現實。現在 AI 叢集的瓶頸，早就不是只有 GPU 算力。資料搬移、節點互連、記憶體重用、租戶隔離、維修時間，哪一個卡住都會拖垮整體吞吐。\u003C\u002Fp>\u003Cp>所以 NVIDIA 這次的說法很直接。與其讓客戶自己拼裝零件，再慢慢找瓶頸，不如一開始就把運算、網路、安全和服務性一起設計。你可以不喜歡這種綁定，但說真的，這招對大客戶很有吸引力，因為省掉很多整合成本。\u003C\u002Fp>\u003Cul>\u003Cli>Rubin 推論每個 Token 成本，官方稱最高比 Blackwell 低 10 倍。\u003C\u002Fli>\u003Cli>MoE 訓練可用比前代少 4 倍的 GPU。\u003C\u002Fli>\u003Cli>每顆 Rubin GPU 具備 3.6 TB\u002Fs 的 NVLink 頻寬。\u003C\u002Fli>\u003Cli>Vera Rubin NVL72 機櫃總 NVLink 頻寬達 260 TB\u002Fs。\u003C\u002Fli>\u003Cli>Rubin GPU 在 AI 推論可達 50 petaflops 的 NVFP4 算力。\u003C\u002Fli>\u003Cli>合作夥伴產品預計在 2026 下半年出貨。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>包裝方式也很關鍵。NVIDIA 會提供 Vera Rubin NVL72 機櫃級系統，以及 HGX Rubin NVL8 系統。你看到 NVL72 這種命名，大概就知道 NVIDIA 押注在哪裡。它想賣的是整櫃，不只是加速卡。\u003C\u002Fp>\u003Cp>這背後的商業邏輯很清楚。單賣 GPU，客戶還能拿別家的網路、CPU 或管理軟體來拼。整櫃賣出去後，NVIDIA 吃下的就不只是晶片毛利，還包括機櫃設計、互連、軟體堆疊和維運工具。對客戶來說，彈性變少，但交付速度通常會更快。\u003C\u002Fp>\u003Cp>對台灣讀者來看，這也代表供應鏈重心繼續往系統整合移動。未來比的不是誰能做出一片板卡，而是誰能把散熱、電源、機櫃、交換器和伺服器模組一起交付。ODM、散熱、機殼、電源廠都會被捲進來。\u003C\u002Fp>\u003Ch2>為什麼 NVIDIA 現在一直講推論\u003C\u002Fh2>\u003Cp>過去兩年，硬體發表會很愛講訓練大模型。到了 Rubin，主軸明顯變了。NVIDIA 開始一直強調 reasoning、agentic workloads，還有長上下文。這些工作負載的共同點，就是模型會花更多時間吐 Token，而不是只做一次前向運算。\u003C\u002Fp>\u003Cp>你可能會想問，這有差很多嗎。差非常多。當推論變成主要成本，硬體採購就不會只盯著峰值 FLOPS。大家更在意的是每個 Token 到底要多少錢、能耗多少、延遲多少，還有同時服務多少使用者。\u003C\u002Fp>\u003Cp>Rubin 也順手帶出一個新東西，叫 Inference Context Memory Storage Platform，底層由 BlueField-4 驅動。名字很長，意思其實不難懂。它想更有效率地保存和共享 key-value cache，也就是模型在長上下文推論時很吃重的那塊記憶資料。\u003C\u002Fp>\u003Cp>這件事很技術，但商業價值很直接。若 cache 能重用，模型就少做很多重複工作。延遲會降，吞吐會升，伺服器利用率也會比較好看。對提供 AI API 的公司來說，這不是小優化，是直接影響毛利的問題。\u003C\u002Fp>\u003Cblockquote>\u003Cp>“Intelligence scales with compute. When we add more compute, models get more capable, solve harder problems and make a bigger impact for people. The NVIDIA Rubin platform helps us keep scaling this progress so advanced intelligence benefits everyone.”\u003C\u002Fp>\u003Cfooter>Sam Altman, CEO of OpenAI\u003C\u002Ffooter>\u003C\u002Fblockquote>\u003Cp>Sam Altman 這段話很符合 NVIDIA 想傳達的訊息。模型公司嘴上會談效率，實際上還是持續追更多算力。因為成本降下來後，他們通常不會省起來，而是拿去換更長上下文、更多使用者、更多推理步驟。\u003C\u002Fp>\u003Cp>這也是 Rubin 的核心賭注。不是單純讓你省錢，而是讓你把省下來的錢，再灌回模型服務裡。只要這個循環成立，NVIDIA 就有理由繼續賣更大的系統。\u003C\u002Fp>\u003Cp>另外，NVIDIA 這次也比平常更用力講安全和穩定性。Rubin 支援第三代 confidential computing，範圍跨 CPU、GPU 和 NVLink。還有第二代 RAS 引擎，負責健康檢查和容錯。對共享 AI 基礎設施的雲端業者來說，這些不是附加功能，是基本門檻。\u003C\u002Fp>\u003Ch2>和 Blackwell 比，Rubin 紙面數字差在哪\u003C\u002Fh2>\u003Cp>NVIDIA 這次最想讓大家記住的比較，就是 Rubin 對 Blackwell。當然，這些數字目前多半還是官方口徑，真正上線後還要看實測。但方向已經很明顯。Rubin 主打的是大規模推論與 MoE 的經濟效益，不只是更高峰值性能。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1774516153504-b90d.png\" alt=\"NVIDIA Rubin 把六顆晶片塞進 AI 機櫃\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>先看最醒目的數字。推論每個 Token 成本，官方說最高可降到 Blackwell 的 1\u002F10。若這個數字接近真實部署結果，很多 AI 服務商的定價策略都得重算。因為 Token 成本一下掉這麼多，API 價格、上下文長度、免費額度都可能跟著調整。\u003C\u002Fp>\u003Cp>再來是 MoE 訓練。NVIDIA 說，同級模型可用 4 倍更少的 GPU。這點很重要，因為現在很多大模型都在用 MoE 架構。原因很簡單，參數可以做大，但每次只啟用部分專家，算力比較省。若 Rubin 真的能把訓練叢集縮小到這種程度，機房規劃會輕鬆很多。\u003C\u002Fp>\u003Cul>\u003Cli>推論 Token 成本：官方稱最高比 Blackwell 低 10 倍。\u003C\u002Fli>\u003Cli>MoE 訓練 GPU 數量：官方稱可比 Blackwell 少 4 倍。\u003C\u002Fli>\u003Cli>組裝與維修速度：模組化無線纜托盤設計，官方稱最高快 18 倍。\u003C\u002Fli>\u003Cli>Spectrum-X Ethernet Photonics：官方稱電力效率與 uptime 可提升 5 倍。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這些數字放在一起看，你會發現買家評估方式也在變。以前大家很愛問單卡多少 TFLOPS，現在更常問整櫃能吐多少 Token、耗多少電、壞一台要修多久、管理軟體順不順。NVIDIA 很清楚這點，所以 Rubin 直接把網路、儲存、安全、管理全部包進來。\u003C\u002Fp>\u003Cp>還有一個戰略層面的重點。Hyperscaler 自研晶片一直在進步，Google 有 TPU，AWS 有 Trainium 和 Inferentia，Microsoft 也有 Maia。這些產品都在分食市場。NVIDIA 的優勢，越來越不是單點晶片性能，而是整套系統整合能力。\u003C\u002Fp>\u003Cp>我覺得這也是 Rubin 最狠的地方。當性能表現越來越依賴 CPU、GPU、交換器、NIC、DPU 和軟體怎麼配合，客戶就更難隨便混搭替代方案。你當然可以自己拼，但時間成本、驗證成本、效能損失都可能很痛。\u003C\u002Fp>\u003Ch2>誰會先買單，競爭對手又在哪\u003C\u002Fh2>\u003Cp>NVIDIA 公布了一長串合作夥伴名單。AWS、Google、Microsoft、Meta、OpenAI、Anthropic、Oracle、Dell、HPE、Lenovo、CoreWeave、xAI 都在上面。這份名單的意義，不是比人氣，而是告訴市場，大買家現在還是照著 NVIDIA 路線圖排產能。\u003C\u002Fp>\u003Cp>Microsoft 這次給的訊息算具體。NVIDIA 表示，Microsoft 下一代 Fairwater AI superfactories 會採用 Vera Rubin NVL72，規模上看數十萬顆 Vera Rubin Superchips。若進度沒拖，Rubin 很快就會進入市場上最大的 AI 叢集之一。\u003C\u002Fp>\u003Cp>CoreWeave 也說，會透過 Mission Control 平台提供 Rubin。這件事值得看。因為 neocloud 通常比傳統企業供應商更快導入新硬體。若有人想早點試 Rubin 跑推論，CoreWeave 這類業者很可能會是第一批真實戰場。\u003C\u002Fp>\u003Cul>\u003Cli>NVIDIA：優勢在 CUDA、生態系、整櫃交付能力。\u003C\u002Fli>\u003Cli>Google TPU：自家服務整合強，但外部採購彈性有限。\u003C\u002Fli>\u003Cli>AWS Trainium \u002F Inferentia：雲端成本控制有優勢，軟體遷移門檻較高。\u003C\u002Fli>\u003Cli>AMD Instinct：硬體追得快，但整體生態和部署規模仍在追趕。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>Red Hat 和 NVIDIA 的合作也不能忽略。很多企業導入 AI，最後卡的不是晶片規格，而是 Linux 支援、容器編排、隔離機制、生命週期管理這些很無聊但很重要的細節。沒有這層軟體，Rubin 很難從超大模型實驗室，擴散到更廣的企業市場。\u003C\u002Fp>\u003Cp>對競爭對手來說，Rubin 的麻煩點在於它把戰場往上拉。以前大家還能在加速卡這層對打，現在 NVIDIA 要比的是整個 rack-scale system。你若沒有完整網路、DPU、軟體、維運工具，就很難用單點產品跟它打。\u003C\u002Fp>\u003Cp>不過這也不是說 Rubin 一定穩贏。NVIDIA 的平台越完整，客戶鎖定風險也越高。大型雲端業者不會喜歡把命脈全交給單一供應商。所以接下來幾年，市場很可能會出現一種矛盾狀態：一邊大量採購 NVIDIA，一邊拼命投資自研晶片和替代方案。\u003C\u002Fp>\u003Ch2>背後的產業脈絡：AI 基礎設施正在機櫃化\u003C\u002Fh2>\u003Cp>如果把時間拉長來看，Rubin 不是突然冒出來的產品。它延續了 NVIDIA 這幾年的一條主線：把 AI 基礎設施的銷售單位，從單卡變成伺服器，再從伺服器變成機櫃。接下來，甚至可能直接用資料中心 pod 當單位來賣。\u003C\u002Fp>\u003Cp>這樣做的原因很現實。AI 叢集規模越大，系統層問題越多。你今天多塞幾十張卡，不代表吞吐就線性上升。散熱、供電、交換器拓撲、線材管理、故障隔離，每一項都可能拖慢部署。整櫃方案雖然比較綁，但能把很多工程麻煩前置處理。\u003C\u002Fp>\u003Cp>對台灣供應鏈來說，這波變化很值得注意。過去伺服器代工是核心，現在散熱、液冷、機櫃、背板、電源、光通訊的角色都變重。因為當客戶買的是整櫃 AI 系統，零組件廠的價值就不再只看單價，而是看能不能穩定交付和維修。\u003C\u002Fp>\u003Cp>另一個背景是推論工作負載真的在變。以前聊天機器人生成幾百個 Token 就算多，現在很多 agent 會做多輪推理、查工具、拉文件、再回頭整理答案。每次都在燒 Token，也在燒頻寬和快取。這種工作負載，剛好就是 Rubin 鎖定的場景。\u003C\u002Fp>\u003Cp>還有電力問題。大型 AI 叢集現在最常見的抱怨，不是買不到 GPU，而是資料中心沒足夠電力和散熱餘裕。若 Rubin 的整體效率真能接近官方說法，那它的價值就不只是更快，而是讓同一座機房能塞進更多有效產出。這對雲端業者非常重要。\u003C\u002Fp>\u003Cp>當然，官方數字永遠要保留一點懷疑。10 倍 Token 成本改善聽起來很猛，但實際結果會受模型大小、量化方式、batching、快取命中率、網路配置影響。不同客戶跑出來的數字，可能差很多。這也是為什麼第一批部署案例特別值得追。\u003C\u002Fp>\u003Ch2>我的看法：2027 容量規劃會先被改寫\u003C\u002Fh2>\u003Cp>我覺得 Rubin 第一波還是會先進 hyperscaler、模型公司，還有資金夠厚的雲端服務商。企業市場不會這麼快全面跟上，因為價格、供貨、軟體支援都要時間穩定。真正比較有機會碰到 Rubin 的一般開發者，可能還是先透過雲端 API 或租用平台。\u003C\u002Fp>\u003Cp>但如果 NVIDIA 的 10 倍 Token 成本說法，最後能做到 5 倍左右，市場就已經會很有感。很多原本照 Blackwell 規劃的 2027 年容量模型，可能今年就要重算。因為推論成本一旦往下掉，大家第一反應通常不是省錢，而是把模型開得更大、上下文拉得更長、服務賣得更便宜。\u003C\u002Fp>\u003Cp>如果你是開發者，我的建議很簡單。先別急著看 petaflops 這種漂亮數字。你更該盯的是 Token 成本、長上下文延遲、KV cache 管理、網路拓撲，還有供應商能不能穩定交付。接下來一年，AI 基礎設施的勝負，八成會在這些細節上分出來。\u003C\u002Fp>\u003Cp>如果你是企業採購，問題也很直接。你要的是最強單卡，還是最省事的整櫃。你能接受多高的供應商綁定。你有沒有能力自己整合替代方案。這些問題，現在就該開始問，別等到 2026 下半年產品真的開賣才手忙腳亂。\u003C\u002Fp>\u003Cp>Rubin 這次傳達的訊號很清楚。AI 硬體競爭，已經不只是晶片規格表大戰。接下來比的是誰能把整個系統做得更能賺錢、更好維修、更容易擴張。NVIDIA 現在押的，就是這一局。\u003C\u002Fp>","NVIDIA 在 CES 2026 端出 Rubin 平台，主打推論 Token 成本最高可比 Blackwell 低 10 倍，MoE 訓練可少用 4 倍 GPU。重點不只是一顆新 GPU，而是把 CPU、網路、DPU、交換器整包賣成機櫃級 AI 系統。","nvidianews.nvidia.com","https:\u002F\u002Fnvidianews.nvidia.com\u002Fnews\u002Frubin-platform-ai-supercomputer",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1774516131100-fn1e.png","model-release","zh","d4cffde7-9b50-4cc7-bb68-8bc9e3b15477",[17,18,19,20,21,22,23,24,25,26],"NVIDIA","Rubin","Blackwell","AI推論","MoE","NVLink","BlueField-4","Vera Rubin NVL72","GPU","資料中心",8,"2026-03-26T07:18:45.861277+00:00","2026-03-26T09:09:13.755+00:00",{"tags":31,"relatedLang":50,"relatedPosts":54},[32,34,37,40,42,44,46,48],{"name":18,"slug":33},"rubin",{"name":35,"slug":36},"Nvidia","nvidia",{"name":38,"slug":39},"研究整理","-",{"name":25,"slug":41},"gpu",{"name":22,"slug":43},"nvlink",{"name":20,"slug":45},"ai推論",{"name":23,"slug":47},"bluefield-4",{"name":24,"slug":49},"vera-rubin-nvl72",{"id":15,"slug":51,"title":52,"language":53},"nvidia-rubin-ai-supercomputer-en","NVIDIA Unveils Rubin: A Leap in AI Supercomputing","en",[55,61,67,73,79,85],{"id":56,"slug":57,"title":58,"cover_image":59,"image_url":59,"created_at":60,"category":13},"466021f3-b8a4-4ecb-ad64-8070beaf9cbc","gemini-1-5-pro-002-flash-002-2-0-flash-update-zh","Gemini 1.5 與 2.0 Flash 更新上線","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780999389960-97qh.png","2026-06-09T10:02:27.849751+00:00",{"id":62,"slug":63,"title":64,"cover_image":65,"image_url":65,"created_at":66,"category":13},"66ce4542-3c93-4a0c-ab52-5e6f90a36212","minimax-m3-kai-fang-quan-zhong-xie-cheng-shi-reng-neng-ying-zh","MiniMax M3 證明開放權重在寫程式上仍能贏","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780968786191-lele.png","2026-06-09T01:32:30.829528+00:00",{"id":68,"slug":69,"title":70,"cover_image":71,"image_url":71,"created_at":72,"category":13},"948a7dc4-b172-42f9-9bef-abcbbffaca18","gemini-35-flash-pricing-benchmarks-zh","Gemini 3.5 Flash 價格與長上下文解析","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780840978961-6b9n.png","2026-06-07T14:02:29.835438+00:00",{"id":74,"slug":75,"title":76,"cover_image":77,"image_url":77,"created_at":78,"category":13},"5507f140-5223-4f68-ade6-30d9e5457638","gemma-4-12b-specs-benchmarks-run-locally-zh","怎麼做 Gemma 4 12B 本地部署","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780777971165-4bit.png","2026-06-06T20:32:24.857611+00:00",{"id":80,"slug":81,"title":82,"cover_image":83,"image_url":83,"created_at":84,"category":13},"ef42a437-8b06-4ff5-a135-ece7662c01f4","best-kimi-models-2026-k2-5-vs-k2-thinking-zh","2026 最佳 Kimi 模型：K2.5 對 K2 Thinking","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780770790333-x3lk.png","2026-06-06T18:32:39.410186+00:00",{"id":86,"slug":87,"title":88,"cover_image":89,"image_url":89,"created_at":90,"category":13},"fd2ad557-5c09-4758-964d-cda1c3c87a4c","kimi-k2-6-open-source-coding-agent-swarm-zh","Kimi K2.6 開源加上 Agent Swarm","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780761795960-0zg9.png","2026-06-06T16:02:21.702099+00:00",[92,93,98,103,108,113,118,123,128,133],{"id":4,"slug":5,"title":6,"created_at":28},{"id":94,"slug":95,"title":96,"created_at":97},"0dcc2c61-c2a6-480d-adb8-dd225fc68914","march-2026-ai-model-news-what-mattered-zh","2026 年 3 月 AI 模型新聞重點","2026-03-26T07:32:08.386348+00:00",{"id":99,"slug":100,"title":101,"created_at":102},"214ab08b-5ce5-4b5c-8b72-47619d8675dd","why-small-models-are-winning-on-device-ai-zh","小模型為何吃下裝置端 AI","2026-03-26T07:36:30.488966+00:00",{"id":104,"slug":105,"title":106,"created_at":107},"785624b2-0355-4b82-adc3-de5e45eecd88","midjourney-v8-faster-images-higher-costs-zh","Midjourney V8 變快了，也變貴了","2026-03-26T07:52:03.562971+00:00",{"id":109,"slug":110,"title":111,"created_at":112},"cda76b92-d209-4134-86c1-a60f5bc7b128","xiaomi-mimo-trio-agents-robots-voice-zh","小米 MiMo 三模型瞄準代理、機器人與語音","2026-03-28T03:05:08.779489+00:00",{"id":114,"slug":115,"title":116,"created_at":117},"9e1044b4-946d-47fe-9e2a-c2ee032e1164","xiaomi-mimo-v2-pro-1t-moe-agents-zh","小米 MiMo-V2-Pro 登場：1T MoE 模型","2026-03-28T03:06:19.002353+00:00",{"id":119,"slug":120,"title":121,"created_at":122},"c4b6186f-bd84-4598-997e-c6e31d543c0d","cursor-composer-2-agentic-coding-model-zh","Cursor Composer 2 走向代理式寫碼","2026-03-28T03:13:06.422716+00:00",{"id":124,"slug":125,"title":126,"created_at":127},"e112e76f-ec3b-408f-810e-e93ae21a888a","apple-siri-gemini-distilled-models-zh","Apple Siri 牽手 Gemini 的真相","2026-03-29T04:52:57.886544+00:00",{"id":129,"slug":130,"title":131,"created_at":132},"c679b51f-194a-463b-87fc-7695256ff752","mimo-v2-pro-vs-omni-vs-flash-2026-zh","MiMo V2 Pro、Omni、Flash 怎麼選","2026-04-02T01:18:43.576128+00:00",{"id":134,"slug":135,"title":136,"created_at":137},"3b988fd7-6749-4f01-ba25-c0ad7486dc31","z-ai-glm-5v-turbo-design2code-claude-zh","GLM-5V-Turbo 在 Design2Code 贏了…","2026-04-02T04:03:36.31741+00:00"]