[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-run-minimax-m3-locally-unsloth-studio-zh":3,"article-related-run-minimax-m3-locally-unsloth-studio-zh":30,"series-tools-83ab893d-aa71-481a-bf79-413e19f9cb41":75},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":22,"views":26,"created_at":27,"published_at":28,"topic_cluster_id":29},"83ab893d-aa71-481a-bf79-413e19f9cb41","run-minimax-m3-locally-unsloth-studio-zh","本機跑 MiniMax M3 的 Unsloth Studio 指南","\u003Cp data-speakable=\"summary\">這篇教你在自己的電腦上安裝 Unsloth Studio、下載 MiniMax M3 的 GGUF 量化檔，並成功開啟本機聊天介面。\u003C\u002Fp>\u003Cp>這篇給想把 MiniMax M3 跑在本機，而不是依賴託管 \u003Ca href=\"\u002Ftag\u002Fapi\">API\u003C\u002Fa> 的開發者。照著做完，你會拿到一套可在瀏覽器操作的 Unsloth Studio、本機可用的 MiniMax M3 聊天頁面，以及可直接重複執行的下載與啟動流程。\u003C\u002Fp>\u003Cp>你也會知道不同 quant 的記憶體門檻、在 macOS \u002F Windows \u002F Linux \u002F WSL 上的啟動方式，以及什麼時候該改走 llama.cpp CLI。本文以 \u003Ca href=\"https:\u002F\u002Funsloth.ai\u002Fdocs\u002Fmodels\u002Fminimax-m3\">Unsloth MiniMax M3 文件\u003C\u002Fa>與 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Funslothai\u002Funsloth\">Unsloth GitHub\u003C\u002Fa> 的現行內容為準。\u003C\u002Fp>\u003Ch2>開始之前\u003C\u002Fh2>\u003Cul>\u003Cli>已能存取 Unsloth MiniMax M3 文件與 Unsloth GitHub 倉庫。\u003C\u002Fli>\u003Cli>Python 3.10+ 已安裝完成，並可在終端機執行。\u003C\u002Fli>\u003Cli>可用的終端機工具包含 curl、PowerShell 或 bash。\u003C\u002Fli>\u003Cli>至少 133 GB 可用記憶體，才能先嘗試最小的 1-bit quant。\u003C\u002Fli>\u003Cli>若要用 GPU，加速環境需有 CUDA 相容的 NVIDIA 硬體；Apple Silicon 則需要 macOS 與 unified memory。\u003C\u002Fli>\u003Cli>磁碟空間要先預留，例如 UD-IQ1_M 約 128 GB、UD-IQ4_XS 約 208 GB。\u003C\u002Fli>\u003Cli>瀏覽器可開啟 127.0.0.1:8888 的本機介面。\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>Step 1: 安裝 Unsloth Studio\u003C\u002Fh2>\u003Cp>目的：先把支援 MiniMax M3 的 Studio 裝好，讓後續下載與載入\u003Ca href=\"\u002Fnews\u002Fgithub-last30days-skill-ai-research-model-zh\">模型\u003C\u002Fa>都能在同一個介面完成。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781759883897-uij8.png\" alt=\"本機跑 MiniMax M3 的 Unsloth Studio 指南\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>在終端機執行官方安裝指令。macOS、Linux、WSL 可用 shell installer，Windows 則用 PowerShell installer。\u003C\u002Fp>\u003Cpre>\u003Ccode>curl -fsSL https:\u002F\u002Funsloth.ai\u002Finstall.sh | sh\u003C\u002Fcode>\u003C\u002Fpre>\u003Cp>Windows PowerShell 版本如下：\u003C\u002Fp>\u003Cpre>\u003Ccode>irm https:\u002F\u002Funsloth.ai\u002Finstall.ps1 | iex\u003C\u002Fcode>\u003C\u002Fpre>\u003Cp>你應該看到安裝完成，且 \u003Ccode>unsloth\u003C\u002Fcode> 指令已可在 shell 中使用。\u003C\u002Fp>\u003Ch2>Step 2: 啟動本機 Studio 服務\u003C\u002Fh2>\u003Cp>目的：把 Unsloth Studio 跑在 localhost，讓你用瀏覽器管理模型，而不是只靠命令列。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781759890065-d8tu.png\" alt=\"本機跑 MiniMax M3 的 Unsloth Studio 指南\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>啟動 8888 埠的 Studio 服務。若你的環境需要不同綁定位址，也可以改成相同格式的 host 與 port。\u003C\u002Fp>\u003Cpre>\u003Ccode>unsloth studio -H 0.0.0.0 -p 8888\u003C\u002Fcode>\u003C\u002Fpre>\u003Cp>接著在瀏覽器開啟 \u003Ccode>http:\u002F\u002F127.0.0.1:8888\u003C\u002Fcode>。第一次進入時，建立密碼並重新登入。\u003C\u002Fp>\u003Cp>你應該看到 Studio 儀表板，並在登入後進入主介面。\u003C\u002Fp>\u003Ch2>Step 3: 下載 MiniMax M3 量化檔\u003C\u002Fh2>\u003Cp>目的：先抓一個你的機器真正裝得下的 MiniMax M3 quant，降低第一次載入失敗的機率。\u003C\u002Fp>\u003Cp>在 Studio 的 Chat 分頁搜尋 MiniMax M3，然後選擇 quant。文件建議先從 UD-IQ1_M 開始，再依記憶體預算往上選 UD-IQ3_XXS、UD-IQ4_XS 或 UD-Q4_K_XL。\u003C\u002Fp>\u003Cp>目前這條 GGUF \u003Ca href=\"\u002Fnews\u002Fanthropic-paid-ai-monetization-path-zh\">路徑\u003C\u002Fa>屬於實驗性版本，且本機版本是文字輸出為主，所以不要期待原生多模態輸入或 MiniMax Sparse Attention 已完整可用。\u003C\u002Fp>\u003Cp>你應該看到下載進度完成，並且選定的 quant 出現在本機模型清單中。\u003C\u002Fp>\u003Ch2>Step 4: 用建議參數開啟對話\u003C\u002Fh2>\u003Cp>目的：用穩定的預設值先跑通第一輪推理，確認模型載入與回應都正常。\u003C\u002Fp>\u003Cp>MiniMax 建議 temperature 設為 1.0、top_p 設為 0.95、top_k 設為 40。Studio 通常可以自動套用，也可以手動調整成你要的生成風格。\u003C\u002Fp>\u003Cp>先把 context 長度控制在你硬體能承受的範圍。模型規格雖然支援到 1,048,576 tokens，但太長的 context 會快速吃掉記憶體。\u003C\u002Fp>\u003Cp>你應該看到模型在 Studio chat 面板中，根據你的 prompt 正常回覆。\u003C\u002Fp>\u003Ch2>Step 5: 對照記憶體門檻\u003C\u002Fh2>\u003Cp>目的：用實際數字挑對 quant，避免因為 RAM、VRAM 或 unified memory 不足而直接 OOM。\u003C\u002Fp>\u003Cp>文件列出的最小 1-bit quant，磁碟需求約 128 GB，而總記憶體建議至少 133 GB，這是為了保留 \u003Ca href=\"\u002Ftag\u002Fkv-cache\">KV cache\u003C\u002Fa> 與 context 配額。更大的 quant 需要更多餘裕，所以檔案大小只代表最低門檻，不代表一定載得動。\u003C\u002Fp>\u003Cp>如果你的機器接近 256 GB 或 512 GB 級別，可以考慮 UD-IQ4_XS 或 UD-Q4_K_XL 來換取較好的輸出品質。若你的硬體較小，就維持 UD-IQ1_M，並縮短 context。\u003C\u002Fp>\u003Cp>你應該看到模型成功載入，且生成時介面仍保持可操作。\u003C\u002Fp>\u003Ctable>\u003Cthead>\u003Ctr>\u003Cth>指標\u003C\u002Fth>\u003Cth>基準／優化前\u003C\u002Fth>\u003Cth>結果／優化後\u003C\u002Fth>\u003C\u002Ftr>\u003C\u002Fthead>\u003Ctbody>\u003Ctr>\u003Ctd>模型權重大小\u003C\u002Ftd>\u003Ctd>BF16 約 855 GB\u003C\u002Ftd>\u003Ctd>1-bit GGUF 約 128 GB\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>磁碟縮減\u003C\u002Ftd>\u003Ctd>完整精度權重\u003C\u002Ftd>\u003Ctd>約縮小 85%\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>最小 quant 所需記憶體\u003C\u002Ftd>\u003Ctd>不足以容納 KV cache\u003C\u002Ftd>\u003Ctd>建議至少 133 GB 總記憶體\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>Context window\u003C\u002Ftd>\u003Ctd>一般短上下文模型\u003C\u002Ftd>\u003Ctd>規格支援到 1,048,576 tokens\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>SWE-Bench Pro 分數\u003C\u002Ftd>\u003Ctd>不同本機模型表現不一\u003C\u002Ftd>\u003Ctd>MiniMax M3 報告為 59%\u003C\u002Ftd>\u003C\u002Ftr>\u003C\u002Ftbody>\u003C\u002Ftable>\u003Ch2>Step 6: 改用 llama.cpp CLI\u003C\u002Fh2>\u003Cp>目的：當你想控制快取位置、執行緒數或 \u003Ca href=\"\u002Ftag\u002Fgpu\">GPU\u003C\u002Fa> offload 時，改用 llama.cpp 走命令列流程。\u003C\u002Fp>\u003Cp>先 clone 指定分支，接著編譯 CLI 目標。若你沒有 GPU，可關閉 \u003Ca href=\"\u002Ftag\u002Fcuda\">CUDA\u003C\u002Fa> 走 CPU；若是 \u003Ca href=\"\u002Ftag\u002Fapple\">Apple\u003C\u002Fa> Silicon，則保留 Metal 設定。\u003C\u002Fp>\u003Cpre>\u003Ccode>git clone https:\u002F\u002Fgithub.com\u002Fggml-org\u002Fllama.cpp\ncd llama.cpp\ngit fetch origin pull\u002F24523\u002Fhead:minimax-m3\ngit checkout minimax-m3\ncmake -B build -DGGML_CUDA=ON\ncmake --build build --config Release -j --target llama-cli llama-server\u003C\u002Fcode>\u003C\u002Fpre>\u003Cp>接著依文件設定 \u003Ccode>LLAMA_CACHE\u003C\u002Fcode>，載入 UD-IQ1_M quant，也可以再調 \u003Ccode>--threads\u003C\u002Fcode>、\u003Ccode>--ctx-size\u003C\u002Fcode>、\u003Ccode>--n-gpu-layers\u003C\u002Fcode> 來配合你的硬體。\u003C\u002Fp>\u003Cp>你應該看到 \u003Ccode>llama-cli\u003C\u002Fcode> 編譯成功，並在輸入 prompt 後印出模型回應。\u003C\u002Fp>\u003Ch2>常見錯誤\u003C\u002Fh2>\u003Cul>\u003Cli>使用較舊的 Studio 版本。修法：升級到文件指定的 v0.1.463-beta 或 2026.6.6，讓 MiniMax M3 出現在介面中。\u003C\u002Fli>\u003Cli>挑到超過記憶體上限的 quant。修法：先用 UD-IQ1_M，確認 RAM 與 VRAM 預留足夠後再往上升級。\u003C\u002Fli>\u003Cli>期待 GGUF 路徑支援多模態。修法：記住目前實驗版仍是文字輸出，MiniMax Sparse Attention 也還沒完整可用。\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>接下來可以看什麼\u003C\u002Fh2>\u003Cp>下一步可以把 Studio chat 和 llama.cpp CLI 的輸出做對照，接著在更大的 quant 或更長的 context 上測試你的硬體上限。若你要把它接進自動化流程，建議再往 Unsloth 的推理與部署文件前進，然後測試\u003Ca href=\"\u002Fnews\u002Fgithub-hottest-repos-ai-agent-tools-zh\">工具\u003C\u002Fa>呼叫與 prompt template。\u003C\u002Fp>","這篇教你在自己的電腦上安裝 Unsloth Studio、下載 MiniMax M3 的 GGUF 量化檔，並成功開啟本機聊天介面。","unsloth.ai","https:\u002F\u002Funsloth.ai\u002Fdocs\u002Fmodels\u002Fminimax-m3",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781759883897-uij8.png","tools","zh","796113f3-61af-4985-9d09-afefbd99d013",[17,18,19,20,21],"Unsloth Studio","MiniMax M3","GGUF","llama.cpp","Python 3.10+",[23,24,25],"先用 Unsloth Studio 跑起本機 Web UI，再下載 MiniMax M3 的 GGUF quant。","最小 1-bit quant 仍需要很大的記憶體預算，建議先從 UD-IQ1_M 開始。","若要更細的控制與 CLI 工作流，可以切到 llama.cpp。",0,"2026-06-18T05:17:34.558347+00:00","2026-06-18T05:17:34.546+00:00","ddbe17bf-4560-43f7-af76-3e7d6e08e601",{"tags":31,"relatedLang":34,"relatedPosts":38},[32],{"name":20,"slug":33},"llamacpp",{"id":15,"slug":35,"title":36,"language":37},"run-minimax-m3-locally-unsloth-studio-en","Run MiniMax M3 locally in Unsloth Studio","en",[39,45,51,57,63,69],{"id":40,"slug":41,"title":42,"cover_image":43,"image_url":43,"created_at":44,"category":13},"a29ee704-e539-4a39-a542-92e05ea31d0d","mistral-model-docs-deployment-manual-zh","Mistral 的模型文件不是型錄，而是部署手冊","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781770668174-orvd.png","2026-06-18T08:17:21.299483+00:00",{"id":46,"slug":47,"title":48,"cover_image":49,"image_url":49,"created_at":50,"category":13},"08ef2da8-c6ef-42bc-85ed-624ebca7cf6d","kubernetes-interviews-reveal-why-teams-adopt-it-zh","Kubernetes 導入判斷與落地清單","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781767976342-b27n.png","2026-06-18T07:32:32.150106+00:00",{"id":52,"slug":53,"title":54,"cover_image":55,"image_url":55,"created_at":56,"category":13},"a3e20ad1-0f12-4132-9645-73f000080cb6","k3s-one-command-cluster-guide-zh","K3s 讓一條指令變叢集","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781766193073-dgis.png","2026-06-18T07:02:50.251623+00:00",{"id":58,"slug":59,"title":60,"cover_image":61,"image_url":61,"created_at":62,"category":13},"6500bce4-42a7-49a7-9bb0-39f370276974","windows-docker-desktop-wsl2-install-guide-zh","Windows Docker Desktop 用 WSL 2 裝乾淨","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781737395736-eksy.png","2026-06-17T23:02:53.931722+00:00",{"id":64,"slug":65,"title":66,"cover_image":67,"image_url":67,"created_at":68,"category":13},"f3a58146-9c8e-4358-89f3-d89d9558b629","build-semantic-search-opensearch-vectors-zh","OpenSearch 向量語意搜尋實作指南","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781714880799-8f5k.png","2026-06-17T16:47:36.828153+00:00",{"id":70,"slug":71,"title":72,"cover_image":73,"image_url":73,"created_at":74,"category":13},"f87f416c-0f08-4137-b070-714cace25274","zvec-turns-local-vector-search-into-a-library-zh","Zvec 把本地向量搜尋變成函式庫","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781714028472-gvbb.png","2026-06-17T16:33:23.906632+00:00",[76,81,86,91,96,101,106,111,116,121],{"id":77,"slug":78,"title":79,"created_at":80},"855cd52f-6fab-46cc-a7c1-42195e8a0de4","surepath-real-time-mcp-policy-controls-zh","SurePath 推出即時 MCP 政策控管","2026-03-26T07:57:40.77233+00:00",{"id":82,"slug":83,"title":84,"created_at":85},"9b19ab54-edef-4dbd-9ce4-a51e4bae4ebb","mcp-in-2026-the-ai-tool-layer-teams-use-zh","2026 年 MCP：團隊真的在用的 AI 工具層","2026-03-26T08:01:46.589694+00:00",{"id":87,"slug":88,"title":89,"created_at":90},"af9c46c3-7a28-410b-9f04-32b3de30a68c","prompting-in-2026-what-actually-works-zh","2026 提示工程，真正有用的是什麼","2026-03-26T08:08:12.453028+00:00",{"id":92,"slug":93,"title":94,"created_at":95},"05553086-6ed0-4758-81fd-6cab24b575e0","garry-tan-open-sources-claude-code-toolkit-zh","Garry Tan 開源 Claude Code 工具包","2026-03-26T08:26:20.068737+00:00",{"id":97,"slug":98,"title":99,"created_at":100},"042a73a2-18a2-433d-9e8f-9802b9559aac","github-ai-projects-to-watch-in-2026-zh","2026 必看 20 個 GitHub AI 專案","2026-03-26T08:28:09.619964+00:00",{"id":102,"slug":103,"title":104,"created_at":105},"a5f94120-ac0d-4483-9a8b-63590071ac6a","claude-code-vs-cursor-2026-zh","Claude Code 與 Cursor 深度對比：202…","2026-03-26T13:27:14.279193+00:00",{"id":107,"slug":108,"title":109,"created_at":110},"0975afa1-e0c7-4130-a20d-d890eaed995e","practical-github-guide-learning-ml-2026-zh","2026 機器學習入門 GitHub 實用指南","2026-03-27T01:16:49.712576+00:00",{"id":112,"slug":113,"title":114,"created_at":115},"bfdb467a-290f-4a80-b3a9-6f081afb6dff","aiml-2026-student-ai-ml-lab-repo-review-zh","AIML-2026：像課綱的學生實驗 Repo","2026-03-27T01:21:51.467798+00:00",{"id":117,"slug":118,"title":119,"created_at":120},"80cabc3e-09fc-4ff5-8f07-b8d68f5ae545","ai-trending-github-repos-and-research-feeds-zh","AI Trending：把 AI 資源收成一張表","2026-03-27T01:31:35.262183+00:00",{"id":122,"slug":123,"title":124,"created_at":125},"3ce6e6e2-bac5-463e-9f8d-45caabcc61f7","awesome-ai-for-science-research-tools-map-zh","AI 科研工具清單，開始像地圖了","2026-03-27T01:46:50.521945+00:00"]