5 個開源 LLM：寫程式與成本

OraCore Editors

返回首頁

[IND] 2026年5月25日4 分鐘閱讀OraCore 編輯部

5 個開源 LLM：寫程式與成本

5 個開源 LLM 依寫程式、推理、速度、上下文與價格排序，附 2026 即時基準與選型建議。

benchmark open source LLM token speed context window coding model

分享 LinkedIn

這份清單比較 5 個開源 LLM，幫你快速選出最適合寫程式、長上下文或省成本的模型。

更新到 2026 年 4 月後，你可以用這份排行在 5 個 open-weight 模型中做決策，先看整體品質，再看速度、上下文與價格，避免只靠印象挑模型。

項目	Quality Index	Best Price	Top Speed	Max Context
Qwen3.7 Max	56.584	$3.75/M	202 tok/s	991K
Kimi K2.6	53.905	$1.44/M	327 tok/s	262K
MiMo-V2.5-Pro	53.829	$1.20/M	88 tok/s	1M
DeepSeek V4 Pro	51.509	$0.54/M	159 tok/s	1M
MiniMax-M2.7	49.615	$0.52/M	446 tok/s	205K

1. Qwen3.7 Max：整體品質最佳

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

Qwen3.7 Max 以 56.584 的 Quality Index 領先這份榜單，適合想先找「一個模型就能先上線」的團隊。它的 202 tok/s 與 991K context 也很實用，長提示、長文件與多輪工作都能撐得住。

Best price: $3.75/M
Top speed: 202 tok/s
Max context: 991K
適合把品質放在第一順位的寫程式與推理工作

代價是價格偏高。如果你的流量大、預算緊，這顆不一定最省，但它最像「先求穩，再談優化」的選擇，特別適合評估期或核心產品流程。

2. Kimi K2.6：速度與供應來源最彈性

Kimi K2.6 的 Quality Index 是 53.905，雖然不是第一名，但它以 327 tok/s 成為這組裡最快的模型，而且出現在 14 家供應商，部署與比價都更方便。

Best price: $1.44/M
Top speed: 327 tok/s
Max context: 262K
Providers: 14

如果你在意延遲、供應穩定性，或想在不同平台間切換，這是很實際的選項。它的上下文不算最大，但對多數互動式應用已經夠用。

3. MiMo-V2.5-Pro：長文件與大上下文首選

MiMo-V2.5-Pro 提供 1M token 的上下文窗口，最適合大型規格書、長篇研究、log 分析與多檔案程式任務。它的 Quality Index 53.829 也維持在高位，不會為了長上下文掉太多分數。

Best price: $1.20/M
Top speed: 88 tok/s
Max context: 1M
適合文件密集、檔案很多的工作流

缺點是速度較慢，88 tok/s 不適合追求即時回應的高頻對話。但如果你的痛點是上下文不夠，這顆通常比再加複雜分段流程更簡單。

4. DeepSeek V4 Pro：大規模使用的低成本解

DeepSeek V4 Pro 的價格只有 $0.54/M，在這份清單裡屬於最省錢的主力之一。它的 Quality Index 51.509 不差，還有 159 tok/s 與 1M context，能兼顧成本與實用性。

Best price: $0.54/M
Top speed: 159 tok/s
Max context: 1M
適合重視單位成本的 production workload

如果你的用量大、預算固定，這種模型通常最容易算帳。它不是榜首，但在長上下文與低費率之間取得了很好的平衡，適合長期跑量。

5. MiniMax-M2.7：最便宜的高速選項

MiniMax-M2.7 同時拿到最低價格 $0.52/M 與最高速度 446 tok/s，對高頻聊天、路由、輕量助理很有吸引力。它的 Quality Index 49.615 較低，但仍可應付多數日常任務。

Best price: $0.52/M
Top speed: 446 tok/s
Max context: 205K
Providers: 6

這顆適合把「快」和「便宜」放在前面的人。若你要的是大量請求下的穩定吞吐，而不是最高 benchmark，它會是很務實的候選。

怎麼挑

想先選一顆全能型模型，就從 Qwen3.7 Max 開始；想要更快、供應商更多，選 Kimi K2.6；如果你的工作常常是長文件或長程式碼脈絡，MiMo-V2.5-Pro 最合適。要壓低成本，DeepSeek V4 Pro 和 MiniMax-M2.7 會更容易過預算。

如果你是做本地部署或 Ollama 類型環境，硬體限制會直接影響體驗。這時候先看 VRAM、可接受的延遲與上下文需求，再用這份排行縮小候選名單。

// 相關文章

5 個開源 LLM：寫程式與成本

1. Qwen3.7 Max：整體品質最佳

訂閱 AI 趨勢週報

2. Kimi K2.6：速度與供應來源最彈性

3. MiMo-V2.5-Pro：長文件與大上下文首選

4. DeepSeek V4 Pro：大規模使用的低成本解

5. MiniMax-M2.7：最便宜的高速選項

怎麼挑

Gemini 進入 Apple 開發堆疊

5 款 AI 編程 IDE，按工作流挑最省事

Devin Desktop 把 Windsurf 變成代理中樞

韓國與 Nvidia 對話，重點是 AI 工廠

OpenAI 不該為了搶 AI 賽道而急著 IPO

OpenAI 歐洲隱私政策更新重點