5 個開源 LLM:寫程式與成本
5 個開源 LLM 依寫程式、推理、速度、上下文與價格排序,附 2026 即時基準與選型建議。

這份清單比較 5 個開源 LLM,幫你快速選出最適合寫程式、長上下文或省成本的模型。
更新到 2026 年 4 月後,你可以用這份排行在 5 個 open-weight 模型中做決策,先看整體品質,再看速度、上下文與價格,避免只靠印象挑模型。
| 項目 | Quality Index | Best Price | Top Speed | Max Context |
|---|---|---|---|---|
| Qwen3.7 Max | 56.584 | $3.75/M | 202 tok/s | 991K |
| Kimi K2.6 | 53.905 | $1.44/M | 327 tok/s | 262K |
| MiMo-V2.5-Pro | 53.829 | $1.20/M | 88 tok/s | 1M |
| DeepSeek V4 Pro | 51.509 | $0.54/M | 159 tok/s | 1M |
| MiniMax-M2.7 | 49.615 | $0.52/M | 446 tok/s | 205K |
1. Qwen3.7 Max:整體品質最佳
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
Qwen3.7 Max 以 56.584 的 Quality Index 領先這份榜單,適合想先找「一個模型就能先上線」的團隊。它的 202 tok/s 與 991K context 也很實用,長提示、長文件與多輪工作都能撐得住。

- Best price: $3.75/M
- Top speed: 202 tok/s
- Max context: 991K
- 適合把品質放在第一順位的寫程式與推理工作
代價是價格偏高。如果你的流量大、預算緊,這顆不一定最省,但它最像「先求穩,再談優化」的選擇,特別適合評估期或核心產品流程。
2. Kimi K2.6:速度與供應來源最彈性
Kimi K2.6 的 Quality Index 是 53.905,雖然不是第一名,但它以 327 tok/s 成為這組裡最快的模型,而且出現在 14 家供應商,部署與比價都更方便。
- Best price: $1.44/M
- Top speed: 327 tok/s
- Max context: 262K
- Providers: 14
如果你在意延遲、供應穩定性,或想在不同平台間切換,這是很實際的選項。它的上下文不算最大,但對多數互動式應用已經夠用。
3. MiMo-V2.5-Pro:長文件與大上下文首選
MiMo-V2.5-Pro 提供 1M token 的上下文窗口,最適合大型規格書、長篇研究、log 分析與多檔案程式任務。它的 Quality Index 53.829 也維持在高位,不會為了長上下文掉太多分數。

- Best price: $1.20/M
- Top speed: 88 tok/s
- Max context: 1M
- 適合文件密集、檔案很多的工作流
缺點是速度較慢,88 tok/s 不適合追求即時回應的高頻對話。但如果你的痛點是上下文不夠,這顆通常比再加複雜分段流程更簡單。
4. DeepSeek V4 Pro:大規模使用的低成本解
DeepSeek V4 Pro 的價格只有 $0.54/M,在這份清單裡屬於最省錢的主力之一。它的 Quality Index 51.509 不差,還有 159 tok/s 與 1M context,能兼顧成本與實用性。
- Best price: $0.54/M
- Top speed: 159 tok/s
- Max context: 1M
- 適合重視單位成本的 production workload
如果你的用量大、預算固定,這種模型通常最容易算帳。它不是榜首,但在長上下文與低費率之間取得了很好的平衡,適合長期跑量。
5. MiniMax-M2.7:最便宜的高速選項
MiniMax-M2.7 同時拿到最低價格 $0.52/M 與最高速度 446 tok/s,對高頻聊天、路由、輕量助理很有吸引力。它的 Quality Index 49.615 較低,但仍可應付多數日常任務。
- Best price: $0.52/M
- Top speed: 446 tok/s
- Max context: 205K
- Providers: 6
這顆適合把「快」和「便宜」放在前面的人。若你要的是大量請求下的穩定吞吐,而不是最高 benchmark,它會是很務實的候選。
怎麼挑
想先選一顆全能型模型,就從 Qwen3.7 Max 開始;想要更快、供應商更多,選 Kimi K2.6;如果你的工作常常是長文件或長程式碼脈絡,MiMo-V2.5-Pro 最合適。要壓低成本,DeepSeek V4 Pro 和 MiniMax-M2.7 會更容易過預算。
如果你是做本地部署或 Ollama 類型環境,硬體限制會直接影響體驗。這時候先看 VRAM、可接受的延遲與上下文需求,再用這份排行縮小候選名單。