[IND] 4 分鐘閱讀OraCore 編輯部

5 個開源 LLM:寫程式與成本

5 個開源 LLM 依寫程式、推理、速度、上下文與價格排序,附 2026 即時基準與選型建議。

分享 LinkedIn
5 個開源 LLM:寫程式與成本

這份清單比較 5 個開源 LLM,幫你快速選出最適合寫程式、長上下文或省成本的模型。

更新2026 年 4 月後,你可以用這份排行在 5 個 open-weight 模型中做決策,先看整體品質,再看速度、上下文與價格,避免只靠印象挑模型。

項目Quality IndexBest PriceTop SpeedMax Context
Qwen3.7 Max56.584$3.75/M202 tok/s991K
Kimi K2.653.905$1.44/M327 tok/s262K
MiMo-V2.5-Pro53.829$1.20/M88 tok/s1M
DeepSeek V4 Pro51.509$0.54/M159 tok/s1M
MiniMax-M2.749.615$0.52/M446 tok/s205K

1. Qwen3.7 Max:整體品質最佳

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

Qwen3.7 Max 以 56.584 的 Quality Index 領先這份榜單,適合想先找「一個模型就能先上線」的團隊。它的 202 tok/s 與 991K context 也很實用,長提示、長文件與多輪工作都能撐得住。

5 個開源 LLM:寫程式與成本
  • Best price: $3.75/M
  • Top speed: 202 tok/s
  • Max context: 991K
  • 適合把品質放在第一順位的寫程式與推理工作

代價是價格偏高。如果你的流量大、預算緊,這顆不一定最省,但它最像「先求穩,再談優化」的選擇,特別適合評估期或核心產品流程。

2. Kimi K2.6:速度與供應來源最彈性

Kimi K2.6 的 Quality Index 是 53.905,雖然不是第一名,但它以 327 tok/s 成為這組裡最快的模型,而且出現在 14 家供應商,部署與比價都更方便。

  • Best price: $1.44/M
  • Top speed: 327 tok/s
  • Max context: 262K
  • Providers: 14

如果你在意延遲、供應穩定性,或想在不同平台間切換,這是很實際的選項。它的上下文不算最大,但對多數互動式應用已經夠用。

3. MiMo-V2.5-Pro:長文件與大上下文首選

MiMo-V2.5-Pro 提供 1M token 的上下文窗口,最適合大型規格書、長篇研究、log 分析與多檔案程式任務。它的 Quality Index 53.829 也維持在高位,不會為了長上下文掉太多分數。

5 個開源 LLM:寫程式與成本
  • Best price: $1.20/M
  • Top speed: 88 tok/s
  • Max context: 1M
  • 適合文件密集、檔案很多的工作流

缺點是速度較慢,88 tok/s 不適合追求即時回應的高頻對話。但如果你的痛點是上下文不夠,這顆通常比再加複雜分段流程更簡單。

4. DeepSeek V4 Pro:大規模使用的低成本解

DeepSeek V4 Pro 的價格只有 $0.54/M,在這份清單裡屬於最省錢的主力之一。它的 Quality Index 51.509 不差,還有 159 tok/s 與 1M context,能兼顧成本與實用性。

  • Best price: $0.54/M
  • Top speed: 159 tok/s
  • Max context: 1M
  • 適合重視單位成本的 production workload

如果你的用量大、預算固定,這種模型通常最容易算帳。它不是榜首,但在長上下文與低費率之間取得了很好的平衡,適合長期跑量。

5. MiniMax-M2.7:最便宜的高速選項

MiniMax-M2.7 同時拿到最低價格 $0.52/M 與最高速度 446 tok/s,對高頻聊天、路由、輕量助理很有吸引力。它的 Quality Index 49.615 較低,但仍可應付多數日常任務。

  • Best price: $0.52/M
  • Top speed: 446 tok/s
  • Max context: 205K
  • Providers: 6

這顆適合把「快」和「便宜」放在前面的人。若你要的是大量請求下的穩定吞吐,而不是最高 benchmark,它會是很務實的候選。

怎麼挑

想先選一顆全能型模型,就從 Qwen3.7 Max 開始;想要更快、供應商更多,選 Kimi K2.6;如果你的工作常常是長文件或長程式碼脈絡,MiMo-V2.5-Pro 最合適。要壓低成本,DeepSeek V4 Pro 和 MiniMax-M2.7 會更容易過預算。

如果你是做本地部署或 Ollama 類型環境,硬體限制會直接影響體驗。這時候先看 VRAM、可接受的延遲與上下文需求,再用這份排行縮小候選名單。