Cursor Composer 2.5 為什麼這麼便宜
Cursor Composer 2.5 用 Moonshot 的 Kimi K2.5 和即時 RL,把 AI 寫程式成本壓到很低,價格差距直接衝擊 Claude 和 GPT-5.5。

Cursor Composer 2.5 用 Moonshot 的 Kimi K2.5 與即時 RL,主打低成本 AI 寫程式。
Cursor 在 2026 年 5 月 18 日推出 Cursor Composer 2.5。Standard tier 的價格是每 100 萬 input tokens 0.50 美元。對比 Anthropic 的 Claude Opus 4.7,以及 OpenAI 的 GPT-5.5,這個價差很直接。
講白了,這種價差會改變團隊怎麼花錢。長時間的 coding session、agent refactor、測試密集流程,都會變得比較敢跑。你可能會想問,Cursor 到底怎麼把價格壓這麼低。
答案很簡單。它不是從零訓練一個超大模型,而是站在 Moonshot AI 的 Kimi K2.5 上,再用自己的資料和 RL 去調。
| 模型 | 每 100 萬 input tokens | 每 100 萬 output tokens | 2M-token session 成本 |
|---|---|---|---|
| Cursor Composer 2.5 Standard | $0.50 | $2.50 | $2.20 |
| Cursor Composer 2.5 Fast | $3.00 | $15.00 | $13.20 |
| Claude Opus 4.7 | $15.00 | $75.00 | $66.00 |
| GPT-5.5 | 約 $15.00 | 約 $75.00 | 約 $66.00 |
為什麼 Cursor 能把價格壓這麼低
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
Cursor 的做法,不是自己燒錢訓練一個全新 frontier model。它先拿 Kimi K2.5 當底,再把模型調成更懂寫程式的版本。這樣一來,成本結構就跟從零訓練完全不同。

更重要的是,Cursor 本身就是編輯器和 CLI 的入口。它能看到很多真實互動資料。像是哪些 edit 被接受,哪些被退回,哪個提示詞會讓使用者繼續追問,這些訊號都很有價值。
這種資料回流很實際。模型 lab 常常只能靠大規模訓練和離線 benchmark。Cursor 則是直接看開發者怎麼用,然後把訊號丟回訓練流程。這種模式很像把產品本身變成訓練機器。
- Standard tier:每 100 萬 input tokens 0.50 美元
- Fast tier:每 100 萬 input tokens 3.00 美元
- 2026 年 5 月 25 日前有加倍使用額度的促銷
- Cursor 表示 Composer 2.5 在關鍵 coding benchmark 上接近 Opus 4.7
Kimi K2.5 到底提供了什麼
Kimi K2.5 是這整件事的底層關鍵。Moonshot 在 2026 年 1 月推出初始版本,採用修改過的 MIT license。商業使用、修改、部署都可以。只是如果服務規模超過 1 億月活,或月營收超過 2,000 萬美元,就要標註來源。
技術上,K2.5 是 Mixture of Experts 模型。總參數 1 兆,單次請求啟用 320 億參數。Moonshot 也說,它用 15 兆混合文字和圖片 tokens 訓練。這個量級很大,難怪能撐起後續的商業化調整。
Cursor 把這個底模接進自己的 tuning stack。它想要的不是最華麗的模型名聲,而是能在真實開發流程裡穩定工作。說真的,對工具型產品來說,這比空喊 benchmark 高分更有用。
“Composer 2.5 is exceptionally intelligent and up to 10x more efficient than similarly capable models.” Cursor, May 18, 2026, on X
Moonshot 也替 K2.5 做了偏長流程的設計。它的 Agent Swarm 可以把任務拆成最多 100 個 sub-agents,還能在一個 workflow 裡安排最多 1,500 次 tool calls。這對寫程式很重要,因為真正麻煩的任務常常不是一次輸出,而是一串 edit、test、fix。
Cursor 選這條路,也透露 2026 年的市場壓力。open-weight 不再只是社群玩具。它已經直接進到商業產品裡,還能拿來壓低 inference 成本。這點很現實,也很殘酷。
Cursor 怎麼用真實開發者行為訓練
Composer 2.5 最有意思的地方,是 Cursor 的即時 reinforcement learning loop。官方說,資料收集、訓練、評估、上線,一輪大約 5 小時。這個速度很快。快到模型像是在吃本週的使用資料,不是吃上季的舊資料。

它吃的不是抽象理論訊號,而是很實際的行為。像是 edit 有沒有留在 codebase 裡,使用者有沒有立刻丟出不滿的 follow-up,還有整段 session 的 latency。這些訊號很土炮,但很有效。
Cursor 在 Composer 1.5 的 A/B test 裡,說 persistent edits 提升了 2.28%,不滿 follow-up 減少 3.13%,response latency 下降 10.3%。數字不算誇張,但夠真實。對產品來說,這種改善通常比喊模型參數更有意義。
- 從資料收集到 rollout 約 5 小時
- persistent edits 提升 2.28%
- 不滿 follow-up 減少 3.13%
- response latency 下降 10.3%
但這也帶出隱私問題。Cursor 說它學的是接受與拒絕模式,不是把原始 code 當語料庫整包吞下去。話是這樣講,訊號還是來自真實 session。對企業客戶來說,這件事不能只看價格。
價格差距才是整個故事的核心
如果你的團隊常跑長 session,這個價格差真的會痛。以 70/30 的 input-output 比例來看,2 百萬 tokens 的 session,在 Composer 2.5 Standard 大約是 2.20 美元。換到 Opus 4.7 或 GPT-5.5,大概就是 66 美元。
這不是小差距。這是可以直接改變使用習慣的差距。以前團隊可能會省著用 agent,現在可能會讓它多跑幾輪 refactor 和 test。成本低,實驗空間就大。
對開發團隊來說,真正值得看的不是單價,而是整體工作流成本。模型便宜一點,整個產品就能更敢做長上下文、更敢做多輪工具調用,也更敢把 AI 放進日常開發裡。
- Composer 2.5 Standard 的 session 成本約是 frontier 模型的 3% 到 4%
- Composer 2.5 Fast 的成本約是 Opus 4.7 的 20%
- Cursor 同時掌握產品入口和訓練回路
- open-weight 底模讓這種定價策略變得可行
當然,低價不代表沒代價。用得越兇,越要看資料政策、權限控管、以及企業模式下的 privacy mode。省下來的錢,不能最後又花在資安補洞。
這對台灣開發者代表什麼
我覺得這件事很值得台灣團隊看。很多公司不是沒 AI 需求,而是被 token 成本卡住。尤其是做內部工具、測試自動化、legacy code refactor 的團隊,常常會算到不敢開大。
Cursor 這種模式會逼大家重新算帳。當模型單價下降,產品設計就會跟著變。你會看到更多 editor-native AI、更多長上下文工作流,也會看到更多公司把開發工具和模型訓練綁在一起。
產業脈絡也很清楚。過去大家比誰模型大。現在開始比誰能把真實使用資料變成訓練優勢,還能把成本壓下來。這才是 2026 年更實際的戰場。
接下來該看什麼
接下來我會盯兩件事。第一,Cursor 能不能把這套即時 RL 持續跑穩。第二,企業客戶會不會因為資料治理,選擇更貴但更可控的方案。這兩件事會直接決定 Composer 2.5 能走多遠。
如果你在選 AI coding 工具,別只看 benchmark。你應該直接問:每 1 百萬 tokens 要多少錢,資料怎麼處理,模型多久更新一次。這些問題很土,但很重要。
說真的,這種產品比拼已經不只是模型分數。它比的是成本、速度,還有誰更懂真實開發流程。這才是開發者每天會碰到的東西。