Kimi 模型正在快速變大

OraCore Editors

返回首頁

[IND] 2026年6月19日4 分鐘閱讀OraCore 編輯部

Kimi 模型正在快速變大

Moonshot AI 的 Kimi 系列已走到 1 兆參數、256K 上下文，Kimi K2.5 也加入視覺能力，速度很快。

Moonshot AI

分享 LinkedIn

Moonshot AI 的 Kimi 系列已經做到 1 兆參數、256K 上下文，Kimi K2.5 也加上視覺能力。

Moonshot AI 從 2023 年 3 月在北京成立，到現在只花不到 3 年。它已經變成中國 AI 圈最常被盯著看的公司之一。講白了，這家公司走得很快，Kimi 模型也跟著長很快。

這次的重點很直接。Kimi K2.5 把視覺能力拉進來。前一版 Kimi K2 已經有 1 兆參數。現在再往上加，路線很明確，就是往更大、更長、更全能走。

項目	數字	意義
公司成立時間	2023 年 3 月	成長速度很快
Kimi K2 參數	1 兆	模型規模已進入超大級別
上下文長度	256K	可處理更長文件與對話
Kimi K2.5	加入視覺能力	開始走多模態路線

Kimi 為什麼一直往上加

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

先講結論。這不是單純比誰參數大。Moonshot AI 在做的是把長上下文、工具使用、推理和視覺，全部塞進同一條產品線。對開發者來說，這比只看 benchmark 分數更實際。

你可能會想問，1 兆參數到底有多誇張。講白了，這代表訓練、推理、部署都更吃資源。模型一大，伺服器壓力就上來，成本也不會客氣。這也是為什麼很多團隊會先做小模型，再慢慢往上堆。

Kimi 的策略比較兇。它不是只做聊天機器人，而是把長文件整理、程式輔助、圖片理解一起包進去。這種做法很像在搶「工作入口」，不是只搶一個聊天框。

1 兆參數，代表模型容量很大。
256K 上下文，適合長文件。
K2.5 加視覺，開始走多模態。
產品定位更像通用 AI 工具。

這條路線和其他模型差在哪

拿 GPT-4、Claude、Gemini 來看，大家都在往長上下文和多模態走。差別在節奏。Moonshot AI 這邊的動作很密，幾乎是一路往上推。

對比之下，很多模型會把重點放在推理或成本。Kimi 比較像是先把能力堆滿，再看怎麼落地。這種打法有風險，因為模型越大，延遲和價格越難壓。但它也有好處，就是容易吸引重度使用者。

如果你是開發者，會很在意三件事。第一是 API 穩不穩。第二是上下文到底能不能真的吃滿。第三是視覺能力是不是只是 demo，而是真的能進工作流。這三個問題，比「模型很大」更重要。

GPT-4 強在生態和產品整合。
Claude 很會處理長文和寫作。
Gemini 在多模態整合很積極。
Kimi K2.5 則是把規模和視覺一起推上去。

"There is no free lunch." — Leslie Valiant

這句話很適合拿來看大模型。模型變大，不代表一切都變好。它只代表你把問題往別的地方搬。訓練更貴，推理更慢，部署更麻煩，這些都要有人買單。

Moonshot AI 走這條路，等於是先把上限拉高。接下來就看它能不能把成本壓下來，還能維持體驗。這才是最硬的地方。

數字背後是什麼競爭

中國 AI 市場的節奏很快。Baidu、Alibaba Cloud、Tencent Cloud 都有自己的模型路線。Moonshot AI 要在這裡站住腳，不能只靠聲量。

256K 上下文是很實用的賣點。對法務、研究、程式碼庫、產品規格書，這種長文件場景很有用。很多團隊不是缺聊天功能，是缺能一次吃下整包資料的模型。

但大模型競爭很現實。你要看價格、延遲、穩定度、錯誤率，還有 API 文件寫得好不好。少一項都會影響導入。說真的，很多模型死在文件太爛，不是死在能力不夠。

參數大，不等於最好用。
長上下文對企業場景很重要。
視覺能力能擴大使用場景。
API 和價格才是導入關鍵。

這家公司現在站在哪裡

Moonshot AI 的成長很像中國新創圈的縮影。先用一個能打的產品切進市場，再靠模型升級維持聲量。這套路不新，但執行得快，就能搶到注意力。

對台灣開發者來說，這件事也有參考價值。你要做 AI 產品，不一定一開始就拚最大模型。先看資料來源、工作流程、成本結構，再決定要不要接大模型。很多時候，模型只是最後一塊拼圖。

如果 Kimi K2.5 真的把視覺、長文、推理整合得夠順，它會逼其他廠商加速更新。反過來說，如果體驗跟不上，參數再大也只是數字遊戲。市場很現實，使用者也不吃這套。

接下來該看什麼

我覺得下一步不是看它又多了幾個參數，而是看它的 API、價格和延遲。這三個數字一出來，大家就知道它是不是能進真實專案。

如果你在評估模型，先拿你的文件、圖片、程式碼去測。不要只看 demo。真正的答案，通常藏在你的資料裡，不在發表頁面上。

Moonshot AI 已經把 Kimi 推到很大。接下來最值得追的，不是它會不會再長，而是它能不能把這些能力變成穩定、便宜、可用的服務。

// 相關文章

Kimi 模型正在快速變大

Kimi 為什麼一直往上加

訂閱 AI 趨勢週報

這條路線和其他模型差在哪

數字背後是什麼競爭

這家公司現在站在哪裡

接下來該看什麼

Hermes Agent 的 5 個關鍵能力

Rust 6 月更新讓伺服器管理員頭痛

OpenAI IPO 前先把政策變成招募

OpenAI 延攬 Dean Ball 是對的：政策權力已是 AI 核心戰場

Rust 的滾動式支援，才是團隊真正該接受的取捨

Cloudflare 面臨董事投票壓力