[IND] 4 分鐘閱讀OraCore 編輯部

Kimi 模型正在快速變大

Moonshot AI 的 Kimi 系列已走到 1 兆參數、256K 上下文,Kimi K2.5 也加入視覺能力,速度很快。

分享 LinkedIn
Kimi 模型正在快速變大

Moonshot AIKimi 系列已經做到 1 兆參數、256K 上下文,Kimi K2.5 也加上視覺能力。

Moonshot AI 從 2023 年 3 月在北京成立,到現在只花不到 3 年。它已經變成中國 AI 圈最常被盯著看的公司之一。講白了,這家公司走得很快,Kimi 模型也跟著長很快。

這次的重點很直接。Kimi K2.5 把視覺能力拉進來。前一版 Kimi K2 已經有 1 兆參數。現在再往上加,路線很明確,就是往更大、更長、更全能走。

項目數字意義
公司成立時間2023 年 3 月成長速度很快
Kimi K2 參數1 兆模型規模已進入超大級別
上下文長度256K可處理更長文件與對話
Kimi K2.5加入視覺能力開始走多模態路線

Kimi 為什麼一直往上加

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

先講結論。這不是單純比誰參數大。Moonshot AI 在做的是把長上下文、工具使用、推理和視覺,全部塞進同一條產品線。對開發者來說,這比只看 benchmark 分數更實際。

Kimi 模型正在快速變大

你可能會想問,1 兆參數到底有多誇張。講白了,這代表訓練、推理、部署都更吃資源。模型一大,伺服器壓力就上來,成本也不會客氣。這也是為什麼很多團隊會先做小模型,再慢慢往上堆。

Kimi 的策略比較兇。它不是只做聊天機器人,而是把長文件整理、程式輔助、圖片理解一起包進去。這種做法很像在搶「工作入口」,不是只搶一個聊天框。

  • 1 兆參數,代表模型容量很大。
  • 256K 上下文,適合長文件。
  • K2.5 加視覺,開始走多模態。
  • 產品定位更像通用 AI 工具。

這條路線和其他模型差在哪

GPT-4ClaudeGemini 來看,大家都在往長上下文和多模態走。差別在節奏。Moonshot AI 這邊的動作很密,幾乎是一路往上推。

對比之下,很多模型會把重點放在推理或成本。Kimi 比較像是先把能力堆滿,再看怎麼落地。這種打法有風險,因為模型越大,延遲和價格越難壓。但它也有好處,就是容易吸引重度使用者。

如果你是開發者,會很在意三件事。第一是 API 穩不穩。第二是上下文到底能不能真的吃滿。第三是視覺能力是不是只是 demo,而是真的能進工作流。這三個問題,比「模型很大」更重要。

  • GPT-4 強在生態和產品整合。
  • Claude 很會處理長文和寫作。
  • Gemini 在多模態整合很積極。
  • Kimi K2.5 則是把規模和視覺一起推上去。
"There is no free lunch." — Leslie Valiant

這句話很適合拿來看大模型。模型變大,不代表一切都變好。它只代表你把問題往別的地方搬。訓練更貴,推理更慢,部署更麻煩,這些都要有人買單。

Moonshot AI 走這條路,等於是先把上限拉高。接下來就看它能不能把成本壓下來,還能維持體驗。這才是最硬的地方。

數字背後是什麼競爭

中國 AI 市場的節奏很快。BaiduAlibaba CloudTencent Cloud 都有自己的模型路線。Moonshot AI 要在這裡站住腳,不能只靠聲量。

Kimi 模型正在快速變大

256K 上下文是很實用的賣點。對法務、研究、程式碼庫、產品規格書,這種長文件場景很有用。很多團隊不是缺聊天功能,是缺能一次吃下整包資料的模型。

但大模型競爭很現實。你要看價格、延遲、穩定度、錯誤率,還有 API 文件寫得好不好。少一項都會影響導入。說真的,很多模型死在文件太爛,不是死在能力不夠。

  • 參數大,不等於最好用。
  • 長上下文對企業場景很重要。
  • 視覺能力能擴大使用場景。
  • API 和價格才是導入關鍵。

這家公司現在站在哪裡

Moonshot AI 的成長很像中國新創圈的縮影。先用一個能打的產品切進市場,再靠模型升級維持聲量。這套路不新,但執行得快,就能搶到注意力。

台灣開發者來說,這件事也有參考價值。你要做 AI 產品,不一定一開始就拚最大模型。先看資料來源、工作流程、成本結構,再決定要不要接大模型。很多時候,模型只是最後一塊拼圖。

如果 Kimi K2.5 真的把視覺、長文、推理整合得夠順,它會逼其他廠商加速更新。反過來說,如果體驗跟不上,參數再大也只是數字遊戲。市場很現實,使用者也不吃這套。

接下來該看什麼

我覺得下一步不是看它又多了幾個參數,而是看它的 API、價格和延遲。這三個數字一出來,大家就知道它是不是能進真實專案。

如果你在評估模型,先拿你的文件、圖片、程式碼去測。不要只看 demo。真正的答案,通常藏在你的資料裡,不在發表頁面上。

Moonshot AI 已經把 Kimi 推到很大。接下來最值得追的,不是它會不會再長,而是它能不能把這些能力變成穩定、便宜、可用的服務。