分類

模型發布

最新 AI 模型發布、基準測試與性能比較。追蹤 OpenAI、Anthropic、Google、Meta 等各家模型動態。

7月12日

GPT-5.6 把 OpenAI 變成模型選單

我拆 OpenAI GPT-5.6 的三模型分工、定價訊號和可直接套用的 routing 模板，讓你知道每種任務該丟哪一層。

7月10日

Seedream 5.0 Pro 才是可編輯 AI 圖像工作的正解

Seedream 5.0 Pro 最適合需要可編輯、可分層、具備多語文字與推理能力的 AI 圖像工作流程。

7月10日

Midjourney v8.2 釋出接近

Midjourney 表示 v8.2 已接近釋出，同時會再調整 Preview，並提到 Medical 專案有進展，但目前沒有完整更新細節。

7月10日

Tesla Model Y L 美國開賣，送FSD與充電

Tesla 在美國推出 Model Y L Launch Series，售價 61,990 美元，綁定 FSD、免費充電與 Premium Connectivity，主打六座長軸家庭電動休旅。

7月9日

Mesa 納入 Rust KRAID，Arm Mali 進入新編譯路線

Mesa 26.2 把 Rust 編寫的 KRAID shader compiler 納入 Arm Mali v9+ GPU 路徑，先從 Panfrost 與 PanVK 開始，並已通過首個 dEQP 測試。

7月9日

OpenAI 開放 GPT-5.6，聲音模型同步上線

OpenAI 將 GPT-5.6 的 Sol、Terra、Luna 開放給更多人，同步推出可邊聽邊說的 GPT-Live 口語模型，讓 ChatGPT 更像即時對話工具。

7月6日

Mistral 押注 Leanstral 走向證明工程是對的

87% 的 FATE-H 分數說明，證明工程已經不是研究室展示，而是 AI 工具真正能變成基礎設施的產品類別。

7月5日

Google 2026 年 6 月 AI 更新先押直播翻譯

Google 2026 年 6 月把 AI 重心放在即時翻譯、Android 17、NotebookLM 和開發者工具。這波更新看起來很雜，但核心很一致：把 AI 塞進通話、手機、研究和教學場景。

7月3日

Mistral Small 2603：256K 上下文很能打

Mistral Small 2603 把 256K context、每百萬 input $0.15、output $0.60 放在一起，適合長文件、工具呼叫與結構化輸出，但科學與推理基準仍有明顯天花板。

7月1日

豆包 Seed 2.1 Pro 不是追赶者，而是 Agent 时代的均衡強者

我認為 Doubao Seed 2.1 Pro 已經不是單點追分的追趕者，而是能在多模態、推理、Coding 與 Agent 工作流中穩定交付的均衡型主力模型。

7月1日

ACE-Step 1.5 證明本地音樂生成已經是產品，不是 demo

ACE-Step 1.5 證明本地音樂生成已經足夠成熟，能在速度、隱私與可控性上挑戰不少商業雲端工具。

7月1日

Sora 30座電動機首輪VTOL測試過關

Sora Aviation 完成 30 座 S-1 電動機的縮尺 VTOL 測試，下一步是 2028 年全尺寸原型首飛。這篇整理測試重點、技術難度、競品差異與商業化風險。

6月30日

Claude Tag 把 Slack 變成 AI 同事

Anthropic 推出 Claude Tag 測試版，讓 Claude 進駐 Slack 當長駐同事，並預告 Sonnet 5 與身分驗證機制。

6月30日

OpenAI自研芯片不是秀肌肉，而是英伟达的真实威胁

OpenAI的首颗自研推理芯片Jalapeño不是公关展示，而是英伟达定价权开始松动的信号，因為推理成本、供應鏈與議價權都在被重新分配。

6月30日

K3s v1.34.9 更新重點整理

K3s v1.34.9+k3s1 跟進 Kubernetes 1.34.9，並更新 Traefik、containerd、CoreDNS 等元件。這次是維運型更新，但 Traefik 介接名稱變更，升級前要先檢查設定。

6月29日

Kimi 2.7 讓價格成為真正的寫碼基準

對多數寫碼團隊來說，Kimi 2.7 比 Claude Fable 5 更值得買，因為價格與可擴用性才是實際採購基準。

6月29日

Kimi K2.6 登頂程式與代理式 AI 基準

Moonshot AI 在 2026-06-26 發布 Kimi K2.6，主打 262,144 token 長上下文、300 子代理與 4,000 步協作，並在多項程式與代理式基準拿下高分。

6月29日

Llama Legends 3.8.0 推出 Season 3 英雄與突襲

Llama Legends 3.8.0 加入 100 張英雄卡、12 個成就、4 個突襲王與 Atlas Ancient 卡，還有 Work Llama 客製化與免費序號。

6月29日

oMLX 0.4.5.dev1 讓長上下文更快

oMLX 0.4.5.dev1 為 GLM-5.2 和 MiniMax M3 加入自訂 kernel，長上下文 prefill 明顯加速，也修掉 cache 與 benchmark 載入問題。

6月29日

Grok 4.5 先進 Tesla 和 SpaceX 內測

xAI 的 Grok 4.5 已在 Tesla 和 SpaceX 進入私有測試。這是首次已知的內部部署，重點在於先拿真實工作流程驗證模型。

6月27日

Google OpenRL 把 RL 細調搬上 Kubernetes

Google OpenRL 讓團隊在自己的 Kubernetes 叢集上做 LLM post-training 與 fine-tuning，重點是把研究流程和基礎架構拆開，減少 RL 迭代時的雜務。

6月27日

DiffusionGemma 在 RTX 與 DGX 跑很快

DiffusionGemma 改用平行生成文字，NVIDIA 稱它在 RTX、RTX PRO 與 DGX 上可更快跑本地推論，單機互動體驗更順。

6月27日

GLM-5.2 用更低成本打贏 GPT-5.5

Z.ai 的 GLM-5.2 在多項 coding benchmark 上贏過 GPT-5.5，還主打只有約 1/6 成本。這篇整理分數、成本、開放權重優勢，看看它對 coding agent 市場的壓力有多大。

6月27日

OpenAI 收緊 GPT-5.6 上線節奏

OpenAI 先讓可信合作夥伴測試 GPT-5.6 Sol、Terra、Luna，再擴大開放。這次延後不只是產品排程，也反映美國政府開始介入前沿 AI 上線流程。

6月27日

Ubuntu 26.10 Snapshot 2 進入測試期

Ubuntu 26.10 Snapshot 2 已開放測試，現階段維持 Linux kernel 7.0 與 GNOME 50，後續預計升到 kernel 7.2、GNOME 51 和 Mesa 26.2。

6月27日

Claude Fable 5 上線：1M 上下文、$10/$50

Anthropic 推出 Claude Fable 5 與限量版 Mythos 5，主打 1M token 上下文、128k 輸出與新的 refusal 流程，開發者要同步調整錯誤處理與計費邏輯。

6月26日

Google 把 Gemini 3.5 Pro 延到 7 月

Google 把 Gemini 3.5 Pro 從 6 月延到 7 月，重點在早期測試回饋、token 效率與 agent 工作流。這次延後也反映 Google 在 OpenAI 和 Anthropic 壓力下，選擇先把模型磨好再上線。

6月26日

Gemini 3.5 Flash 把 computer use 變成預設能力，…

Google 把 computer use 內建進 Gemini 3.5 Flash 是正確方向，因為代理能力只有成為模型原生功能，才有機會真正進入日常工作流程。

6月26日

小米 MiMo-V2.5-Pro：價格、評測與限制

小米 MiMo-V2.5-Pro 是一款 text-only 模型，主打 1M token 長上下文、程式碼與 agent 工作，價格落在中段，適合大型文件與多步驟任務。

6月25日

MiniMax M3 證明開放權重前沿模型已經重要

MiniMax M3 顯示開放權重模型已能在程式碼、代理、長上下文與多模態上，和前沿閉源模型正面競爭。

已到底部