模型發布
最新 AI 模型發布、基準測試與性能比較。追蹤 OpenAI、Anthropic、Google、Meta 等各家模型動態。

MiniMax-M1:開源 1M Token 推理模型
MiniMax 推出 M1 開源推理模型,主打 100 萬 Token 上下文、8 萬 Token 輸出與低價 API。

Gemini Omni 影片模型怎麼了
Gemini Omni 外流測試顯示它在影片文字渲染與聊天室編輯上很強,但配額和安全限制可能讓實用性打折。

為什麼 Xiaomi 的 MiMo-V2.5-Pro 改變的是 Coding …
MiMo-V2.5-Pro 的重點不在聊天能力,而在長時間、重工具呼叫的 coding agent 工作;它代表 AI 競爭焦點正從會說話,轉向能把任務做完。

OpenAI 即時音訊模型瞄準語音互動
OpenAI 推出三個即時音訊模型,主打翻譯、轉錄和語音代理,讓開發者能做更即時的語音應用。

Anthropic推10款金融AI Agent
Anthropic推出10款金融預建AI Agent,並發表Claude Opus 4.7。這次重點不是聊天,而是把研究、合規、檢索等金融流程直接產品化。

為什麼 Claude 的「無限」上下文窗口,仍然不會讓 AI 自主運作
Claude 的新上下文、協作與基礎設施升級都是真的進步,但它們不等於 AI 自主運作。

為什麼 Midjourney 8.1 Raw Mode 比預設風格更值得用
Midjourney 8.1 的 raw mode 比預設風格更適合需要精準、可重複、可控輸出的工作流程,因為它明顯降低了風格覆蓋與提示詞漂移。

Anthropic 開放 Claude Security 掃碼
Anthropic 把 Claude Opus 4.7 放進 Claude Security 公測,主打企業程式碼掃描、排程掃描、信心分數與修補建議。

為什麼 Kimi K2.5 會改寫開源 Agent 競賽
Kimi K2.5 不是單純更強的模型,而是把多模態推理、工具調用與多代理協作綁成一個可執行的開源系統。

AWS 解析 Nova 的 RFT 評分法
AWS 公布用 LLM-as-a-judge 做 Nova 的強化微調,並用合約審查案例示範如何把評分信號接到生產流程。

Kimi K2.6 把 256K 上下文帶進 API
Kimi K2.6 為 API 開發者帶來 256K 上下文、圖像與影片輸入,還強化長程式碼任務的穩定度。

Kimi K2.6 與 Qwen 3.6 拉近差距
Kimi K2.6 和 Qwen 3.6 這兩個 open-weight 模型,已經在 coding 和 agent 任務上逼近閉源模型。

Kimi K2.6:BenchLM 2026 成績解析
Kimi K2.6 在 BenchLM 2026 排第 12,Coding 和 Agentic 表現強,還有 256K context 與 open weights。

Gemini 進車內了,先從美國開始
Google 把 Gemini 帶進支援 Google built-in 的車款,先從美國英文版開始,還會透過軟體更新推到既有車輛。

2026 AI 模型怎麼選
2026 年選 AI 模型要看任務。Gemini 3.1 Pro 偏推理,Claude 寫作最穩,Grok 在部分 coding 測試領先。

Qwen3.6-27B:更小卻更準的寫碼路線
Qwen3.6-27B 是 27B dense multimodal 模型,在 SWE-bench Verified 拿到 77.2,還贏過更大的 Qwen3.5-397B-A17B。對開發團隊來說,這代表更好部署,也更適合 agentic coding。

ChatGPT Images 2.0 上線,修圖更準了
OpenAI 推出 ChatGPT Images 2.0,文字更準、編修更穩、工作流更快。這次更新對設計師、行銷與產品團隊,影響比 demo 還大。

Anthropic Mythos 讓資安圈緊張
Anthropic 的 Mythos 傳出能快速找出軟體漏洞,讓銀行、電網和政府系統的資安風險瞬間升溫。

Claude Opus 4.7 上線:更會做事了
Anthropic 推出 Claude Opus 4.7,強化長任務、視覺理解與程式工作流,但 Token 消耗也更高。

Qwen3.6-35B-A3B 打開開源寫碼新路線
Qwen3.6-35B-A3B 以 35B 總參數、3B 啟用參數和 Anthropic API 相容性,直接瞄準 Claude Code 工作流。這款開源 MoE 模型想把效能、成本和工具整合一次做到位。

Claude Design 上線:Anthropic 推 AI 設計工具挑戰 Figma
Anthropic Labs 於 4 月 17 日推出 Claude Design,使用者可透過對話產出 prototype、slide、one-pager 與行銷素材。產品由 Opus 4.7 驅動,目前以 research preview 開放給 Claude Pro、Max、Team 與 Enterprise 訂戶。Claude Design 在 onboarding 階段會讀取團隊的 codebase 與設計檔,自動建立包含顏色、字型、元件的設計系統,後續所有專案皆自動套用。

Gemini最新更新總整理
Gemini 這波更新把 Mac 桌面版、Deep Research、Canvas 和學生免費方案一次補齊,直接從聊天工具往工作流程工具靠攏。

Linux 7.0 上線:Rust 與 AI 找蟲
Linux 7.0 加入正式 Rust 支援,擴充 ARM、RISC-V 等 CPU 工作,Linus Torvalds 也提到 AI 工具正在幫忙找出核心漏洞。

GPT-5.4 知識測驗拿 97.6 分
GPT-5.4 在 BenchLM 知識與理解拿到 97.6 分,總榜暫列第 2,還有 1.05M token 長上下文。這篇拆解它適合哪些工作、和其他模型怎麼比。

OpenAI 2026 營收、估值與募資解析
OpenAI 2026 年化營收達 250 億美元,估值衝上 8520 億美元。這篇拆解它的收入、燒錢、募資、Microsoft 分潤與 IPO 佈局。

Kimi K2.5 上線:開源模型打進第一梯隊
Moonshot AI 的 Kimi K2.5 在 2026/1/27 上線,主打 256K context、Agent Swarm、MIT 授權,還把多項 benchmark 拉到和 GPT、Claude 同一張桌子。

Cursor 3 把 Agent 收進同一個工作區
Cursor 3 把本機與雲端 Agent 收進同一個工作區,支援平行 session、跨環境接手,還能從 commit 走到 PR。

Gemma 4 登上 Google Cloud
Gemma 4 進入 Google Cloud,支援 256K context、vision、audio 與 Apache 2.0 授權,還能跑在 Vertex AI、Cloud Run、GKE 與 TPU 上。

Claude Mythos 把 AI 寫碼門檻拉高
Anthropic 的 Claude Mythos 走向高階寫碼、推理與資安場景,但成本與雙重用途風險,也讓導入變得更挑客戶。

ESP32-S31 把 Wi‑Fi 6 和 Gigabit…
Espressif 的 ESP32-S31 把雙 RISC-V、Wi‑Fi 6、Bluetooth 5.4、802.15.4 與 Gigabit Ethernet 放進單顆 MCU,鎖定閘道器與多協定邊緣裝置。