分類

模型發布

最新 AI 模型發布、基準測試與性能比較。追蹤 OpenAI、Anthropic、Google、Meta 等各家模型動態。

MiniMax-M1:開源 1M Token 推理模型
5月15日

MiniMax-M1:開源 1M Token 推理模型

MiniMax 推出 M1 開源推理模型,主打 100 萬 Token 上下文、8 萬 Token 輸出與低價 API。

Gemini Omni 影片模型怎麼了
5月15日

Gemini Omni 影片模型怎麼了

Gemini Omni 外流測試顯示它在影片文字渲染與聊天室編輯上很強,但配額和安全限制可能讓實用性打折。

為什麼 Xiaomi 的 MiMo-V2.5-Pro 改變的是 Coding …
5月14日

為什麼 Xiaomi 的 MiMo-V2.5-Pro 改變的是 Coding …

MiMo-V2.5-Pro 的重點不在聊天能力,而在長時間、重工具呼叫的 coding agent 工作;它代表 AI 競爭焦點正從會說話,轉向能把任務做完。

OpenAI 即時音訊模型瞄準語音互動
5月11日

OpenAI 即時音訊模型瞄準語音互動

OpenAI 推出三個即時音訊模型,主打翻譯、轉錄和語音代理,讓開發者能做更即時的語音應用。

Anthropic推10款金融AI Agent
5月10日

Anthropic推10款金融AI Agent

Anthropic推出10款金融預建AI Agent,並發表Claude Opus 4.7。這次重點不是聊天,而是把研究、合規、檢索等金融流程直接產品化。

為什麼 Claude 的「無限」上下文窗口,仍然不會讓 AI 自主運作
5月10日

為什麼 Claude 的「無限」上下文窗口,仍然不會讓 AI 自主運作

Claude 的新上下文、協作與基礎設施升級都是真的進步,但它們不等於 AI 自主運作。

為什麼 Midjourney 8.1 Raw Mode 比預設風格更值得用
5月8日

為什麼 Midjourney 8.1 Raw Mode 比預設風格更值得用

Midjourney 8.1 的 raw mode 比預設風格更適合需要精準、可重複、可控輸出的工作流程,因為它明顯降低了風格覆蓋與提示詞漂移。

Anthropic 開放 Claude Security 掃碼
5月6日

Anthropic 開放 Claude Security 掃碼

Anthropic 把 Claude Opus 4.7 放進 Claude Security 公測,主打企業程式碼掃描、排程掃描、信心分數與修補建議。

為什麼 Kimi K2.5 會改寫開源 Agent 競賽
5月5日

為什麼 Kimi K2.5 會改寫開源 Agent 競賽

Kimi K2.5 不是單純更強的模型,而是把多模態推理、工具調用與多代理協作綁成一個可執行的開源系統。

AWS 解析 Nova 的 RFT 評分法
5月5日

AWS 解析 Nova 的 RFT 評分法

AWS 公布用 LLM-as-a-judge 做 Nova 的強化微調,並用合約審查案例示範如何把評分信號接到生產流程。

Kimi K2.6 把 256K 上下文帶進 API
5月4日

Kimi K2.6 把 256K 上下文帶進 API

Kimi K2.6 為 API 開發者帶來 256K 上下文、圖像與影片輸入,還強化長程式碼任務的穩定度。

Kimi K2.6 與 Qwen 3.6 拉近差距
5月4日

Kimi K2.6 與 Qwen 3.6 拉近差距

Kimi K2.6 和 Qwen 3.6 這兩個 open-weight 模型,已經在 coding 和 agent 任務上逼近閉源模型。

Kimi K2.6:BenchLM 2026 成績解析
5月4日

Kimi K2.6:BenchLM 2026 成績解析

Kimi K2.6 在 BenchLM 2026 排第 12,Coding 和 Agentic 表現強,還有 256K context 與 open weights。

Gemini 進車內了,先從美國開始
5月4日

Gemini 進車內了,先從美國開始

Google 把 Gemini 帶進支援 Google built-in 的車款,先從美國英文版開始,還會透過軟體更新推到既有車輛。

2026 AI 模型怎麼選
5月4日

2026 AI 模型怎麼選

2026 年選 AI 模型要看任務。Gemini 3.1 Pro 偏推理,Claude 寫作最穩,Grok 在部分 coding 測試領先。

Qwen3.6-27B:更小卻更準的寫碼路線
4月27日

Qwen3.6-27B:更小卻更準的寫碼路線

Qwen3.6-27B 是 27B dense multimodal 模型,在 SWE-bench Verified 拿到 77.2,還贏過更大的 Qwen3.5-397B-A17B。對開發團隊來說,這代表更好部署,也更適合 agentic coding。

ChatGPT Images 2.0 上線,修圖更準了
4月24日

ChatGPT Images 2.0 上線,修圖更準了

OpenAI 推出 ChatGPT Images 2.0,文字更準、編修更穩、工作流更快。這次更新對設計師、行銷與產品團隊,影響比 demo 還大。

Anthropic Mythos 讓資安圈緊張
4月24日

Anthropic Mythos 讓資安圈緊張

Anthropic 的 Mythos 傳出能快速找出軟體漏洞,讓銀行、電網和政府系統的資安風險瞬間升溫。

Claude Opus 4.7 上線:更會做事了
4月22日

Claude Opus 4.7 上線:更會做事了

Anthropic 推出 Claude Opus 4.7,強化長任務、視覺理解與程式工作流,但 Token 消耗也更高。

Qwen3.6-35B-A3B 打開開源寫碼新路線
4月20日

Qwen3.6-35B-A3B 打開開源寫碼新路線

Qwen3.6-35B-A3B 以 35B 總參數、3B 啟用參數和 Anthropic API 相容性,直接瞄準 Claude Code 工作流。這款開源 MoE 模型想把效能、成本和工具整合一次做到位。

Claude Design 上線:Anthropic 推 AI 設計工具挑戰 Figma
4月19日

Claude Design 上線:Anthropic 推 AI 設計工具挑戰 Figma

Anthropic Labs 於 4 月 17 日推出 Claude Design,使用者可透過對話產出 prototype、slide、one-pager 與行銷素材。產品由 Opus 4.7 驅動,目前以 research preview 開放給 Claude Pro、Max、Team 與 Enterprise 訂戶。Claude Design 在 onboarding 階段會讀取團隊的 codebase 與設計檔,自動建立包含顏色、字型、元件的設計系統,後續所有專案皆自動套用。

Gemini最新更新總整理
4月18日

Gemini最新更新總整理

Gemini 這波更新把 Mac 桌面版、Deep Research、Canvas 和學生免費方案一次補齊,直接從聊天工具往工作流程工具靠攏。

Linux 7.0 上線:Rust 與 AI 找蟲
4月17日

Linux 7.0 上線:Rust 與 AI 找蟲

Linux 7.0 加入正式 Rust 支援,擴充 ARM、RISC-V 等 CPU 工作,Linus Torvalds 也提到 AI 工具正在幫忙找出核心漏洞。

GPT-5.4 知識測驗拿 97.6 分
4月13日

GPT-5.4 知識測驗拿 97.6 分

GPT-5.4 在 BenchLM 知識與理解拿到 97.6 分,總榜暫列第 2,還有 1.05M token 長上下文。這篇拆解它適合哪些工作、和其他模型怎麼比。

OpenAI 2026 營收、估值與募資解析
4月12日

OpenAI 2026 營收、估值與募資解析

OpenAI 2026 年化營收達 250 億美元,估值衝上 8520 億美元。這篇拆解它的收入、燒錢、募資、Microsoft 分潤與 IPO 佈局。

Kimi K2.5 上線:開源模型打進第一梯隊
4月4日

Kimi K2.5 上線:開源模型打進第一梯隊

Moonshot AI 的 Kimi K2.5 在 2026/1/27 上線,主打 256K context、Agent Swarm、MIT 授權,還把多項 benchmark 拉到和 GPT、Claude 同一張桌子。

Cursor 3 把 Agent 收進同一個工作區
4月4日

Cursor 3 把 Agent 收進同一個工作區

Cursor 3 把本機與雲端 Agent 收進同一個工作區,支援平行 session、跨環境接手,還能從 commit 走到 PR。

Gemma 4 登上 Google Cloud
4月4日

Gemma 4 登上 Google Cloud

Gemma 4 進入 Google Cloud,支援 256K context、vision、audio 與 Apache 2.0 授權,還能跑在 Vertex AI、Cloud Run、GKE 與 TPU 上。

Claude Mythos 把 AI 寫碼門檻拉高
4月3日

Claude Mythos 把 AI 寫碼門檻拉高

Anthropic 的 Claude Mythos 走向高階寫碼、推理與資安場景,但成本與雙重用途風險,也讓導入變得更挑客戶。

ESP32-S31 把 Wi‑Fi 6 和 Gigabit…
4月3日

ESP32-S31 把 Wi‑Fi 6 和 Gigabit…

Espressif 的 ESP32-S31 把雙 RISC-V、Wi‑Fi 6、Bluetooth 5.4、802.15.4 與 Gigabit Ethernet 放進單顆 MCU,鎖定閘道器與多協定邊緣裝置。

已到底部