標籤
Qwen
Qwen 是阿里巴巴系統性的開源與商用模型家族,涵蓋文字、視覺、多模態與推理版本。它常出現在微調工具、數學基準與編碼代理的比較中,反映模型能力、成本與部署彈性的實際取捨。
6 篇文章

產業動態/4月15日
2026年4月值得追的開源 AI 專案
2026 年 4 月的開源 AI 很熱鬧。GitHub 的 agent 工具、Hugging Face 的模型下載數都很猛,這篇整理最值得看的專案、數據和實際影響。

工具應用/4月3日
Unsloth 讓 Qwen3.5 可分層微調
Unsloth 新增 Qwen3.5 視覺模型分層微調,能只訓練 vision、language、attention 或 MLP。VRAM 更省,訓練也更快,對多模態團隊很實用。

技術研究/4月3日
AIME 2026 排行榜:Qwen 先拿下數學測試
AIME 2026 排行榜只有 8 個模型,但分數差很大。Qwen3.6 Plus 以 0.953 領先,最低只有 0.375。這份數學基準很適合看 LLM 的推理穩定度。

產業動態/4月2日
Cursor、Kimi 與開源賭注
Cursor 把 Composer 2 建在 Moonshot AI 的 Kimi K2.5 上,價格約只有傳統方案的八分之一。這篇拆解它的成本邏輯、開源模型競爭、資安風險,還有台灣開發者該怎麼看。

技術研究/4月2日
Sebastian Raschka 的 LLM 架構圖鑑
Raschka 的 LLM Architecture Gallery 把 GPT-2、Llama 3、OLMo 2、DeepSeek、Qwen 等模型的層數、注意力與 KV cache 數字攤開來比,工程師一眼就能看出部署差異。

AI Agent/4月1日
OpenClaw 3.28 加入審批閘門
OpenClaw 3.28 在 4 天內推了 100+ 項變更,加入審批閘門、Grok 搜尋、MiniMax 圖像工具,還修掉一堆 provider 與設定問題。