標籤

Qwen

Qwen 是阿里巴巴系統性的開源與商用模型家族，涵蓋文字、視覺、多模態與推理版本。它常出現在微調工具、數學基準與編碼代理的比較中，反映模型能力、成本與部署彈性的實際取捨。

9 篇文章

5 個今天就能跑的免費 AI 模型

5 個免費 AI 選項涵蓋雲端 API、模型比對、離線本機與程式碼模型，適合先試再決定要不要付費。

10 款可本地部署的開源 LLM，從 8GB 到 136GB VRAM 都有對應選擇，適合比對推理、寫程式、長上下文與代理任務。

中國實驗室已經領跑開源 AI，西方團隊應把這件事視為新的起跑線，而不是短期波動。

2026 年 4 月的開源 AI 很熱鬧。GitHub 的 agent 工具、Hugging Face 的模型下載數都很猛，這篇整理最值得看的專案、數據和實際影響。

Unsloth 新增 Qwen3.5 視覺模型分層微調，能只訓練 vision、language、attention 或 MLP。VRAM 更省，訓練也更快，對多模態團隊很實用。

AIME 2026 排行榜只有 8 個模型，但分數差很大。Qwen3.6 Plus 以 0.953 領先，最低只有 0.375。這份數學基準很適合看 LLM 的推理穩定度。

Cursor 把 Composer 2 建在 Moonshot AI 的 Kimi K2.5 上，價格約只有傳統方案的八分之一。這篇拆解它的成本邏輯、開源模型競爭、資安風險，還有台灣開發者該怎麼看。

Raschka 的 LLM Architecture Gallery 把 GPT-2、Llama 3、OLMo 2、DeepSeek、Qwen 等模型的層數、注意力與 KV cache 數字攤開來比，工程師一眼就能看出部署差異。

OpenClaw 3.28 在 4 天內推了 100+ 項變更，加入審批閘門、Grok 搜尋、MiniMax 圖像工具，還修掉一堆 provider 與設定問題。