標籤
Gemma 4
Gemma 4 是 Google 的開放權重模型系列,重點在長上下文、多模態與雲端部署彈性。它支援 256K context、vision、audio 與 Apache 2.0 授權,適合關注 Vertex AI、Cloud Run、GKE 和 TPU 的開發者。
3 篇文章

工具應用/5月9日
Gemma 4 助手模型加速草稿 Token
Gemma 4 的 E2B 與 E4B 助手模型用 centroid masking,把草稿 token 的 lm_head 計算量砍到約 45 倍,且品質損失很小。

模型發布/4月4日
Gemma 4 登上 Google Cloud
Gemma 4 進入 Google Cloud,支援 256K context、vision、audio 與 Apache 2.0 授權,還能跑在 Vertex AI、Cloud Run、GKE 與 TPU 上。

技術研究/4月3日
AIME 2026 排行榜:Qwen 先拿下數學測試
AIME 2026 排行榜只有 8 個模型,但分數差很大。Qwen3.6 Plus 以 0.953 領先,最低只有 0.375。這份數學基準很適合看 LLM 的推理穩定度。