標籤
Google Research 聚焦模型推論、提示設計與系統效率等基礎問題,從記憶體壓縮到輸入策略都會影響成本與準確率。這類研究常直接改變 AI 服務的部署方式與評估方法。
2 篇文章
Google Research 發表 TurboQuant,主打記憶體用量降到 1/6、推論快 8 倍,且在報告測試中沒有準確率損失。這篇看它怎麼改 AI 伺服器成本。
Google Research 研究發現,提示詞複製一次可讓 70 組模型與基準測試中的 47 組提升準確率,NameIndex 甚至從 21.33% 衝到 97.33%。