標籤
2 篇文章
Zyphra Cloud 的重點不在新模型,而在它把 AI 戰場從訓練轉向推理經濟,並用 AMD 做出可落地的替代路線。
TurboQuant 不是單純把 KV cache 壓小,而是把壓縮從工程技巧提升成可證明的效率方案。