[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"tag-推論效率":3},{"tag":4,"articles":9},{"id":5,"name":6,"slug":6,"article_count":7,"description_zh":8,"description_en":8},"64ca715e-1d3c-48a2-81e4-825b02328fb4","推論效率",1,null,[10],{"id":11,"slug":12,"title":13,"summary":14,"category":15,"image_url":16,"cover_image":16,"language":17,"created_at":18},"82766fdc-4368-445d-bb4a-03377726df02","turboquant-cuts-memory-use-without-accuracy-loss-zh","TurboQuant 省 6 倍記憶體，還不掉準確率","Google Research 發表 TurboQuant，主打記憶體用量降到 1\u002F6、推論快 8 倍，且在報告測試中沒有準確率損失。這篇看它怎麼改 AI 伺服器成本。","research","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775161134112-ftrj.png","zh","2026-04-02T20:18:39.266389+00:00"]