返回首頁

標籤

PolarQuant

PolarQuant 是一種向量量化與記憶體壓縮方法,常見於 LLM 推論、向量檢索與資料庫索引。它的重點在於降低 embedding 與權重的儲存成本,同時盡量保留搜尋與推論品質。

3 篇文章