[TOOLS] 4 分鐘閱讀OraCore 編輯部

為什麼 Amazon S3 Vectors 更重要的是儲存,不是搜尋

Amazon S3 Vectors 是儲存層的成本勝利,不是搜尋層的替代品;AWS 這樣定位是對的。

分享 LinkedIn
為什麼 Amazon S3 Vectors 更重要的是儲存,不是搜尋

Amazon S3 Vectors 是儲存層的成本勝利,不是搜尋層的替代品

Amazon 這次把 S3 Vectors 定位成便宜、可持久保存的向量儲存層,而不是拿來取代嚴肅的向量資料庫,方向是對的。它的價值不在於把所有向量都變成即時搜尋,而在於把數十億 embeddings 放進 S3,再把最熱的資料送去 OpenSearch 或其他低延遲系統。AWS 公布的數字很直接:向量儲存、上傳與查詢成本最高可降 90%,單一索引可支援最多 20 億個 vectors,暖查詢延遲約 100 ms。這些指標說明,向量系統真正的瓶頸常常不是算法,而是把所有 embeddings 都養在昂貴記憶體層的成本。

第一個論點:多數團隊花錯錢的地方在儲存,不在搜尋

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

大多數組織並不需要每一個 vector 都住在高價、永遠在線的搜尋引擎裡。它們真正需要的是一個可靠、便宜的地方存放龐大的 embedding 語料,再把高價值、被頻繁查詢的部分升級到熱層。S3 Vectors 解決的正是這個問題:把冷資料留在 S3,讓長尾資料不必因為成本被刪掉、壓縮掉,或乾脆從未被索引。對 RAG、語意搜尋、agent memory 來說,這等於把可保留的知識量直接拉高。

為什麼 Amazon S3 Vectors 更重要的是儲存,不是搜尋

AWS 自己給的架構示範也很有說服力:OpenSearch 負責高 QPS、低延遲搜尋,S3 Vectors 則承接那些仍需可查詢、但不必永遠熱著的資料。這不是折衷,而是分層。很多團隊會把向量系統做成單一大搜尋叢集,假設所有 embeddings 都值得同樣的服務路徑;實務上根本不是這樣。影片檔案庫、文件湖、歷史互動紀錄,優先順序永遠是便宜持久,再來才是快速啟動。

第二個論點:分層向量基礎設施才是 AI 的預設解

AI 工作負載本來就不均一,向量基礎設施卻常被設計得像所有請求都一樣急。即時聊天的檢索、商品目錄的語意搜尋、以及 agent 的長期記憶,對延遲與新鮮度的要求完全不同。AWS 把 S3 Vectors、Amazon OpenSearch Service 和 Bedrock Knowledge Bases 放在一起,反而更像是把正確的三層架構講清楚:冷儲存、一般檢索、高效服務。這種設計讓團隊只在需要高強度的地方付高強度的錢。

更重要的是整合本身。AWS 說 S3 Vectors 可接到 Bedrock Knowledge Bases、SageMaker Unified Studio 與 OpenSearch Service,代表它不是想孤立地贏,而是想成為向量資料的預設後端,再把熱資料升級到更快的索引。這比要求每個 AI 團隊在「昂貴的完整向量資料庫」和「脆弱的自建管線」之間二選一要合理得多。生產環境本來就是這樣演化:先用便宜儲存把資料留住,再把最有價值的切片推進熱層。

反方可能怎麼說

最強的反對意見是:S3 Vectors 不是為最熱路徑設計的。如果應用需要低於 10 ms 的檢索、高 QPS,或複雜過濾與排序,那麼專用向量資料庫或 OpenSearch 仍然更合適。這點沒有錯。S3 Vectors 並不是要消滅向量搜尋引擎,AWS 也沒有這樣宣稱;它的定位本來就明確指向長期、低頻存取的向量資料,而高效能層留給 OpenSearch。

為什麼 Amazon S3 Vectors 更重要的是儲存,不是搜尋

但這個限制正是它重要的原因。多數團隊不該為了最熱的 20% 流量,去優化最冷的 80% embeddings。真正的反駁不是說 S3 Vectors 在原始速度上打贏所有向量資料庫,而是它消除了把所有 vectors 當成同樣熱資料的昂貴錯誤。如果架構分層做對,最熱的資料仍然會進到最快的系統。S3 Vectors 的價值在於,它讓這個搬遷更便宜、更簡單,也更可持續。

你能做什麼

如果你是工程師或 PM,把 S3 Vectors 當成向量產品的預設冷層,架構上以「升級」而不是「永久常駐」為原則。先把完整 embedding 語料放進 S3,再量測存取頻率,只把活躍切片搬到 OpenSearch 或其他低延遲引擎。如果你是創辦人,這可以直接降低早期單位經濟:先為保留而建,而不只是為搜尋而建,你就能在不背上過大的基礎設施帳單下,做出更完整的 RAG、更好的語意搜尋,以及更穩定的 agent 記憶。