為什麼 Amazon S3 Vectors 更重要的是儲存，不是搜尋

OraCore Editors

返回首頁

[TOOLS] 2026年6月3日4 分鐘閱讀OraCore 編輯部

為什麼 Amazon S3 Vectors 更重要的是儲存，不是搜尋

Amazon S3 Vectors 是儲存層的成本勝利，不是搜尋層的替代品；AWS 這樣定位是對的。

Amazon S3 Vectors 分層架構 OpenSearch 向量儲存 S3

分享 LinkedIn

Amazon S3 Vectors 是儲存層的成本勝利，不是搜尋層的替代品。

Amazon 這次把 S3 Vectors 定位成便宜、可持久保存的向量儲存層，而不是拿來取代嚴肅的向量資料庫，方向是對的。它的價值不在於把所有向量都變成即時搜尋，而在於把數十億 embeddings 放進 S3，再把最熱的資料送去 OpenSearch 或其他低延遲系統。AWS 公布的數字很直接：向量儲存、上傳與查詢成本最高可降 90%，單一索引可支援最多 20 億個 vectors，暖查詢延遲約 100 ms。這些指標說明，向量系統真正的瓶頸常常不是算法，而是把所有 embeddings 都養在昂貴記憶體層的成本。

第一個論點：多數團隊花錯錢的地方在儲存，不在搜尋

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

大多數組織並不需要每一個 vector 都住在高價、永遠在線的搜尋引擎裡。它們真正需要的是一個可靠、便宜的地方存放龐大的 embedding 語料，再把高價值、被頻繁查詢的部分升級到熱層。S3 Vectors 解決的正是這個問題：把冷資料留在 S3，讓長尾資料不必因為成本被刪掉、壓縮掉，或乾脆從未被索引。對 RAG、語意搜尋、agent memory 來說，這等於把可保留的知識量直接拉高。

AWS 自己給的架構示範也很有說服力：OpenSearch 負責高 QPS、低延遲搜尋，S3 Vectors 則承接那些仍需可查詢、但不必永遠熱著的資料。這不是折衷，而是分層。很多團隊會把向量系統做成單一大搜尋叢集，假設所有 embeddings 都值得同樣的服務路徑；實務上根本不是這樣。影片檔案庫、文件湖、歷史互動紀錄，優先順序永遠是便宜持久，再來才是快速啟動。

第二個論點：分層向量基礎設施才是 AI 的預設解

AI 工作負載本來就不均一，向量基礎設施卻常被設計得像所有請求都一樣急。即時聊天的檢索、商品目錄的語意搜尋、以及 agent 的長期記憶，對延遲與新鮮度的要求完全不同。AWS 把 S3 Vectors、Amazon OpenSearch Service 和 Bedrock Knowledge Bases 放在一起，反而更像是把正確的三層架構講清楚：冷儲存、一般檢索、高效服務。這種設計讓團隊只在需要高強度的地方付高強度的錢。

更重要的是整合本身。AWS 說 S3 Vectors 可接到 Bedrock Knowledge Bases、SageMaker Unified Studio 與 OpenSearch Service，代表它不是想孤立地贏，而是想成為向量資料的預設後端，再把熱資料升級到更快的索引。這比要求每個 AI 團隊在「昂貴的完整向量資料庫」和「脆弱的自建管線」之間二選一要合理得多。生產環境本來就是這樣演化：先用便宜儲存把資料留住，再把最有價值的切片推進熱層。

反方可能怎麼說

最強的反對意見是：S3 Vectors 不是為最熱路徑設計的。如果應用需要低於 10 ms 的檢索、高 QPS，或複雜過濾與排序，那麼專用向量資料庫或 OpenSearch 仍然更合適。這點沒有錯。S3 Vectors 並不是要消滅向量搜尋引擎，AWS 也沒有這樣宣稱；它的定位本來就明確指向長期、低頻存取的向量資料，而高效能層留給 OpenSearch。

但這個限制正是它重要的原因。多數團隊不該為了最熱的 20% 流量，去優化最冷的 80% embeddings。真正的反駁不是說 S3 Vectors 在原始速度上打贏所有向量資料庫，而是它消除了把所有 vectors 當成同樣熱資料的昂貴錯誤。如果架構分層做對，最熱的資料仍然會進到最快的系統。S3 Vectors 的價值在於，它讓這個搬遷更便宜、更簡單，也更可持續。

你能做什麼

如果你是工程師或 PM，把 S3 Vectors 當成向量產品的預設冷層，架構上以「升級」而不是「永久常駐」為原則。先把完整 embedding 語料放進 S3，再量測存取頻率，只把活躍切片搬到 OpenSearch 或其他低延遲引擎。如果你是創辦人，這可以直接降低早期單位經濟：先為保留而建，而不只是為搜尋而建，你就能在不背上過大的基礎設施帳單下，做出更完整的 RAG、更好的語意搜尋，以及更穩定的 agent 記憶。

// 相關文章

為什麼 Amazon S3 Vectors 更重要的是儲存，不是搜尋

第一個論點：多數團隊花錯錢的地方在儲存，不在搜尋

訂閱 AI 趨勢週報

第二個論點：分層向量基礎設施才是 AI 的預設解

反方可能怎麼說

你能做什麼

Magenta RealTime 2 讓你在 DAW 裡即時改曲

開源 AI 工具在價值上已經贏過 Claude 付費方案

500 個 AI agent 專案，現在能做什麼

Chocolatey 的 Go 安裝變成政策

Go 支援政策把發版變清單

RustDesk 自架遠端存取部署指南