[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-qdrant-milvus-weaviate-rag-2026-comparison-zh":3,"tags-qdrant-milvus-weaviate-rag-2026-comparison-zh":33,"related-lang-qdrant-milvus-weaviate-rag-2026-comparison-zh":48,"related-posts-qdrant-milvus-weaviate-rag-2026-comparison-zh":52,"series-tools-0ad0e45d-cb40-4267-bab8-d05ed973896a":89},{"id":4,"title":5,"content":6,"summary":7,"source":8,"source_url":9,"author":10,"image_url":11,"keywords":12,"language":21,"translated_content":10,"views":22,"is_premium":23,"created_at":24,"updated_at":24,"cover_image":11,"published_at":25,"rewrite_status":26,"rewrite_error":10,"rewritten_from_id":27,"slug":28,"category":29,"related_article_id":30,"status":31,"google_indexed_at":32,"x_posted_at":10,"tweet_text":10,"title_rewritten_at":10,"title_original":10,"key_takeaways":10,"topic_cluster_id":10,"embedding":10,"is_canonical_seed":23},"0ad0e45d-cb40-4267-bab8-d05ed973896a","2026 RAG 向量資料庫三選一","\u003Cp>2026 年做 RAG，向量資料庫早就不是看品牌。真正要看的是延遲、規模、查詢方式，還有你團隊願不願意養這套系統。\u003Ca href=\"https:\u002F\u002Fqdrant.tech\" target=\"_blank\" rel=\"noopener\">Qdrant\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fmilvus.io\" target=\"_blank\" rel=\"noopener\">Milvus\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fweaviate.io\" target=\"_blank\" rel=\"noopener\">Weaviate\u003C\u002Fa> 都很能打，但強項完全不同。\u003C\u002Fp>\u003Cp>講白了，RAG 最怕的不是 embedding 不準。最怕的是檢索慢、過濾難、資料一多就炸。你如果做客服聊天機器人，\u003Ca href=\"\u002Fnews\u002Fibm-100b-vector-database-single-server-zh\">100\u003C\u002Fa>ms 跟 300ms 的差距，使用者體感差很多。你如果做企業搜尋，查詢量一上來，架構選錯就會很痛。\u003C\u002Fp>\u003Cp>這篇不講空話。直接看三個產品怎麼選，哪個適合小團隊，哪個適合大規模，哪個適合混合搜尋。也順便把常見的部署成本和開發體驗攤開來看。\u003C\u002Fp>\u003Ch2>三者各自最擅長什麼\u003C\u002Fh2>\u003Cp>三個資料庫都在解同一題。就是把\u003Ca href=\"\u002Fnews\u002Fredis-vector-search-quick-start-guide-zh\">向量搜尋\u003C\u002Fa>做好。可是路線完全不同。\u003Ca href=\"https:\u002F\u002Fqdrant.tech\" target=\"_blank\" rel=\"noopener\">Qdrant\u003C\u002Fa> 主打低延遲和 payload filter。\u003Ca href=\"https:\u002F\u002Fmilvus.io\" target=\"_blank\" rel=\"noopener\">Milvus\u003C\u002Fa> 主打分散式擴展。\u003Ca href=\"https:\u002F\u002Fweaviate.io\" target=\"_blank\" rel=\"noopener\">Weaviate\u003C\u002Fa> 則是把向量搜尋和關鍵字搜尋放在同一條查詢路徑。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776126302600-xxf9.png\" alt=\"2026 RAG 向量資料庫三選一\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>如果你做的是 RAG，這個差異很重要。因為真實世界的查詢，常常不是純語意。使用者會打關鍵字、會輸入縮寫、會加時間條件、會指定部門。資料庫如果只會向量相似度，實戰就會卡住。\u003C\u002Fp>\u003Cp>Qdra\u003Ca href=\"\u002Fnews\u002Fuk-regulators-assess-anthropic-model-risks-zh\">nt\u003C\u002Fa> 用 Rust 寫，這點很討喜。它在記憶體使用和延遲穩定性上，通常表現很漂亮。Milvus 則是為叢集設計，適合資料量很大、節點很多的場景。Weaviate 的優勢是整合感強，團隊不用自己東拼西湊就能做 hybrid search。\u003C\u002Fp>\u003Cul>\u003Cli>\u003Cstrong>Qdrant：\u003C\u002Fstrong> Rust 架構，低延遲，filter 很強\u003C\u002Fli>\u003Cli>\u003Cstrong>Milvus：\u003C\u002Fstrong> 分散式架構，適合超大規模\u003C\u002Fli>\u003Cli>\u003Cstrong>Weaviate：\u003C\u002Fstrong> 混合搜尋強，API 直覺\u003C\u002Fli>\u003Cli>\u003Cstrong>共同點：\u003C\u002Fstrong> 都能做 RAG 檢索層\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>架構差異，決定你後面痛不痛\u003C\u002Fh2>\u003Cp>很多團隊一開始只看 demo。這很正常。可是 demo 跟上線是兩回事。\u003Ca href=\"https:\u002F\u002Fqdrant.tech\u002Fdocumentation\u002F\" target=\"_blank\" rel=\"noopener\">Qdrant 文件\u003C\u002Fa>會讓你很快上手，因為它的定位很清楚。就是向量搜尋加強力過濾。對中大型資料集來說，這種設計很實用。\u003C\u002Fp>\u003Cp>\u003Ca href=\"https:\u002F\u002Fmilvus.io\u002Fdocs\" target=\"_blank\" rel=\"noopener\">Milvus 文件\u003C\u002Fa>就完全是另一種風格。它很在意叢集、索引、節點分工、GPU 加速。你如果要撐到十億級向量，Milvus 的設計會比小型向量庫更對路。代價也很直接，就是維運複雜度高。\u003C\u002Fp>\u003Cp>\u003Ca href=\"https:\u002F\u002Fdocs.weaviate.io\" target=\"_blank\" rel=\"noopener\">Weaviate 文件\u003C\u002Fa>則偏向開發體驗。它把語意搜尋、關鍵字搜尋、資料模型整合得比較順。你可以少接幾個服務。對產品團隊來說，這通常代表少一點雜事，多一點時間做功能。\u003C\u002Fp>\u003Cblockquote>“The future is already here — it’s just not evenly distributed.” — William Gibson\u003C\u002Fblockquote>\u003Cp>這句話放在向量資料庫很貼切。技術都能用了。差別只在你要的是什麼。低延遲、超大規模、還是搜尋品質，三者很難一次全拿。\u003C\u002Fp>\u003Cp>我自己的看法很直接。你要穩定查詢和細緻過濾，先看 Qdrant。你要撐大資料量和高吞吐，先看 Milvus。你要混合搜尋，Weaviate 很順手。這不是信仰問題，是工程問題。\u003C\u002Fp>\u003Ch2>數字怎麼看，才不會被行銷話術帶走\u003C\u002Fh2>\u003Cp>看 benchmark 時，要先注意測試條件。不同廠商會用不同硬體、不同索引、不同 recall 設定。直接比數字，常常會誤判。不過，三者的方向還是很清楚。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776126298862-y2fu.png\" alt=\"2026 RAG 向量資料庫三選一\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>Qdrant 在公開資料裡，常見說法是 1 億向量、95% recall、延遲低於 100ms。Milvus 常被拿來展示 10 億級部署，QPS 可以到 100,000 以上，延遲低於 200ms。Weaviate 則常見在 5 億向量、92% recall、延遲約 150ms 的區間。\u003C\u002Fp>\u003Cp>這些數字的重點，不是誰最猛。重點是它們反映不同取捨。Qdrant 偏向低延遲和效率。Milvus 偏向極限吞吐和擴展。Weaviate 偏向搜尋品質和查詢彈性。你如果拿錯標準，選型就會歪掉。\u003C\u002Fp>\u003Cul>\u003Cli>\u003Cstrong>Qdrant：\u003C\u002Fstrong> 1 億向量，95% recall，低於 100ms\u003C\u002Fli>\u003Cli>\u003Cstrong>Milvus：\u003C\u002Fstrong> 10 億向量，100,000+ QPS，低於 200ms\u003C\u002Fli>\u003Cli>\u003Cstrong>Weaviate：\u003C\u002Fstrong> 5 億向量，92% recall，約 150ms\u003C\u002Fli>\u003Cli>\u003Cstrong>解讀方式：\u003C\u002Fstrong> 看你的瓶頸是延遲、吞吐，還是搜尋品質\u003C\u002Fli>\u003C\u002Ful>\u003Cp>硬體需求也很有參考價值。Qdrant 常見配置是 4 到 8 顆 CPU、8 到 16GB RAM、SSD。Milvus 則常看到 16 到 32 顆 CPU、32 到 64GB RAM、NVMe，還可能加 GPU。Weaviate 介於兩者之間，通常是 8 到 16 顆 CPU、16 到 32GB RAM、SSD。\u003C\u002Fp>\u003Cp>這代表什麼？代表 Milvus 的天花板最高，但你也要付出最多資源。Qdrant 最省心，單機或小叢集都好養。Weaviate 則在功能和成本之間，抓了一個中間值。\u003C\u002Fp>\u003Ch2>功能差異，才是開發者每天會碰到的事\u003C\u002Fh2>\u003Cp>功能面才是日常。因為你不是只在看向量。你還要看 tenant、文件類型、時間區間、權限。Qdrant 的 payload filtering 在這裡很有感。它讓你在檢索時直接加條件，不用繞一大圈。\u003C\u002Fp>\u003Cp>Milvus 的強項是索引選擇多。像 IVF、HNSW、SCANN 都能玩。這對想調 recall、速度、記憶體用量的團隊很重要。你可以根據資料分布和負載去調整，不會被單一路線綁死。\u003C\u002Fp>\u003Cp>Weaviate 的優勢則是混合搜尋。它把 BM25 和向量排序放一起，對搜尋產品很實際。使用者常常既想要精準詞，也想要語意相近。這種場景，單純向量搜尋往往不夠。\u003C\u002Fp>\u003Cul>\u003Cli>\u003Cstrong>Qdrant：\u003C\u002Fstrong> payload filter 強，適合多租戶和權限控制\u003C\u002Fli>\u003Cli>\u003Cstrong>Milvus：\u003C\u002Fstrong> 索引選擇多，適合調校型團隊\u003C\u002Fli>\u003Cli>\u003Cstrong>Weaviate：\u003C\u002Fstrong> hybrid search 直接整合\u003C\u002Fli>\u003Cli>\u003Cstrong>整合面：\u003C\u002Fstrong> Weaviate 對 ML 工具鏈比較友善\u003C\u002Fli>\u003C\u002Ful>\u003Cp>如果你團隊已經用 \u003Ca href=\"https:\u002F\u002Fhuggingface.co\" target=\"_blank\" rel=\"noopener\">Hugging Face\u003C\u002Fa>，Weaviate 會很順。它對多模態 embedding 也比較友善。你如果要做文字、圖片、音訊一起搜，這種整合會省很多工。\u003C\u002Fp>\u003Cp>成本也不能忽略。Qdrant 常常是每台機器效率最好。Milvus 雖然貴，但它買來的是容量和吞吐。Weaviate 的價值在於少接幾個元件，讓整體系統比較簡單。\u003C\u002Fp>\u003Ch2>產業背景，為什麼 2026 會這樣選\u003C\u002Fh2>\u003Cp>RAG 在 2026 年已經不是新玩具。它變成很多 AI 產品的標配。客服、知識庫、企業搜尋、推薦系統，都在用。問題也從「能不能做」變成「能不能穩定跑」。\u003C\u002Fp>\u003Cp>這也是為什麼向量資料庫會分化。早期大家都想做通用解法。現在不行了。你要的是低延遲、還是高吞吐、還是混合搜尋，答案會直接影響架構。資料庫選錯，後面就會一直補洞。\u003C\u002Fp>\u003Cp>另一個背景是資料治理。企業越來越在意 metadata、權限、租戶隔離。這讓 Qdrant 這類強 filter 的方案更有吸引力。反過來說，如果你的搜尋產品本來就很重 query relevance，Weaviate 的定位就更合理。\u003C\u002Fp>\u003Cp>還有一點很現實。很多團隊不是缺模型，是缺維運人力。你如果只有 2 到 3 個工程師，Milvus 的複雜度可能太重。你如果有成熟平台團隊，Milvus 的擴展性就很香。這就是選型的殘酷地方。\u003C\u002Fp>\u003Ch2>結論：先看瓶頸，再選資料庫\u003C\u002Fh2>\u003Cp>如果你要我一句話總結，我會這樣分。Qdrant 是速度和控制。Milvus 是規模和吞吐。Weaviate 是混合搜尋和整合體驗。這三個方向都合理，差別只在你的產品卡在哪裡。\u003C\u002Fp>\u003Cp>我的建議很直接。先拿你自己的資料做測試。看延遲、recall、filter 複雜度、部署成本。不要先信簡報。真實資料一跑，答案通常很快就出來。\u003C\u002Fp>\u003Cp>如果你的 RAG 服務要面對即時查詢，我會先試 Qdrant。 如果你的資料量已經往十億級走，我會優先看 Milvus。 如果你的產品需要語意加關鍵字一起搜，Weaviate 很值得先試。\u003C\u002Fp>\u003Cp>下一步最實際的做法，就是拿同一批 embeddings，跑三套原型。各自測 100、1,000、10,000 筆查詢。你會很快知道哪個最適合你的工作負載。這種答案，比任何型錄都準。\u003C\u002Fp>","2026 年做 RAG，Qdrant、Milvus、Weaviate 各有強項。這篇用延遲、規模、混合搜尋、成本與開發體驗，直接比較三者差異。","dasroot.net","https:\u002F\u002Fdasroot.net\u002Fposts\u002F2026\u002F04\u002Fvector-databases-rag-qdrant-milvus-weaviate-comparison-2026\u002F",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776126302600-xxf9.png",[13,14,15,16,17,18,19,20],"Qdrant","Milvus","Weaviate","RAG","vector database","hybrid search","向量資料庫","人工智慧","zh",1,false,"2026-04-14T00:24:39.218956+00:00","2026-04-14T00:24:39.038+00:00","done","0cec359f-33b7-4378-950e-ef09b222d131","qdrant-milvus-weaviate-rag-2026-comparison-zh","tools","e8390502-7cb7-4bfa-878c-0d2685a39c2a","published","2026-04-14T09:00:10.205+00:00",[34,36,37,39,41,43,45,46],{"name":16,"slug":35},"rag",{"name":20,"slug":20},{"name":18,"slug":38},"hybrid-search",{"name":13,"slug":40},"qdrant",{"name":17,"slug":42},"vector-database",{"name":14,"slug":44},"milvus",{"name":19,"slug":19},{"name":15,"slug":47},"weaviate",{"id":30,"slug":49,"title":50,"language":51},"qdrant-milvus-weaviate-rag-2026-comparison-en","Qdrant vs Milvus vs Weaviate for RAG in 2026","en",[53,59,65,71,77,83],{"id":54,"slug":55,"title":56,"cover_image":57,"image_url":57,"created_at":58,"category":29},"d058a76f-6548-4135-8970-f3a97f255446","why-gemini-api-pricing-is-cheaper-than-it-looks-zh","為什麼 Gemini API 定價其實比看起來更便宜","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778869845081-j4m7.png","2026-05-15T18:30:25.797639+00:00",{"id":60,"slug":61,"title":62,"cover_image":63,"image_url":63,"created_at":64,"category":29},"68e4be16-dc38-4524-a6ea-5ebe22a6c4fb","why-vidhub-huiyuan-hutong-bushi-quan-shebei-tongyong-zh","為什麼 VidHub 會員互通不是「買一次全設備通用」","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778789450987-advz.png","2026-05-14T20:10:24.048988+00:00",{"id":66,"slug":67,"title":68,"cover_image":69,"image_url":69,"created_at":70,"category":29},"7a1e174f-746b-4e82-a0e3-b2475ab39747","why-buns-zig-to-rust-experiment-is-right-zh","為什麼 Bun 的 Zig-to-Rust 實驗是對的","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778767879127-5dna.png","2026-05-14T14:10:26.886397+00:00",{"id":72,"slug":73,"title":74,"cover_image":75,"image_url":75,"created_at":76,"category":29},"e742fc73-5a65-4db3-ad17-88c99262ceb7","why-openai-api-pricing-is-product-strategy-zh","為什麼 OpenAI API 定價是產品策略，不是註腳","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778749859485-chvz.png","2026-05-14T09:10:26.003818+00:00",{"id":78,"slug":79,"title":80,"cover_image":81,"image_url":81,"created_at":82,"category":29},"c757c5d8-eda9-45dc-9020-4b002f4d6237","why-claude-code-prompt-design-beats-ide-copilots-zh","為什麼 Claude Code 的提示設計贏過 IDE Copilot","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778742645084-dao9.png","2026-05-14T07:10:29.371901+00:00",{"id":84,"slug":85,"title":86,"cover_image":87,"image_url":87,"created_at":88,"category":29},"4adef3ab-9f07-4970-91cf-77b8b581b348","why-databricks-model-serving-is-right-default-zh","為什麼 Databricks Model Serving 是生產推論的正確預設","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778692245329-a2wt.png","2026-05-13T17:10:30.659153+00:00",[90,95,100,105,110,115,120,125,130,135],{"id":91,"slug":92,"title":93,"created_at":94},"de769291-4574-4c46-a76d-772bd99e6ec9","googles-biggest-gemini-launches-in-2026-zh","Google 2026 最大 Gemini 盤點","2026-03-26T07:26:39.21072+00:00",{"id":96,"slug":97,"title":98,"created_at":99},"855cd52f-6fab-46cc-a7c1-42195e8a0de4","surepath-real-time-mcp-policy-controls-zh","SurePath 推出即時 MCP 政策控管","2026-03-26T07:57:40.77233+00:00",{"id":101,"slug":102,"title":103,"created_at":104},"9b19ab54-edef-4dbd-9ce4-a51e4bae4ebb","mcp-in-2026-the-ai-tool-layer-teams-use-zh","2026 年 MCP：團隊真的在用的 AI 工具層","2026-03-26T08:01:46.589694+00:00",{"id":106,"slug":107,"title":108,"created_at":109},"af9c46c3-7a28-410b-9f04-32b3de30a68c","prompting-in-2026-what-actually-works-zh","2026 提示工程，真正有用的是什麼","2026-03-26T08:08:12.453028+00:00",{"id":111,"slug":112,"title":113,"created_at":114},"05553086-6ed0-4758-81fd-6cab24b575e0","garry-tan-open-sources-claude-code-toolkit-zh","Garry Tan 開源 Claude Code 工具包","2026-03-26T08:26:20.068737+00:00",{"id":116,"slug":117,"title":118,"created_at":119},"042a73a2-18a2-433d-9e8f-9802b9559aac","github-ai-projects-to-watch-in-2026-zh","2026 必看 20 個 GitHub AI 專案","2026-03-26T08:28:09.619964+00:00",{"id":121,"slug":122,"title":123,"created_at":124},"a5f94120-ac0d-4483-9a8b-63590071ac6a","claude-code-vs-cursor-2026-zh","Claude Code 與 Cursor 深度對比：202…","2026-03-26T13:27:14.279193+00:00",{"id":126,"slug":127,"title":128,"created_at":129},"0975afa1-e0c7-4130-a20d-d890eaed995e","practical-github-guide-learning-ml-2026-zh","2026 機器學習入門 GitHub 實用指南","2026-03-27T01:16:49.712576+00:00",{"id":131,"slug":132,"title":133,"created_at":134},"bfdb467a-290f-4a80-b3a9-6f081afb6dff","aiml-2026-student-ai-ml-lab-repo-review-zh","AIML-2026：像課綱的學生實驗 Repo","2026-03-27T01:21:51.467798+00:00",{"id":136,"slug":137,"title":138,"created_at":139},"80cabc3e-09fc-4ff5-8f07-b8d68f5ae545","ai-trending-github-repos-and-research-feeds-zh","AI Trending：把 AI 資源收成一張表","2026-03-27T01:31:35.262183+00:00"]