返回首頁

標籤

vector database

向量資料庫是 RAG、語意搜尋與 AI agent 記憶的核心基礎,負責把嵌入向量做高效檢索與相似度比對。這個主題會涵蓋 Qdrant、Milvus、Weaviate 等選型,以及延遲、規模、混合搜尋、成本與部署取捨。

8 篇文章

如何在正式環境加入 Temporal RAG
AI Agent/5月13日

如何在正式環境加入 Temporal RAG

這篇教你在既有 RAG 中加入時間感知重排層,讓新版本、有效期間內的事件與最新資料優先被 LLM 使用。

為什麼 Pinecone 的編譯式向量工件才是 AI agents 的正解
AI Agent/5月9日

為什麼 Pinecone 的編譯式向量工件才是 AI agents 的正解

Pinecone 的方向是對的:AI agents 需要先編譯好的知識工件,而不是每次即時翻找原始向量。

如何用 LangGraph 打造 Agentic RAG
AI Agent/5月7日

如何用 LangGraph 打造 Agentic RAG

這篇教你用 LangGraph 建立一個會路由、檢索、驗證並回答問題的 Agentic RAG 工作流。

為什麼 RAG 正在結束,agentic AI 需要的是編譯式知識層
AI Agent/5月7日

為什麼 RAG 正在結束,agentic AI 需要的是編譯式知識層

RAG 不再適合作為 agentic AI 的預設架構,因為代理需要可重用、可驗證的編譯式知識層,而不是每一步都重新檢索原始文本。

5 步完成 RAG 管線
AI Agent/5月5日

5 步完成 RAG 管線

這篇教你用 5 個步驟做出 RAG 管線,讓模型先檢索你的文件,再根據內容產生有依據的答案。

為什麼 Qdrant Cloud 的企業化推進,對 AI 檢索很重要
工具應用/5月4日

為什麼 Qdrant Cloud 的企業化推進,對 AI 檢索很重要

Qdrant Cloud 把向量檢索做成企業級基礎設施,因為 AI 檢索真正需要的是速度、可用性與可稽核性,而不是只會跑 demo。

2026 RAG 向量資料庫三選一
工具應用/4月14日

2026 RAG 向量資料庫三選一

2026 年做 RAG,Qdrant、Milvus、Weaviate 各有強項。這篇用延遲、規模、混合搜尋、成本與開發體驗,直接比較三者差異。

AI Agent 記憶怎麼設計
AI Agent/4月1日

AI Agent 記憶怎麼設計

AI agent 要能跨任務保持狀態,記憶設計就很重要。本文拆解短期、長期與外部記憶,並比較框架、資料庫與向量檢索的取捨。