標籤

RAG

RAG（Retrieval-Augmented Generation）把檢索與生成接在一起，讓模型先找資料再回答，常見於企業知識庫、語意搜尋、客服與研究助理。這裡聚焦向量資料庫、混合搜尋、索引與召回評估等實作議題。

32 篇文章

13 步建出 Milvus RAG 堆疊

工具應用/5月23日

13 步建出 Milvus RAG 堆疊

這篇操作指南教你用 Python、Docker、Milvus、LangChain 一步一步做出可查詢、可過濾、可延伸到正式環境的 RAG 堆疊。

Prompt engineering 讓模糊需求變可用輸出

工具應用/5月21日

Prompt engineering 讓模糊需求變可用輸出

我把 prompt engineering 拆成可直接抄的幾個寫法：怎麼寫約束、塞例子、控上下文，還有一份可貼進工作流的模板。

怎麼做 AI Agent 提示工程

AI Agent/5月19日

怎麼做 AI Agent 提示工程

這篇教你先定義 AI agent 的職責、系統規則、輸出格式與決策邊界，做出可測試的提示框架。

Oracle：AI 不必再加一個資料庫

產業動態/5月17日

Oracle：AI 不必再加一個資料庫

InfoWorld 指出，多數企業 AI 應直接在既有資料庫做向量檢索，而不是再建一套向量庫。

2026 向量資料庫怎麼選

工具應用/5月17日

2026 向量資料庫怎麼選

這篇教你用規模、價格和架構三步篩選 2026 年的向量資料庫，做出可落地的 shortlist。

如何在正式環境加入 Temporal RAG

AI Agent/5月13日

如何在正式環境加入 Temporal RAG

這篇教你在既有 RAG 中加入時間感知重排層，讓新版本、有效期間內的事件與最新資料優先被 LLM 使用。

如何用 LangGraph 打造 Agentic RAG

AI Agent/5月7日

如何用 LangGraph 打造 Agentic RAG

這篇教你用 LangGraph 建立一個會路由、檢索、驗證並回答問題的 Agentic RAG 工作流。

為什麼 RAG 正在結束，agentic AI 需要的是編譯式知識層

AI Agent/5月7日

為什麼 RAG 正在結束，agentic AI 需要的是編譯式知識層

RAG 不再適合作為 agentic AI 的預設架構，因為代理需要可重用、可驗證的編譯式知識層，而不是每一步都重新檢索原始文本。

為什麼 RAG 需要自癒層，而不只是更好的提示詞

技術研究/5月7日

為什麼 RAG 需要自癒層，而不只是更好的提示詞

RAG 應被視為會失敗的系統，真正該補的是即時自癒層，而不是繼續迷信提示詞調校。

為什麼開源 LLM 應該按工作負載來選，不該看熱度

技術研究/5月7日

為什麼開源 LLM 應該按工作負載來選，不該看熱度

2026 年選開源 LLM，應該先看工作負載是否匹配，而不是追逐排行榜與發布熱度。

RAG 是什麼？白話看懂

技術研究/5月7日

RAG 是什麼？白話看懂

RAG 讓 LLM 先查文件再回答，能減少幻覺、補上引用，也更適合企業知識庫與即時資料。

Paperless-AI：把文件庫變聊天機器人

工具應用/5月6日

Paperless-AI：把文件庫變聊天機器人

Paperless-AI 把 Paperless-ngx 變成可聊天的文件庫，結合 RAG、hybrid search、AI 標籤與自架部署，適合大量合約、發票與內部文件。

RAG 精準調校反而害檢索

技術研究/5月6日

RAG 精準調校反而害檢索

Redis 研究指出，RAG embedding 若只追求 precision，檢索準確率可能掉 40%，還會拖累 agentic pipeline。

Agentic AI 為何開始跳過 RAG

AI Agent/5月6日

Agentic AI 為何開始跳過 RAG

Agentic AI 正從 RAG 轉向預先編譯的知識層，重點是減少推理時重複讀資料、降 token 成本，讓多步驟代理更好控。

AWS Bedrock Knowledge Bases 怎麼簡化 RAG

工具應用/5月5日

AWS Bedrock Knowledge Bases 怎麼簡化 RAG

AWS Bedrock Knowledge Bases 把 RAG 的擷取、向量庫、重排序和引用整合成託管服務，適合要接企業內部資料的 AI 應用。

為什麼 Databricks 的 RAG 是平台戰，不是功能

產業動態/5月5日

為什麼 Databricks 的 RAG 是平台戰，不是功能

Databricks 把 RAG 當成端到端平台問題，這不是包裝，而是正確的產品判斷。

5 步完成 RAG 管線

AI Agent/5月5日

5 步完成 RAG 管線

這篇教你用 5 個步驟做出 RAG 管線，讓模型先檢索你的文件，再根據內容產生有依據的答案。

Actian VectorAI DB 主打 22 倍搜尋速度

工具應用/5月5日

Actian VectorAI DB 主打 22 倍搜尋速度

Actian 推出 VectorAI DB，把向量搜尋塞進資料庫內，主打比常見方案快 22 倍，也想少掉外部向量服務的整合成本。

為什麼 2026 AI 工程師路線圖不是最佳起點

產業動態/5月4日

為什麼 2026 AI 工程師路線圖不是最佳起點

2026 AI 工程師路線圖太寬，適合當參考，不適合當第一份學習計畫。

為什麼 Qdrant Cloud 的企業化推進，對 AI 檢索很重要

工具應用/5月4日

為什麼 Qdrant Cloud 的企業化推進，對 AI 檢索很重要

Qdrant Cloud 把向量檢索做成企業級基礎設施，因為 AI 檢索真正需要的是速度、可用性與可稽核性，而不是只會跑 demo。

MathNet 把數學推理和檢索一起測

技術研究/4月21日

MathNet 把數學推理和檢索一起測

MathNet 用 30,676 題、47 國、17 語言的奧賽數學題，同時測推理、相似題檢索與 RAG 效果。

2026 RAG 向量資料庫三選一

工具應用/4月14日

2026 RAG 向量資料庫三選一

2026 年做 RAG，Qdrant、Milvus、Weaviate 各有強項。這篇用延遲、規模、混合搜尋、成本與開發體驗，直接比較三者差異。

Redis 向量搜尋快速上手

工具應用/4月14日

Redis 向量搜尋快速上手

Redis 不只拿來快取。這篇看它怎麼存 embeddings、建索引、跑 KNN 查詢，順手把語意搜尋和 RAG 的實作路徑講清楚。

IBM 單機塞進 1000 億向量

技術研究/4月14日

IBM 單機塞進 1000 億向量

IBM 宣稱 CAS 原型在單一伺服器上索引 1000 億向量，平均延遲 694 毫秒、召回率超過 90%。這篇拆解它怎麼做、跟一般向量資料庫差在哪、以及對企業 RAG 架構的影響。

開源 AI 專案清單怎麼挑

工具應用/4月12日

開源 AI 專案清單怎麼挑

這份 GitHub 清單收錄可直接上線的開源 AI 專案，從 PyTorch 到 vLLM 都有，2,486 顆星，適合想找模型、推理、RAG 和代理工具的工程師。

Windsurf Flow 怎麼讓上下文不斷線

工具應用/4月4日

Windsurf Flow 怎麼讓上下文不斷線

Windsurf Flow 用索引、記憶與規則維持 AI 上下文。本文拆解 Cascade、Tab、RAG 與 .windsurfrules 的運作方式，並比較它和其他 AI 寫碼工具的差異。

ChatGPT 廣告越來越一致

產業動態/4月3日

ChatGPT 廣告越來越一致

40,000 筆廣告版位分析顯示，ChatGPT 廣告正變得更短、更直白、更標準化。這反映 OpenAI 在優化轉換，也透露 LLM 使用習慣正在往任務導向收斂。

FerresDB 走向正式上線的 Rust 搜尋

工具應用/4月3日

FerresDB 走向正式上線的 Rust 搜尋

FerresDB 新增 PolarQuant、HNSW 自動調參、PITR、reranking 與 Raft 分散式儲存，開始像一套可上線的 Rust 向量資料庫。

OpenRAG 在企業 AI 的用途

工具應用/4月3日

OpenRAG 在企業 AI 的用途

IBM OpenRAG 把檢索、索引和模型協調包成一套。適合用公司內部資料做 RAG，讓回答更貼近文件，也更好追查來源。

Amazon Bedrock Agents 進入多代理工作流

AI Agent/4月1日

Amazon Bedrock Agents 進入多代理工作流

AWS 為 Amazon Bedrock Agents 加入記憶、程式執行與多代理協作，目標是處理更複雜的企業工作流。

2026 必看 20 個 GitHub AI 專案

工具應用/3月26日

2026 必看 20 個 GitHub AI 專案

OpenClaw 衝到約 30.2 萬 GitHub stars 很吸睛，但 2026 年更大的變化其實是另一件事：開源 AI 焦點正從聊天介面，轉向 agents、工作流程、RAG 與多模態工具。這份名單反映的，是 AI 正在變成可部署的軟體基礎層。

2026 年企業 AI 為何更靠 RAG

產業動態/3月26日

2026 年企業 AI 為何更靠 RAG

RAG 已從展示用技術走進企業預算。原因很直接：公司要的是能讀取最新內部資料、可追溯、可控權限的 AI，而不是只會背舊訓練資料的聊天模型。到了 2026 年，真正有用的重點在檢索品質、權限治理、即時資料連接與合規設計。