返回首頁

標籤

RAG

RAG(Retrieval-Augmented Generation)把檢索與生成接在一起,讓模型先找資料再回答,常見於企業知識庫、語意搜尋、客服與研究助理。這裡聚焦向量資料庫、混合搜尋、索引與召回評估等實作議題。

34 篇文章

如何在正式環境加入 Temporal RAG
AI Agent/5月13日

如何在正式環境加入 Temporal RAG

這篇教你在既有 RAG 中加入時間感知重排層,讓新版本、有效期間內的事件與最新資料優先被 LLM 使用。

LongMemEval-V2:測 agent 長期記憶
技術研究/5月13日

LongMemEval-V2:測 agent 長期記憶

LongMemEval-V2 用 451 題測試 agent 能否記住 Web 環境經驗,而不只是使用者歷史;結果顯示以 coding agent 蒐證的記憶法準確率最高,但延遲也更高。

RAGFlow 加入 Agent 與自架部署
工具應用/5月12日

RAGFlow 加入 Agent 與自架部署

RAGFlow 把開源 RAG、Agent、自架部署和新模型支援整合在一起,適合處理 PDF、表格和多來源文件的團隊。

為什麼 Pinecone 的編譯式向量工件才是 AI agents 的正解
AI Agent/5月9日

為什麼 Pinecone 的編譯式向量工件才是 AI agents 的正解

Pinecone 的方向是對的:AI agents 需要先編譯好的知識工件,而不是每次即時翻找原始向量。

為什麼 Microsoft Foundry 的 RAG 需要更好的索引,不需要…
產業動態/5月9日

為什麼 Microsoft Foundry 的 RAG 需要更好的索引,不需要…

Microsoft Foundry 的 RAG 成敗關鍵在索引與檢索品質,不在把提示詞越寫越長。

為什麼 ChatGPT 的 goblin bug 證明封閉模型太脆弱
產業動態/5月9日

為什麼 ChatGPT 的 goblin bug 證明封閉模型太脆弱

ChatGPT 的 goblin bug 說明,封閉式 LLM 若無法被外部審計與約束,就不適合當作嚴肅生產系統的底層基礎。

怎麼做 n8n 進階 RAG
AI Agent/5月8日

怎麼做 n8n 進階 RAG

這篇教你在 n8n 裡做一條可上線的進階 RAG 流程,包含切塊、混合檢索、重排序與壓縮。

如何用 LangGraph 打造 Agentic RAG
AI Agent/5月7日

如何用 LangGraph 打造 Agentic RAG

這篇教你用 LangGraph 建立一個會路由、檢索、驗證並回答問題的 Agentic RAG 工作流。

為什麼 RAG 正在結束,agentic AI 需要的是編譯式知識層
AI Agent/5月7日

為什麼 RAG 正在結束,agentic AI 需要的是編譯式知識層

RAG 不再適合作為 agentic AI 的預設架構,因為代理需要可重用、可驗證的編譯式知識層,而不是每一步都重新檢索原始文本。

為什麼 RAG 需要自癒層,而不只是更好的提示詞
技術研究/5月7日

為什麼 RAG 需要自癒層,而不只是更好的提示詞

RAG 應被視為會失敗的系統,真正該補的是即時自癒層,而不是繼續迷信提示詞調校。

為什麼開源 LLM 應該按工作負載來選,不該看熱度
技術研究/5月7日

為什麼開源 LLM 應該按工作負載來選,不該看熱度

2026 年選開源 LLM,應該先看工作負載是否匹配,而不是追逐排行榜與發布熱度。

RAG 是什麼?白話看懂
技術研究/5月7日

RAG 是什麼?白話看懂

RAG 讓 LLM 先查文件再回答,能減少幻覺、補上引用,也更適合企業知識庫與即時資料。

Paperless-AI:把文件庫變聊天機器人
工具應用/5月6日

Paperless-AI:把文件庫變聊天機器人

Paperless-AI 把 Paperless-ngx 變成可聊天的文件庫,結合 RAG、hybrid search、AI 標籤與自架部署,適合大量合約、發票與內部文件。

RAG 精準調校反而害檢索
技術研究/5月6日

RAG 精準調校反而害檢索

Redis 研究指出,RAG embedding 若只追求 precision,檢索準確率可能掉 40%,還會拖累 agentic pipeline。

Agentic AI 為何開始跳過 RAG
AI Agent/5月6日

Agentic AI 為何開始跳過 RAG

Agentic AI 正從 RAG 轉向預先編譯的知識層,重點是減少推理時重複讀資料、降 token 成本,讓多步驟代理更好控。

AWS Bedrock Knowledge Bases 怎麼簡化 RAG
工具應用/5月5日

AWS Bedrock Knowledge Bases 怎麼簡化 RAG

AWS Bedrock Knowledge Bases 把 RAG 的擷取、向量庫、重排序和引用整合成託管服務,適合要接企業內部資料的 AI 應用。

為什麼 Databricks 的 RAG 是平台戰,不是功能
產業動態/5月5日

為什麼 Databricks 的 RAG 是平台戰,不是功能

Databricks 把 RAG 當成端到端平台問題,這不是包裝,而是正確的產品判斷。

5 步完成 RAG 管線
AI Agent/5月5日

5 步完成 RAG 管線

這篇教你用 5 個步驟做出 RAG 管線,讓模型先檢索你的文件,再根據內容產生有依據的答案。

RAG 是什麼,為何重要
技術研究/5月5日

RAG 是什麼,為何重要

RAG 讓 LLM 先查外部可信資料再回答,能降低幻覺、更新更快,也更適合企業文件與權限控管。

Actian VectorAI DB 主打 22 倍搜尋速度
工具應用/5月5日

Actian VectorAI DB 主打 22 倍搜尋速度

Actian 推出 VectorAI DB,把向量搜尋塞進資料庫內,主打比常見方案快 22 倍,也想少掉外部向量服務的整合成本。

為什麼 2026 AI 工程師路線圖不是最佳起點
產業動態/5月4日

為什麼 2026 AI 工程師路線圖不是最佳起點

2026 AI 工程師路線圖太寬,適合當參考,不適合當第一份學習計畫。

為什麼 Qdrant Cloud 的企業化推進,對 AI 檢索很重要
工具應用/5月4日

為什麼 Qdrant Cloud 的企業化推進,對 AI 檢索很重要

Qdrant Cloud 把向量檢索做成企業級基礎設施,因為 AI 檢索真正需要的是速度、可用性與可稽核性,而不是只會跑 demo。

MathNet 把數學推理和檢索一起測
技術研究/4月21日

MathNet 把數學推理和檢索一起測

MathNet 用 30,676 題、47 國、17 語言的奧賽數學題,同時測推理、相似題檢索與 RAG 效果。

2026 RAG 向量資料庫三選一
工具應用/4月14日

2026 RAG 向量資料庫三選一

2026 年做 RAG,Qdrant、Milvus、Weaviate 各有強項。這篇用延遲、規模、混合搜尋、成本與開發體驗,直接比較三者差異。

Redis 向量搜尋快速上手
工具應用/4月14日

Redis 向量搜尋快速上手

Redis 不只拿來快取。這篇看它怎麼存 embeddings、建索引、跑 KNN 查詢,順手把語意搜尋和 RAG 的實作路徑講清楚。

IBM 單機塞進 1000 億向量
技術研究/4月14日

IBM 單機塞進 1000 億向量

IBM 宣稱 CAS 原型在單一伺服器上索引 1000 億向量,平均延遲 694 毫秒、召回率超過 90%。這篇拆解它怎麼做、跟一般向量資料庫差在哪、以及對企業 RAG 架構的影響。

開源 AI 專案清單怎麼挑
工具應用/4月12日

開源 AI 專案清單怎麼挑

這份 GitHub 清單收錄可直接上線的開源 AI 專案,從 PyTorch 到 vLLM 都有,2,486 顆星,適合想找模型、推理、RAG 和代理工具的工程師。

Windsurf Flow 怎麼讓上下文不斷線
工具應用/4月4日

Windsurf Flow 怎麼讓上下文不斷線

Windsurf Flow 用索引、記憶與規則維持 AI 上下文。本文拆解 Cascade、Tab、RAG 與 .windsurfrules 的運作方式,並比較它和其他 AI 寫碼工具的差異。

ChatGPT 廣告越來越一致
產業動態/4月3日

ChatGPT 廣告越來越一致

40,000 筆廣告版位分析顯示,ChatGPT 廣告正變得更短、更直白、更標準化。這反映 OpenAI 在優化轉換,也透露 LLM 使用習慣正在往任務導向收斂。

FerresDB 走向正式上線的 Rust 搜尋
工具應用/4月3日

FerresDB 走向正式上線的 Rust 搜尋

FerresDB 新增 PolarQuant、HNSW 自動調參、PITR、reranking 與 Raft 分散式儲存,開始像一套可上線的 Rust 向量資料庫。

OpenRAG 在企業 AI 的用途
工具應用/4月3日

OpenRAG 在企業 AI 的用途

IBM OpenRAG 把檢索、索引和模型協調包成一套。適合用公司內部資料做 RAG,讓回答更貼近文件,也更好追查來源。

Amazon Bedrock Agents 進入多代理工作流
AI Agent/4月1日

Amazon Bedrock Agents 進入多代理工作流

AWS 為 Amazon Bedrock Agents 加入記憶、程式執行與多代理協作,目標是處理更複雜的企業工作流。

2026 必看 20 個 GitHub AI 專案
工具應用/3月26日

2026 必看 20 個 GitHub AI 專案

OpenClaw 衝到約 30.2 萬 GitHub stars 很吸睛,但 2026 年更大的變化其實是另一件事:開源 AI 焦點正從聊天介面,轉向 agents、工作流程、RAG 與多模態工具。這份名單反映的,是 AI 正在變成可部署的軟體基礎層。

2026 年企業 AI 為何更靠 RAG
產業動態/3月26日

2026 年企業 AI 為何更靠 RAG

RAG 已從展示用技術走進企業預算。原因很直接:公司要的是能讀取最新內部資料、可追溯、可控權限的 AI,而不是只會背舊訓練資料的聊天模型。到了 2026 年,真正有用的重點在檢索品質、權限治理、即時資料連接與合規設計。