標籤

agent memory

2 篇文章

LongMemEval-V2：測 agent 長期記憶

LongMemEval-V2 用 451 題測試 agent 能否記住 Web 環境經驗，而不只是使用者歷史；結果顯示以 coding agent 蒐證的記憶法準確率最高，但延遲也更高。

AI agent 要能跨任務保持狀態，記憶設計就很重要。本文拆解短期、長期與外部記憶，並比較框架、資料庫與向量檢索的取捨。