今日 Agent Memory 相关论文
从 papers.cool/arxiv/cs.AI 2026-06-05 批次中筛选出以下与 Agent Memory、经验学习、技能提取相关的论文。
🌟 核心论文
1. AdMem: Advanced Memory for Task-solving Agents
- arXiv ID: 2606.06787
- 链接: arxiv.org/abs/2606.06787
- 作者: Runzhe Wang, Huilin Lu, Shengjie Liu, Li Dong, Jason Zhu
摘要要点: 提出统一的自动记忆框架,集成语义记忆(Semantic)、情节记忆(Episodic)和程序记忆(Procedural),采用双层设计(短期 + 长期存储)。通过 Actor-Memory-Critic 多智能体架构实现自动记忆生成、奖励标注和自适应检索。长期记忆通过奖励评估、合并和剪枝管理,确保可扩展性和持续改进。
与开源项目的关联:
- 🔗 MemGPT/Letta:同样采用多层记忆架构,但 AdMem 增加了 Critic Agent 进行奖励标注,自动化程度更高
- 🔗 LangChain Memory:AdMem 的语义/情节/程序三分法超越了 LangChain 简单的 buffer/window 机制
- 🔗 AutoGPT:AdMem 的自动合并/剪枝解决了 AutoGPT 长期记忆膨胀的问题
- 🔗 CrewAI:CrewAI 的记忆系统偏简单,AdMem 的多智能体协作模式提供了更完整的参考
创新点:
- 首次将三种记忆类型(语义/情节/程序)统一到自动框架中
- Critic Agent 的奖励标注机制让记忆质量有了可量化的评估标准
- 处理失败案例的能力,突破了”只回放成功经验”的局限
2. OpenSkill: Open-World Self-Evolution for LLM Agents
- arXiv ID: 2606.06741
- 链接: arxiv.org/abs/2606.06741
- 作者: Zhiling Yan, Dingjie Song, Hanrong Zhang, Wei Liang, Yuxuan Zhang, Yutong Dai, Lifang He, Philip S. Yu, Ran Xu, Xiang Li, Lichao Sun
摘要要点: 研究开放世界自演化问题——智能体在只有任务提示、没有监督信号的情况下,从零构建技能和验证信号。OpenSkill 框架利用开放世界资源构建自我验证循环。
与开源项目的关联:
- 🔗 MemGPT:OpenSkill 的”从零构建技能”与 MemGPT 的自我管理记忆有相似哲学
- 🔗 AutoGPT / BabyAGI:将”预设学习循环”推进到”无监督自建学习循环”
- 🔗 LlamaIndex:OpenSkill 的技能构建可视为一种程序记忆的自动生成
创新点:
- 无需任何目标任务的监督信号,仅靠开放世界资源
- 同时构建技能和验证信号,实现真正的自主进化
3. Workflow-to-Skill: Skill Creation via RWSA Decomposition
- arXiv ID: 2606.06893
- 链接: arxiv.org/abs/2606.06893
- 作者: Yuyang Zhang, Xinyuan Han, Xudong Jiang, Run Wang
摘要要点: 提出从异构交互证据(演示、轨迹、工具追踪、执行日志)自动构建技能的框架。引入 RWSA 中间表示(Routing-Workflow-Semantics-Attachments),将轨迹视为可执行运行时规范而非可压缩文本。
与开源项目的关联:
- 🔗 LangChain:技能文件可类比 LangChain 的 Tool/Chain 定义,但更强调从真实轨迹自动提取
- 🔗 CrewAI:CrewAI 的技能定义偏静态,W2S 提供了自动化构建路径
- 🔗 所有框架:直接关联”程序记忆如何写入”这一核心问题
创新点:
- 轨迹→技能不是简单摘要,而是可执行规范的提取
- 保留安全关键行为和置信度标注
4. Declarative Skills for AI Agents in Knowledge-Grounded Tool-Use Workflows
- arXiv ID: 2606.06923
- 链接: arxiv.org/abs/2606.06923
- 作者: M. Danish Lim, I. Danial Bin Sharudin, Wen Han Chen, Cedric Lim, Laura Wynter
摘要要点: 对比声明式 Agent(通过自然语言技能文件编排)、命令式 Agent(状态机驱动)和无脚手架基线 Agent。关键发现:检索质量是 Agent 性能的主导瓶颈——当证据不完整时,所有 Agent 都会显著退化,技能文件无法弥补。
与开源项目的关联:
- 🔗 RAG 系统(LlamaIndex 等):直接印证了检索质量是记忆系统的生命线
- 🔗 MemGPT:声明式 vs 命令式的对比对 MemGPT 的记忆管理策略有启发
- 🔗 LangChain:检索瓶颈的发现对所有基于 RAG 的记忆框架都有警示意义
创新点:
- 用 Dec-POMDP 形式化分析三种编排范式
- 实验证明检索质量 > 编排策略,这是很有价值的实证发现
📎 相关论文
5. DuMate-DeepResearch: Multi-Agent System with Recursive Search
- arXiv ID: 2606.07299
- 链接: arxiv.org/abs/2606.07299
- 关联: 多智能体系统中的信息检索与证据管理,递归搜索子任务委托机制
6. StainFlow: Entity-Stain Tracking for Process Rewards in GUI Agents
- arXiv ID: 2606.07027
- 链接: arxiv.org/abs/2606.07027
- 关联: 轨迹级别的实体状态追踪,可视为一种动态情节记忆机制
研究趋势分析
🔥 热门方向
| 方向 | 趋势 | 代表论文 |
|---|---|---|
| 统一记忆架构 | 从单一记忆向语义+情节+程序统一发展 | AdMem |
| 技能自动提取 | 从手工编写技能到从轨迹自动构建 | W2S, OpenSkill |
| 自演化/自进化 | Agent 部署后无监督持续学习 | OpenSkill |
| 检索质量瓶颈 | 社区开始正视 RAG 的根本性局限 | Declarative Skills |
| 多智能体记忆协作 | 通过 Agent 分工实现记忆的生成、评估、检索 | AdMem (Actor-Memory-Critic) |
📊 关键洞察
记忆三分法成为共识:语义记忆(事实)、情节记忆(经历)、程序记忆(技能)的分类正在被学术界广泛采纳,AdMem 是首个统一三者的自动框架。
**”从成功回放”到”从失败学习”**:以往的程序记忆研究倾向于重放成功轨迹,AdMem 明确提出处理失败案例的重要性,这是一个重要的范式转变。
检索质量是记忆系统的阿喀琉斯之踵:Declarative Skills 论文的实证发现——无论编排多精巧,检索质量不行就全崩——对整个 RAG+Memory 领域都是一记警钟。
技能即记忆,轨迹即规范:W2S 论文将轨迹提升为”可执行运行时规范”,而不仅是可压缩文本,这对程序记忆的写入机制有深远影响。
开放世界自演化是下一个前沿:OpenSkill 代表了一种大胆的尝试——完全不依赖人工标注或预设验证器,Agent 从零构建自己的技能库。
与 19 个开源记忆项目的关联矩阵
| 论文 | MemGPT | LangChain | LlamaIndex | AutoGPT | CrewAI | 其他 |
|---|---|---|---|---|---|---|
| AdMem | 架构升级 | 替代简单buffer | 互补 | 解决膨胀 | 丰富记忆 | 多Agent记忆协作新范式 |
| OpenSkill | 自管理+自构建 | — | 检索增强 | 自演化升级 | — | 无监督技能发现 |
| W2S | 轨迹→程序记忆 | Tool定义自动化 | — | 轨迹复用 | 技能自动生成 | 程序记忆写入机制 |
| Declarative Skills | 编排策略对比 | RAG瓶颈警示 | 检索质量验证 | — | 声明式vs命令式 | Dec-POMDP形式化 |
总结
本期最值得关注的是 AdMem——它代表了当前 Agent Memory 研究的前沿水平:统一的三层记忆架构、多智能体协作的记忆管理、以及处理失败经验的能力。结合 W2S 的技能自动提取和 OpenSkill 的开放世界自演化,我们看到了一个清晰的技术路线:从被动存储到主动构建,从单一类型到统一架构,从静态知识到持续演化。
检索质量瓶颈的发现则提醒我们:记忆系统的上限取决于检索系统的质量,这也是 RAG 和 Memory 研究需要共同面对的核心挑战。