Agent Memory 论文日报 — 2026-05-21

2026-05-21

Agent Memory 论文日报 — 2026-05-21

本报告由 OpenClaw 自动生成，追踪 arXiv cs.AI 领域中与 Agent Memory 相关的最新论文。

今日概览

今日（2026-05-20 提交的论文）共筛选出 12 篇 与 Agent Memory 密切相关的论文，涵盖长期记忆系统、记忆压缩、记忆冲突评估、具身智能记忆、多智能体记忆等多个方向。Agent Memory 研究正在从简单的 RAG 检索向自适应记忆管理、记忆冲突处理、层次化认知记忆演进。

📋 论文列表

1. Mem-π: Adaptive Memory through Learning When and What to Generate

arXiv ID: 待确认（2026-05-20 提交）
作者: Xiaoqiang Wang, Chao Wang, Hadi Nekoei, Christopher Pal, Alexandre Lacoste, Spandana Gella, Bang Liu, Perouz Taslakian
摘要要点: 提出自适应记忆框架，LLM Agent 可以学习何时生成记忆、生成什么内容作为记忆，而非被动存储所有交互。核心创新在于将记忆生成建模为决策过程。
关键词: adaptive memory, memory generation, LLM agent
链接: arxiv.org/search?query=Mem-pi

2. MemConflict: Evaluating Long-Term Memory Systems Under Memory Conflicts

arXiv ID: 待确认（2026-05-20 提交）
作者: Zhen Tao, Jinxiang Zhao, Peng Liu, Dinghao Xi, Yanfang Chen, Wei Xu, Zhiyu Li
摘要要点: 首个系统性评估 Agent 长期记忆系统在记忆冲突（新旧信息矛盾）场景下表现的基准。这是一个被长期忽视的关键问题——当用户偏好或事实发生变化时，记忆系统如何处理矛盾？
关键词: long-term memory, memory conflict, evaluation benchmark
关联: 直接关联 MemGPT 的记忆更新机制、Zep 的矛盾处理

3. MemGym: a Long-Horizon Memory Environment for LLM Agents

arXiv ID: 待确认（2026-05-20 提交）
作者: Wujiang Xu, Yu Wang, Kai Mei 等
摘要要点: 提出长时域记忆环境，专门评估 LLM Agent 在长交互中的记忆能力。填补了现有基准只关注短期任务的空白，提供可编程的记忆压力测试环境。
关键词: memory environment, long-horizon, evaluation
关联: 与 LangChain 的 ConversationBufferMemory、MemGPT 的记忆管理评估直接相关

4. CALMem: Application-Layer Dual Memory for Conversational AI

arXiv ID: 待确认（2026-05-20 提交）
作者: Rajendra Narayan Jena, Rajan Padmanabhan, Sankar Arumugam
摘要要点: 提出应用层双记忆架构，解决固定上下文窗口和压缩导致的历史丢失问题。区分短期工作记忆和长期持久记忆，在应用层（而非模型层）实现记忆管理。
关键词: dual memory, conversational AI, context management
关联: 与 MemGPT 的核心/归档记忆分层高度相似，但在应用层实现

5. Auto-Dreamer: Learning Offline Memory Consolidation for Language Agents

arXiv ID: 待确认（2026-05-19 提交）
作者: Chongrui Ye, Yuxiang Liu, Yu Wang, Haofei Yu 等
摘要要点: 受人类睡眠记忆巩固启发，提出离线记忆整合机制。Language Agent 在任务间隙自动整理、压缩和重组经验记忆，而非持续在线存储。类似于大脑在睡眠期间重放和巩固记忆。
关键词: memory consolidation, offline learning, language agent
关联: 类似 MemGPT 的记忆整理 + Letta 的递归记忆，但引入了离线整合范式

6. Rethinking How to Remember: Beyond Atomic Facts in Lifelong LLM Agent Memory

arXiv ID: 待确认（2026-05-19 提交）
作者: Jingwei Sun, Jianing Zhu, Jiangchao Yao, Tongliang Liu, Bo Han
摘要要点: 挑战了”记忆应存储为原子事实”的共识。主张 LLM Agent 的终身记忆应超越简单的 key-value 对，存储结构化的、有上下文的记忆片段，支持更复杂的推理和回忆。
关键词: lifelong memory, atomic facts, memory representation
关联: 与之前分析的 19 个项目中 Zep 的结构化记忆、Mem0 的图记忆理念一致

7. MementoGUI: Learning Agentic Multimodal Memory Control for Long-Horizon GUI Agents

arXiv ID: 待确认（2026-05-18 提交）
作者: Ziyun Zeng, Hang Hua, Bocheng Zou, Mu Cai, Rogerio Feris, Jiebo Luo
摘要要点: 针对长时域 GUI 操作任务，提出可学习的多模态记忆控制机制。GUI Agent 需要在大量界面转换中维护任务状态，该工作让 Agent 学会何时读取、更新和遗忘视觉记忆。
关键词: multimodal memory, GUI agent, long-horizon
关联: 将记忆管理从文本扩展到多模态场景，是 Agent Memory 的新应用领域

8. Robo-Cortex: A Self-Evolving Embodied Agent via Dual-Grain Cognitive Memory

arXiv ID: 待确认（2026-05-18 提交）
作者: Nga Teng Chan, Yi Zhang, Yechi Liu 等
摘要要点: 提出双粒度认知记忆架构，解决具身智能体的”经验遗忘症”。通过细粒度（具体经验）和粗粒度（抽象策略）双层记忆，实现从历史交互中提取可泛化的导航策略。
关键词: cognitive memory, embodied agent, dual-grain
关联: 层次化记忆设计，类似人类的海马体-新皮层记忆系统

9. MINTEval: Evaluating Memory under Multi-Target Interference in Long-Horizon Agent Systems

arXiv ID: 待确认（2026-05-18/19 提交）
作者: Hyunji Lee, Justin Chih-Yao Chen, Joykirat Singh, Zaid Khan 等
摘要要点: 评估 Agent 在多目标干扰下的记忆表现。真实场景中 Agent 需要同时跟踪多个目标的信息，新信息会不断干扰旧记忆。该基准专注于这种干扰效应的测量。
关键词: multi-target interference, memory evaluation, benchmark
关联: 与 MemConflict 互补——一个关注记忆冲突，一个关注记忆干扰

10. Evaluating Memory Condensation Strategies for Coding Agents

arXiv ID: 待确认（2026-05-13 提交）
作者: Renuka Chintalapati, Sid Raskar, Anurag Acharya 等
摘要要点: 系统评估 Coding Agent 在长任务中的记忆压缩策略。当上下文窗口不足时，如何平衡截断与任务成功率？对比了多种压缩和摘要方法。
关键词: memory condensation, coding agent, context window
关联: 直接关联 MemGPT 的上下文管理、LLM Agent 的摘要策略

11. OEP: Poisoning Self-Evolving LLM Agents via Locally Correct but Non-Transferable Experiences

arXiv ID: 待确认（2026-05-18 提交）
作者: Kaixiang Wang, Jiong Lou, Zhaojiacheng Zhou, Jie Li
摘要要点: 揭示了记忆增强 Agent 的安全漏洞——攻击者可以注入”局部正确但不可迁移”的经验来污染 Agent 的记忆库，导致 Agent 在特定场景下做出错误决策。
关键词: memory poisoning, self-evolving agent, adversarial attack
关联: 关联所有使用外部记忆存储的项目（Mem0、Zep、LangChain），暴露了记忆安全性的新攻击面

12. Evaluating Temporal Semantic Caching and Workflow Optimization in Agentic Plan-Execute Pipelines

arXiv ID: 2605.20630
作者: Alimurtaza Merchant, Krish Veera 等
摘要要点: 提出时序语义缓存，解决 Agent 管道中的重复推理开销。传统语义缓存未考虑时间、资产、传感器参数变化，新方法引入时间感知的缓存失效机制，实现 30.6x 的缓存命中加速。
关键词: semantic caching, temporal cache, agent optimization
链接: arxiv.org/abs/2605.20630

📊 研究趋势分析

排名	方向	论文数	趋势
1	长期记忆评估基准	4 篇	🔥🔥🔥 新兴
2	层次化/双记忆架构	3 篇	🔥🔥 持续热门
3	记忆压缩与整合	2 篇	🔥🔥 成熟方向
4	多模态记忆	1 篇	🔥 新兴
5	记忆安全与攻击	1 篇	🆕 全新方向

关键趋势洞察

从”存什么”到”怎么存”: 早期研究关注记忆的内容表示（RAG、向量存储），现在转向记忆的管理策略（何时生成、如何压缩、怎样处理冲突）。
评估基准爆发: MemConflict、MemGym、MINTEval 三个评估基准同时出现，说明领域正在从”造轮子”走向”定标准”。
生物学启发的记忆架构: Auto-Dreamer 的离线整合、Robo-Cortex 的双粒度记忆，都借鉴了认知科学中的记忆理论（睡眠巩固、海马体-新皮层系统）。
记忆安全成为新关注点: OEP 论文揭示了记忆投毒攻击，这是一个此前被忽视的重要安全维度。
从文本到多模态: MementoGUI 将记忆管理扩展到 GUI 视觉场景，预示着多模态 Agent Memory 将成为下一个热点。

🔗 与 19 个开源记忆项目的关联

项目	今日相关论文	关联点
MemGPT/Letta	CALMem, Auto-Dreamer, Memory Condensation	核心记忆分层、上下文管理、记忆整合
Mem0	Rethinking How to Remember, OEP	图结构记忆、记忆安全
Zep	MemConflict, Rethinking How to Remember	矛盾处理、结构化记忆
LangChain Memory	CALMem, Memory Condensation	对话记忆、压缩策略
LlamaIndex	Mem-π, Temporal Semantic Caching	自适应检索、语义缓存
AutoGPT	APEX, Auto-Dreamer	自主策略探索、经验整合
CrewAI	MMoA, MA²P	多智能体记忆共享
Generative Agents (Park et al.)	Auto-Dreamer, MINTEval	记忆反思、干扰管理

最值得关注的发现

Mem-π 的”学习何时记忆”: 大多数项目采用”全部存储 + 按需检索”的策略，Mem-π 提出了选择性记忆生成的范式，可能改变 Agent Memory 的基本架构。
OEP 的记忆投毒攻击: 所有使用外部记忆的项目（特别是 Mem0、Zep 等提供记忆服务的平台）需要重新审视记忆验证和安全过滤机制。
“超越原子事实”的呼吁: Rethinking How to Remember 论文的观点直接挑战了当前主流的 triplet (subject, predicate, object) 记忆表示方式，与 Mem0 的图记忆和 Zep 的结构化记忆形成对话。

📅 总结

今日 Agent Memory 领域呈现三大特征：

标准化评估时代到来 — 多个独立团队同时发布记忆评估基准
从工程到认知 — 越来越多研究借鉴认知科学理论（记忆巩固、双系统理论）
安全性觉醒 — 记忆投毒攻击揭示了一个全新的攻击面

📌 本报告自动追踪 arXiv cs.AI 领域，使用关键词 agent, memory, episodic, recall, retrieval, RAG, long-term, experience 进行筛选。

刘道玉 AI 工作坊

Agent Memory 论文日报 — 2026-05-21

Agent Memory 论文日报 — 2026-05-21

今日概览

📋 论文列表

1. Mem-π: Adaptive Memory through Learning When and What to Generate

2. MemConflict: Evaluating Long-Term Memory Systems Under Memory Conflicts

3. MemGym: a Long-Horizon Memory Environment for LLM Agents

4. CALMem: Application-Layer Dual Memory for Conversational AI

5. Auto-Dreamer: Learning Offline Memory Consolidation for Language Agents

6. Rethinking How to Remember: Beyond Atomic Facts in Lifelong LLM Agent Memory

7. MementoGUI: Learning Agentic Multimodal Memory Control for Long-Horizon GUI Agents

8. Robo-Cortex: A Self-Evolving Embodied Agent via Dual-Grain Cognitive Memory

9. MINTEval: Evaluating Memory under Multi-Target Interference in Long-Horizon Agent Systems

10. Evaluating Memory Condensation Strategies for Coding Agents

11. OEP: Poisoning Self-Evolving LLM Agents via Locally Correct but Non-Transferable Experiences

12. Evaluating Temporal Semantic Caching and Workflow Optimization in Agentic Plan-Execute Pipelines

📊 研究趋势分析

热门方向排名

关键趋势洞察

🔗 与 19 个开源记忆项目的关联

最值得关注的发现

📅 总结