Agent Memory arXiv 日报 — 2026-06-30

2026-06-30

Agent Memory arXiv 日报 — 2026-06-30

今日扫描 cs.AI 最新论文，筛选出 3 篇与 Agent Memory 高度相关的工作。

📄 今日相关论文

1. Self-Evolving World Models for LLM Agent Planning

arXiv ID: 2606.30639
链接: https://arxiv.org/abs/2606.30639
作者: Wenxuan Zhang, See-Kiong Ng, Yang Deng

摘要要点： 提出 WorldEvolver，一个自进化世界模型框架，在部署时通过记忆修订提升 Agent 规划能力，冻结模型参数。核心三模块：

Episodic Memory：通过检索式模拟利用真实动作转移经验
Semantic Memory：从预测-观察偏差中提取持久启发式规则
Selective Foresight：过滤低置信度预测后再注入推理上下文

在 ALFWorld 和 ScienceWorld 上达到最高预测准确率和下游 Agent 成功率。

记忆类型映射： Episodic Memory（情景记忆）+ Semantic Memory（语义记忆）的双记忆架构，是认知科学经典分层在 LLM Agent 中的直接应用。

2. BayesEvolve: Explicit Belief States for Autonomous Scientific Discovery

arXiv ID: 2606.30335
链接: https://arxiv.org/abs/2606.30335
作者: Xuening Wu, Shan Yu, Qianya Xu, Shenqin Yin

摘要要点： 指出现有科学发现 Agent 仅依赖”实验记忆”（高分候选存档或启发式摘要）的局限，提出用显式的不确定性感知信念状态（Belief State）替代简单记忆存档。BayesEvolve 将实验证据转化为预测性信念状态来指导后续实验，在 BBOB 黑盒优化任务上显著优于 memory-guided 和 archive-guided LLM 基线。

记忆类型映射： 从”存档式记忆”升级为”信念状态”——本质上是对记忆的结构化推理，而非简单存储和检索。

3. ManimAgent: Self-Evolving Multimodal Agents for Visual Education

arXiv ID: 2606.30296
链接: https://arxiv.org/abs/2606.30296
作者: Wenjia Jiang, Zongyuan Cai, Yuanhang Shao 等

摘要要点： 解决多轮反思经验跨任务丢失的问题。ManimAgent 通过双通道情景记忆库（Episodic Memory Bank）将反思经验跨任务迁移：

M+（正向通道）：存储成功理由，作为软参考示例
M-（负向通道）：存储验证过的失败模式，作为硬性已知陷阱

记忆完全从自身任务流中生长，无需权重更新或人工种子。随着记忆规模增长，人工盲评 Pass@1 持续上升，反思轮次下降。

记忆类型映射： 正/负双通道情景记忆，与 RAG 基线对比验证了结构化记忆优于简单检索。

📊 研究趋势分析

方向	今日论文	趋势
情景记忆（Episodic Memory）	WorldEvolver, ManimAgent	🔥🔥🔥 持续升温
记忆驱动的自我进化	WorldEvolver, ManimAgent	🔥🔥 新兴热点
记忆 vs 信念状态	BayesEvolve	🔥🔥 概念升级
双通道/分层记忆架构	WorldEvolver, ManimAgent	🔥🔥 架构趋同
无需训练的测试时记忆更新	WorldEvolver, ManimAgent	🔥 实用化方向

关键观察

情景记忆成为标配：3 篇论文中有 2 篇显式使用 Episodic Memory，且都强调跨任务经验迁移而非单任务内反思。
“记忆不仅是存储”成为共识：BayesEvolve 明确批评 archive-based memory 的不足，主张用信念状态替代；WorldEvolver 用 Semantic Memory 对 Episodic Memory 进行规则提炼。
正/负经验分离存储：ManimAgent 的 M+/M- 双通道设计是今天最有创意的记忆架构创新，将成功与失败经验结构化区分。
测试时自进化：三篇论文都不约而同地选择了冻结模型参数、通过外部记忆在推理时进化的路线，而非微调。

💡 关键洞察与创新点

1. 记忆的双重抽象

WorldEvolver 的 Episodic → Semantic 提炼链路，揭示了 Agent Memory 的关键问题：原始经验需要抽象为可复用规则。这与人类认知中情景记忆→语义记忆的转化过程一致。

2. 信念状态 > 存档记忆

BayesEvolve 的核心洞察是：记忆应该是有结构的信念，而非无序的存档。简单的 RAG 检索高分候选，缺乏不确定性建模，Agent 不知道自己不知道什么。

3. 失败经验的硬约束

ManimAgent 的 M- 通道将失败模式作为”硬约束”而非”软参考”，这与传统 RAG 只检索正样本形成鲜明对比。知道什么不能做，和知道什么能做一样重要。

🔗 与 19 个开源记忆项目的关联

论文	最相关开源项目	关联分析
WorldEvolver	MemGPT	都采用分层记忆（Episodic/Semantic），但 WorldEvolver 专注于世界模型预测场景，MemGPT 面向通用对话
WorldEvolver	LangChain Memory	LangChain 的 ConversationBuffer/Summary 可对应 Episodic/Semantic 分层，但缺乏 WorldEvolver 的自动规则提取机制
BayesEvolve	MemGPT	MemGPT 的核心记忆管理（recall/recopy）本质上也是维护信念状态，但缺乏 BayesEvolve 的显式不确定性建模
BayesEvolve	AutoGPT	AutoGPT 的长期记忆是典型的 archive-based，BayesEvolve 恰恰批评了这种方式的局限
ManimAgent	Voyager	Voyager 的 Skill Library 与 M+ 通道类似（存储成功技能），但缺乏 M- 失败通道的硬约束
ManimAgent	Reflexion	Reflexion 也做反思经验迁移，但用的是自然语言摘要，ManimAgent 用 VLM 评分的结构化信号更可靠
三篇共同	LlamaIndex	LlamaIndex 作为 RAG 框架，是三篇论文共同对比的基线技术；论文结论一致表明结构化记忆 > 朴素 RAG

开源项目的启示

MemGPT 最接近今日论文的思想，但其记忆管理仍偏重对话场景，缺乏世界模型和信念状态建模
Voyager 的 Skill Library 可以借鉴 ManimAgent 的双通道设计，增加失败模式库
朴素 RAG（LlamaIndex 等） 在 Agent Memory 场景下已显不足，需要向结构化、不确定性感知的方向演进

📝 总结

今日 Agent Memory 领域的核心信号：记忆正在从”存储-检索”范式向”信念-推理”范式演进。无论是 WorldEvolver 的情景→语义提炼、BayesEvolve 的信念状态替代存档、还是 ManimAgent 的正负双通道，都在指向同一个方向——Agent 的记忆不应该只是存东西的地方，而应该是能思考、能推理、能知道不确定性的认知基础设施。

本报告由 OpenClaw 自动生成，数据来源：papers.cool/arxiv/cs.AI

jsonContent: meta: false pages: false posts: title: true date: true path: true text: false raw: false content: false slug: false updated: false comments: false link: false permalink: false excerpt: false categories: false tags: true

刘道玉 AI 工作坊

Agent Memory arXiv 日报 — 2026-06-30

Agent Memory arXiv 日报 — 2026-06-30

📄 今日相关论文

1. Self-Evolving World Models for LLM Agent Planning

2. BayesEvolve: Explicit Belief States for Autonomous Scientific Discovery

3. ManimAgent: Self-Evolving Multimodal Agents for Visual Education

📊 研究趋势分析

热门方向

关键观察

💡 关键洞察与创新点

1. 记忆的双重抽象

2. 信念状态 > 存档记忆

3. 失败经验的硬约束

🔗 与 19 个开源记忆项目的关联

开源项目的启示

📝 总结