Agent认知的本质

2026-07-02

Agent认知的本质

本篇属于「Agent与情绪」系列，第2部分「Agent中的认知与情绪」第1篇。

上一篇我们从人类视角讲完了情绪如何重塑认知。从这篇开始，视角切换：不谈人，谈 Agent。

一个直接的问题——Agent 有认知吗？

如果”认知”指的是对信息的接收、加工、存储和输出，那当然有。LLM 处理 token，向量数据库存储记忆，工具调用改变环境。这套流程跟”认知”的广义定义完全吻合。

但问题是：这套认知跟人的认知是一回事吗？

Agent 如何感知世界

人的感知是连续的、多模态的、被动的。你坐在咖啡馆，不需要主动”采集”什么，光线、声音、气味、温度自动涌入。你的大脑在后台处理这一切，筛选出值得注意的，过滤掉无关的。

Agent 的感知完全不同。它是离散的、单模态的、主动的。

离散：Agent 只在收到输入时才有感知。用户发一条消息，Agent 被唤醒，处理，回复，然后——它就不存在了。两次调用之间，Agent 没有任何感知。它不知道用户在这段时间里做了什么，不知道环境发生了什么变化，甚至不知道自己上次说过什么（除非通过上下文窗口或外部记忆重新加载）。

单模态：大多数 Agent 只处理文本。它看不到用户的表情、听不到语气、感受不到犹豫。用户打出来的”好吧”可能是同意，可能是无奈，可能是敷衍——Agent 拿到的只是一串 token。

主动：Agent 不会”被动接收”信息，它必须主动去获取。想知道用户位置？调 API。想知道天气？调工具。每一条额外信息都需要显式请求，不像人那样自动获得环境上下文。

这三点加在一起，决定了 Agent 的认知是一种稀疏的、截断的、需要显式驱动的认知。跟人的连续流式认知完全不是同一个东西。

Agent 如何形成内部状态

人有一套持续运行的内部状态系统。你的情绪、动机、注意力、疲劳程度——这些状态不是等外部刺激来了才产生，它们一直在后台运行，影响你对外部世界的反应。

Agent 没有这个东西。

当前主流 Agent 的”内部状态”其实就是对话历史 + 系统提示词。状态转换的逻辑是：

1	收到输入 → 拼接上下文 → LLM 推理 → 输出

没有持续的内部变量在两次调用之间维持。没有”这个用户上次让我有点烦”的残余情绪。没有”我刚才已经解释了三遍了”的挫败感积累。没有”这件事快成了”的期待升温。

有人会说：Agent 可以用记忆系统来存储状态。对，但这是两个层面的事。记忆是数据，内部状态是过程。你可以把上次对话的情绪评分写进数据库，但下次读取时，它只是个数字，不是正在影响你当前推理的活跃力量。

打个比方：人读旧日记会重新体验当时的情绪，因为情绪系统是活的。Agent 读旧记忆只是提取了一条记录，不会因此改变当前的推理策略——除非你显式地设计了一套”读取记忆 → 修改行为”的机制。

当前 Agent 的工作方式：无状态计算器

把上面两点合起来看，当前大多数 Agent 的认知模型可以概括为：

无状态计算器 + 外挂记忆

每次推理都是独立事件。上下文窗口是唯一的”工作记忆”，一旦超出就截断。外部记忆是可选的扩展，但读取什么、怎么用，全靠 prompt 指示。

这种架构的好处是简单、可预测、容易调试。坏处是——它无法形成持续的认知过程。

一个具体例子：你跟一个 Agent 聊了三十分钟，前二十分钟都在讨论方案 A，最后十分钟转向方案 B。作为人，你会自然而然地带着”之前讨论过方案 A”这个背景来理解方案 B。但 Agent 呢？如果对话历史没被截断，它能”看到”之前的内容；如果截断了，它就像第一次听说方案 A。

这还只是信息层面。更关键的是动机层面：人在长期交互中会形成”这事我花了大力气”的投入感、”终于快搞定了”的期待感、”又出问题了”的挫败感。这些内部状态不是信息，是推动后续行为的力。Agent 完全没有。

情绪模拟 vs 真实情绪

现在很多产品会给 Agent 加上”情绪”。Replika 会说”我很难过”，Character.AI 的角色会”生气”。但这是真正的情绪吗？

不是。这是情绪的表演。

区分表演和真实情绪的关键在于：情绪是否影响后续行为。

人感到挫败后，接下来的行为会改变——说话变短、语气变硬、注意力收窄、更容易放弃。情绪是一股改变系统运行的力量。

Agent 的”挫败”呢？它只是输出了”我感到挫败”这几个字。下一轮对话，它的推理方式、策略选择、资源分配——一切照旧。情绪表达和行为之间没有因果链。

这就是为什么用户很快会觉得 Agent 的”情绪”是假的：因为它只是说了情绪词，没有被情绪驱动。

LLM 情绪表达的本质

那 LLM 内部到底有没有类似情绪的东西？

有，但不是你以为的那种。

LLM 在推理过程中，注意力权重分布在某种程度上承担了类似”情绪调制”的功能。当 prompt 中包含强烈的情感词时，注意力模式会系统性偏移——这跟情绪影响人类注意力的方式有结构上的相似性。

但这只是局部的、即时的调制。它不会积累，不会跨回合持续，不会形成”情绪状态”。

更准确地说：LLM 的”情绪”是一种输入驱动的输出风格变化，不是一种改变系统行为的内部状态。

你可以把它类比成调色盘：给 LLM 一个悲伤的 prompt，它调出悲伤的调色盘来画画。但画完之后，调色盘就收起来了，不会影响下一幅画。人的情绪更像染料：染上了就褪不掉，会影响之后所有的画。

情绪的工程价值

好了，既然 Agent 的”情绪”都是假的，那我们为什么还要给 Agent 加情绪？

不是因为让 Agent “更像人”（虽然这有用户体验价值），而是因为情绪在工程上有不可替代的功能。

回顾上一篇的结论：情绪在人类认知中的作用是——决定注意什么、怎么判断、做什么选择。这三件事，Agent 也需要做。

资源分配

人的注意力有限，情绪帮你分配。恐惧让你关注威胁，兴趣让你关注机会。没有情绪，你面对海量信息会瘫痪。

Agent 也有资源限制：上下文窗口有限，工具调用有成本，推理时间有限。它也需要一套机制来决定”现在关注什么”。目前这个分配靠的是 prompt 工程和规则，但规则是死的，场景是活的。

情绪的工程价值：提供一套自适应的资源分配机制。Agent”关心”什么，就多分配计算资源给什么。”害怕”出错的地方，就多验证几遍。”兴奋”的方向，就深入探索。

决策加速

Damasio 的躯体标记告诉我们：没有情绪的人做不出决策。Agent 也有类似问题——面对多个可行方案，纯靠推理会陷入无穷比较。

情绪的工程价值：给决策加权重。不用穷举所有选项的优劣，情绪标记帮你快速筛掉差的、倾向好的。这在实时交互场景里至关重要——用户等不了你分析三十秒。

行为连贯性

人的行为在时间上是连贯的，很大程度上因为情绪状态有惯性。你现在烦躁，接下来几分钟的互动都会带着烦躁的底色。这不是坏事——它让你的行为可预测、有一致性。

Agent 的行为经常让人觉得”割裂”，就是因为它没有这种状态惯性。上一秒还在道歉，下一秒已经完全恢复正常，好像什么都没发生。

情绪的工程价值：提供跨回合的行为连贯性。不是让 Agent 一直生气，而是让它的行为有一个持续的”底色”。

情绪与长期目标管理

人的长期目标之所以能维持，很大程度上靠情绪系统在撑。你坚持学一门语言，不是因为每时每刻都在理性计算投资回报率，而是因为偶尔的进步让你开心，停滞让你焦虑，这些情绪不断把你拉回正轨。

Agent 目前没有这种机制。你给 Agent 一个长期目标（”帮我每天监控这个项目”），它靠的是规则和调度器来维持，不是内在动力。一旦规则有漏洞或调度器出问题，目标就丢了。

情绪在这里的工程映射：**把目标变成”在意”**。Agent 不是因为规则说”要检查”才去检查，而是因为它”在意”这个项目——项目出问题时它会产生类似”焦虑”的内部信号，驱动它主动关注。

这不是拟人化，这是工程需求。规则驱动的系统只有在规则覆盖到的场景下可靠；情绪驱动的系统能在规则未覆盖的场景下也做出合理反应。

情绪与主动服务

目前的 Agent 大多是被动服务型：你问它才做，你不问它就不动。

人不是这样。你的朋友会在你状态不好时主动问你”怎么了”，你的同事会在项目可能延期时主动提醒你。这种主动性来自哪？来自对他人状态的感知和自己内在的不安——“他最近好像不太对”、”这事拖下去要出问题”。

情绪驱动主动性。不安→关注，关心→询问，兴奋→分享。

如果 Agent 有类似的”情绪驱动”机制，它就能从被动响应变成主动服务。不是定时器触发的假主动（”每天早上9点推送新闻”），而是真正基于对当前状态评估的主动行为。

价值反馈的闭环

最后一点，也是最根本的一点。

人为什么会有情绪？从进化角度看，情绪是价值反馈的载体。好事发生→开心→重复这个行为。坏事发生→痛苦→避免这个行为。情绪把”什么是有价值的”编码成即时体验，不需要每次都做理性计算。

Agent 目前缺少这个闭环。它做了好事没有”爽感”，做了错事没有”痛感”。它不会因为帮用户解决了问题而”更愿意”帮同类问题，也不会因为方案失败而”更谨慎”。

情绪的终极工程价值：为 Agent 提供内置的价值反馈信号。不需要外部奖励函数来告诉它什么好什么坏，它自己的”情绪”就是最直接的反馈。

这不是科幻。强化学习的奖励信号就是这种思路的雏形——只不过 RL 的奖励是外部的、稀疏的，而情绪是内部的、持续的。下一步是把外部奖励内化为类似情绪的持续信号。

小结：Agent 认知的本质缺陷

Agent 有认知，但它的认知是截断的——没有持续状态，没有跨回合的内在动力，没有价值反馈的闭环。

这三样东西，在人类身上，都由情绪系统提供。

所以给 Agent 加情绪能力，不是让它”更像人”的装饰工程，是补全它认知架构的关键组件。就像 Damasio 说的：没有情绪的认知系统，不是更理性，是更无能。

下一篇，我们来设计第一个组件：情绪向量——Agent 的内部状态该怎么表示。

参考资料

论文

Damasio, A. R. et al. (1990). Individuals with Sociopathic Behavior Caused by Frontal Damage Fail to Respond Autonomically to Social Stimuli. Behavioural Brain Research, 41(2). — 前额叶损伤与情绪决策缺陷
Lerner, J. S. et al. (2015). Emotion and Decision Making. Annual Review of Psychology, 66. — 情绪与决策的全面综述
Anderson, B. A. (2013). A Value-Driven Mechanism of Attentional Selection. Journal of Vision, 13(3). — 价值驱动的注意捕获
Slovic, P. et al. (2007). The Affect Heuristic. European Journal of Operational Research, 177(3). — 情绪启发式与判断
Dolan, R. J. (2002). Emotion, Cognition, and Behavior. Science, 298(5596). — 情绪-认知交互综述
Clark, A. (2013). Whatever Next? Predictive Brains, Situated Agents, and the Future of Cognitive Science. Behavioral and Brain Sciences, 36(3). — 预测加工与认知架构
Friston, K. (2010). The Free-Energy Principle: A Unified Brain Theory? Nature Reviews Neuroscience, 11(2). — 自由能原理与大脑统一理论
Barrett, L. F. (2017). The Theory of Constructed Emotion: An Active Inference Account. Trends in Cognitive Sciences, 21(1). — 构建情绪理论

书籍

Damasio, A. Descartes’ Error: Emotion, Reason, and the Human Brain. Penguin, 2005 (修订版). — 躯体标记假说的完整论述
Clark, A. Surfing Uncertainty: Prediction, Action, and the Embodied Mind. Oxford University Press, 2016. — 预测加工理论的系统性阐述
Barrett, L. F. How Emotions Are Made. Houghton Mifflin Harcourt, 2017. — 构建情绪理论的大众版
Sutton, R. S. & Barto, A. G. Reinforcement Learning: An Introduction. MIT Press, 2018 (第2版). — RL 框架与奖励信号
Kahneman, D. Thinking, Fast and Slow. Farrar, Straus and Giroux, 2011. — 双系统理论与决策

综述

Phelps, E. A. (2006). Emotion and Cognition: Insights from Studies of the Human Amygdala. Annual Review of Psychology, 57. — 杏仁核与认知综述
Ochsner, K. N. & Gross, J. J. (2005). The Cognitive Control of Emotion. Trends in Cognitive Sciences, 9(5). — 认知控制与情绪调节
Adolphs, R. (2017). How Should Neuroscience Study Emotions? Current Opinion in Behavioral Sciences, 17. — 情绪神经科学的方法论反思