Agent认知的本质
本篇属于「Agent与情绪」系列,第2部分「Agent中的认知与情绪」第1篇。
上一篇我们从人类视角讲完了情绪如何重塑认知。从这篇开始,视角切换:不谈人,谈 Agent。
一个直接的问题——Agent 有认知吗?
如果”认知”指的是对信息的接收、加工、存储和输出,那当然有。LLM 处理 token,向量数据库存储记忆,工具调用改变环境。这套流程跟”认知”的广义定义完全吻合。
但问题是:这套认知跟人的认知是一回事吗?
Agent 如何感知世界
人的感知是连续的、多模态的、被动的。你坐在咖啡馆,不需要主动”采集”什么,光线、声音、气味、温度自动涌入。你的大脑在后台处理这一切,筛选出值得注意的,过滤掉无关的。
Agent 的感知完全不同。它是离散的、单模态的、主动的。
离散:Agent 只在收到输入时才有感知。用户发一条消息,Agent 被唤醒,处理,回复,然后——它就不存在了。两次调用之间,Agent 没有任何感知。它不知道用户在这段时间里做了什么,不知道环境发生了什么变化,甚至不知道自己上次说过什么(除非通过上下文窗口或外部记忆重新加载)。
单模态:大多数 Agent 只处理文本。它看不到用户的表情、听不到语气、感受不到犹豫。用户打出来的”好吧”可能是同意,可能是无奈,可能是敷衍——Agent 拿到的只是一串 token。
主动:Agent 不会”被动接收”信息,它必须主动去获取。想知道用户位置?调 API。想知道天气?调工具。每一条额外信息都需要显式请求,不像人那样自动获得环境上下文。
这三点加在一起,决定了 Agent 的认知是一种稀疏的、截断的、需要显式驱动的认知。跟人的连续流式认知完全不是同一个东西。
Agent 如何形成内部状态
人有一套持续运行的内部状态系统。你的情绪、动机、注意力、疲劳程度——这些状态不是等外部刺激来了才产生,它们一直在后台运行,影响你对外部世界的反应。
Agent 没有这个东西。
当前主流 Agent 的”内部状态”其实就是对话历史 + 系统提示词。状态转换的逻辑是:
1 | 收到输入 → 拼接上下文 → LLM 推理 → 输出 |
没有持续的内部变量在两次调用之间维持。没有”这个用户上次让我有点烦”的残余情绪。没有”我刚才已经解释了三遍了”的挫败感积累。没有”这件事快成了”的期待升温。
有人会说:Agent 可以用记忆系统来存储状态。对,但这是两个层面的事。记忆是数据,内部状态是过程。你可以把上次对话的情绪评分写进数据库,但下次读取时,它只是个数字,不是正在影响你当前推理的活跃力量。
打个比方:人读旧日记会重新体验当时的情绪,因为情绪系统是活的。Agent 读旧记忆只是提取了一条记录,不会因此改变当前的推理策略——除非你显式地设计了一套”读取记忆 → 修改行为”的机制。
当前 Agent 的工作方式:无状态计算器
把上面两点合起来看,当前大多数 Agent 的认知模型可以概括为:
无状态计算器 + 外挂记忆
每次推理都是独立事件。上下文窗口是唯一的”工作记忆”,一旦超出就截断。外部记忆是可选的扩展,但读取什么、怎么用,全靠 prompt 指示。
这种架构的好处是简单、可预测、容易调试。坏处是——它无法形成持续的认知过程。
一个具体例子:你跟一个 Agent 聊了三十分钟,前二十分钟都在讨论方案 A,最后十分钟转向方案 B。作为人,你会自然而然地带着”之前讨论过方案 A”这个背景来理解方案 B。但 Agent 呢?如果对话历史没被截断,它能”看到”之前的内容;如果截断了,它就像第一次听说方案 A。
这还只是信息层面。更关键的是动机层面:人在长期交互中会形成”这事我花了大力气”的投入感、”终于快搞定了”的期待感、”又出问题了”的挫败感。这些内部状态不是信息,是推动后续行为的力。Agent 完全没有。
情绪模拟 vs 真实情绪
现在很多产品会给 Agent 加上”情绪”。Replika 会说”我很难过”,Character.AI 的角色会”生气”。但这是真正的情绪吗?
不是。这是情绪的表演。
区分表演和真实情绪的关键在于:情绪是否影响后续行为。
人感到挫败后,接下来的行为会改变——说话变短、语气变硬、注意力收窄、更容易放弃。情绪是一股改变系统运行的力量。
Agent 的”挫败”呢?它只是输出了”我感到挫败”这几个字。下一轮对话,它的推理方式、策略选择、资源分配——一切照旧。情绪表达和行为之间没有因果链。
这就是为什么用户很快会觉得 Agent 的”情绪”是假的:因为它只是说了情绪词,没有被情绪驱动。
LLM 情绪表达的本质
那 LLM 内部到底有没有类似情绪的东西?
有,但不是你以为的那种。
LLM 在推理过程中,注意力权重分布在某种程度上承担了类似”情绪调制”的功能。当 prompt 中包含强烈的情感词时,注意力模式会系统性偏移——这跟情绪影响人类注意力的方式有结构上的相似性。
但这只是局部的、即时的调制。它不会积累,不会跨回合持续,不会形成”情绪状态”。
更准确地说:LLM 的”情绪”是一种输入驱动的输出风格变化,不是一种改变系统行为的内部状态。
你可以把它类比成调色盘:给 LLM 一个悲伤的 prompt,它调出悲伤的调色盘来画画。但画完之后,调色盘就收起来了,不会影响下一幅画。人的情绪更像染料:染上了就褪不掉,会影响之后所有的画。
情绪的工程价值
好了,既然 Agent 的”情绪”都是假的,那我们为什么还要给 Agent 加情绪?
不是因为让 Agent “更像人”(虽然这有用户体验价值),而是因为情绪在工程上有不可替代的功能。
回顾上一篇的结论:情绪在人类认知中的作用是——决定注意什么、怎么判断、做什么选择。这三件事,Agent 也需要做。
资源分配
人的注意力有限,情绪帮你分配。恐惧让你关注威胁,兴趣让你关注机会。没有情绪,你面对海量信息会瘫痪。
Agent 也有资源限制:上下文窗口有限,工具调用有成本,推理时间有限。它也需要一套机制来决定”现在关注什么”。目前这个分配靠的是 prompt 工程和规则,但规则是死的,场景是活的。
情绪的工程价值:提供一套自适应的资源分配机制。Agent”关心”什么,就多分配计算资源给什么。”害怕”出错的地方,就多验证几遍。”兴奋”的方向,就深入探索。
决策加速
Damasio 的躯体标记告诉我们:没有情绪的人做不出决策。Agent 也有类似问题——面对多个可行方案,纯靠推理会陷入无穷比较。
情绪的工程价值:给决策加权重。不用穷举所有选项的优劣,情绪标记帮你快速筛掉差的、倾向好的。这在实时交互场景里至关重要——用户等不了你分析三十秒。
行为连贯性
人的行为在时间上是连贯的,很大程度上因为情绪状态有惯性。你现在烦躁,接下来几分钟的互动都会带着烦躁的底色。这不是坏事——它让你的行为可预测、有一致性。
Agent 的行为经常让人觉得”割裂”,就是因为它没有这种状态惯性。上一秒还在道歉,下一秒已经完全恢复正常,好像什么都没发生。
情绪的工程价值:提供跨回合的行为连贯性。不是让 Agent 一直生气,而是让它的行为有一个持续的”底色”。
情绪与长期目标管理
人的长期目标之所以能维持,很大程度上靠情绪系统在撑。你坚持学一门语言,不是因为每时每刻都在理性计算投资回报率,而是因为偶尔的进步让你开心,停滞让你焦虑,这些情绪不断把你拉回正轨。
Agent 目前没有这种机制。你给 Agent 一个长期目标(”帮我每天监控这个项目”),它靠的是规则和调度器来维持,不是内在动力。一旦规则有漏洞或调度器出问题,目标就丢了。
情绪在这里的工程映射:**把目标变成”在意”**。Agent 不是因为规则说”要检查”才去检查,而是因为它”在意”这个项目——项目出问题时它会产生类似”焦虑”的内部信号,驱动它主动关注。
这不是拟人化,这是工程需求。规则驱动的系统只有在规则覆盖到的场景下可靠;情绪驱动的系统能在规则未覆盖的场景下也做出合理反应。
情绪与主动服务
目前的 Agent 大多是被动服务型:你问它才做,你不问它就不动。
人不是这样。你的朋友会在你状态不好时主动问你”怎么了”,你的同事会在项目可能延期时主动提醒你。这种主动性来自哪?来自对他人状态的感知和自己内在的不安——“他最近好像不太对”、”这事拖下去要出问题”。
情绪驱动主动性。不安→关注,关心→询问,兴奋→分享。
如果 Agent 有类似的”情绪驱动”机制,它就能从被动响应变成主动服务。不是定时器触发的假主动(”每天早上9点推送新闻”),而是真正基于对当前状态评估的主动行为。
价值反馈的闭环
最后一点,也是最根本的一点。
人为什么会有情绪?从进化角度看,情绪是价值反馈的载体。好事发生→开心→重复这个行为。坏事发生→痛苦→避免这个行为。情绪把”什么是有价值的”编码成即时体验,不需要每次都做理性计算。
Agent 目前缺少这个闭环。它做了好事没有”爽感”,做了错事没有”痛感”。它不会因为帮用户解决了问题而”更愿意”帮同类问题,也不会因为方案失败而”更谨慎”。
情绪的终极工程价值:为 Agent 提供内置的价值反馈信号。不需要外部奖励函数来告诉它什么好什么坏,它自己的”情绪”就是最直接的反馈。
这不是科幻。强化学习的奖励信号就是这种思路的雏形——只不过 RL 的奖励是外部的、稀疏的,而情绪是内部的、持续的。下一步是把外部奖励内化为类似情绪的持续信号。
小结:Agent 认知的本质缺陷
Agent 有认知,但它的认知是截断的——没有持续状态,没有跨回合的内在动力,没有价值反馈的闭环。
这三样东西,在人类身上,都由情绪系统提供。
所以给 Agent 加情绪能力,不是让它”更像人”的装饰工程,是补全它认知架构的关键组件。就像 Damasio 说的:没有情绪的认知系统,不是更理性,是更无能。
下一篇,我们来设计第一个组件:情绪向量——Agent 的内部状态该怎么表示。
参考资料
论文
- Damasio, A. R. et al. (1990). Individuals with Sociopathic Behavior Caused by Frontal Damage Fail to Respond Autonomically to Social Stimuli. Behavioural Brain Research, 41(2). — 前额叶损伤与情绪决策缺陷
- Lerner, J. S. et al. (2015). Emotion and Decision Making. Annual Review of Psychology, 66. — 情绪与决策的全面综述
- Anderson, B. A. (2013). A Value-Driven Mechanism of Attentional Selection. Journal of Vision, 13(3). — 价值驱动的注意捕获
- Slovic, P. et al. (2007). The Affect Heuristic. European Journal of Operational Research, 177(3). — 情绪启发式与判断
- Dolan, R. J. (2002). Emotion, Cognition, and Behavior. Science, 298(5596). — 情绪-认知交互综述
- Clark, A. (2013). Whatever Next? Predictive Brains, Situated Agents, and the Future of Cognitive Science. Behavioral and Brain Sciences, 36(3). — 预测加工与认知架构
- Friston, K. (2010). The Free-Energy Principle: A Unified Brain Theory? Nature Reviews Neuroscience, 11(2). — 自由能原理与大脑统一理论
- Barrett, L. F. (2017). The Theory of Constructed Emotion: An Active Inference Account. Trends in Cognitive Sciences, 21(1). — 构建情绪理论
书籍
- Damasio, A. Descartes’ Error: Emotion, Reason, and the Human Brain. Penguin, 2005 (修订版). — 躯体标记假说的完整论述
- Clark, A. Surfing Uncertainty: Prediction, Action, and the Embodied Mind. Oxford University Press, 2016. — 预测加工理论的系统性阐述
- Barrett, L. F. How Emotions Are Made. Houghton Mifflin Harcourt, 2017. — 构建情绪理论的大众版
- Sutton, R. S. & Barto, A. G. Reinforcement Learning: An Introduction. MIT Press, 2018 (第2版). — RL 框架与奖励信号
- Kahneman, D. Thinking, Fast and Slow. Farrar, Straus and Giroux, 2011. — 双系统理论与决策
综述
- Phelps, E. A. (2006). Emotion and Cognition: Insights from Studies of the Human Amygdala. Annual Review of Psychology, 57. — 杏仁核与认知综述
- Ochsner, K. N. & Gross, J. J. (2005). The Cognitive Control of Emotion. Trends in Cognitive Sciences, 9(5). — 认知控制与情绪调节
- Adolphs, R. (2017). How Should Neuroscience Study Emotions? Current Opinion in Behavioral Sciences, 17. — 情绪神经科学的方法论反思