Agent是否需要情绪
本篇属于「Agent与情绪」系列,第2部分「Agent中的认知与情绪」第3篇。上一篇我们诊断了Agent为什么没有情绪——缺少持续感知、状态累积、认知评价和反馈闭环。现在问题升级:没有是事实,但”需不需要”是另一个问题。不是所有缺失都值得补全。
反直觉的起点:没有情绪的Agent其实运行得不错
先承认一个事实:当前的Agent——没有情绪的那种——在很多任务上表现得不差。写代码、查资料、做摘要、排日程,这些事不需要情绪。就像你不需要情绪来用计算器算1+1。
那什么时候出问题?
当你需要Agent主动做一件事,而不是等你叫它做的时候。当你需要它在多个目标冲突时做出取舍的时候。当你需要它记住上次的不愉快并避免重蹈覆辙的时候。
这些场景的共同特征:它们都需要一种超越当前任务的驱动力。而驱动力的底层机制,在人类身上,就是情绪。
1. 功能性论证:情绪解决什么工程问题
What:情绪不是感受,是功能模块
Barrett(2017)的构建情绪理论有一个核心洞见:情绪不是大脑里预装的固定程序,而是大脑在特定情境下按需组装的预测包。你的大脑预测”接下来可能需要战斗”,于是组装出一套”愤怒”配置——注意力收窄、风险偏好提升、行动阈值降低。
从工程视角看,这是一种情境适配机制:根据当前环境的需求,快速切换系统参数配置。不是”我愤怒了所以参数变了”,而是”系统需要这些参数来应对当前情境,愤怒是这组参数的主观标签”。
这个视角翻转很关键:如果我们把情绪理解为功能模块而非感受,”Agent是否需要情绪”就变成了”Agent是否需要这些功能”。
这些功能包括:
- 预期违背检测 → 异常检测
- 优先级动态调整 → 资源调度
- 风险偏好切换 → 决策策略
- 时间压力传导 → 长期目标管理
- 经验偏好标记 → 记忆权重
- 主动行为驱动 → 自主性
每一个都有明确的工程需求。问题不是”要不要”,而是”用什么方式实现”。
Why:为什么”情绪式”实现可能优于”工程式”实现
上一篇我们讲过,碎片化的工程方案(异常检测一个模块、优先级一个模块、主动行为一个模块)缺乏统一驱动。这里补充另一个论点:情绪式实现的根本优势是自适应。
工程方案的参数是人为设定的——“异常阈值0.8”、”优先级权重0.6”。这些参数在设定时是最优的,但环境变了就可能不再最优。而且不同用户的”最优”不同——有人对延迟敏感,有人对错误敏感。
情绪式实现的优势在于,参数可以从经验中学习。用户每次对延迟不满,Agent的”焦虑阈值”就微调一点——这不是手动调参,而是自动适应。这和人类情绪的适应逻辑完全一致:你在高压环境下待久了,焦虑阈值会自动提高,因为”总是焦虑”不适应——这不是你决定的,是你的情绪系统自动校准的。
So What:对Agent设计意味着什么
Agent的情绪参数(阈值、权重、衰减率)不应硬编码,而应从交互历史中自适应学习。初始值可以作为用户画像的一部分设定,但长期来看,参数应根据”情绪信号→行为→反馈”的闭环自动微调。这让同一个Agent框架能适应不同用户,而不需要为每类用户写不同的规则。
2. 装饰性争论:为什么”情绪让交互更自然”是弱论证
What:”更自然”不是核心价值
很多人论证Agent需要情绪时,会提到”情绪让交互更自然、更有温度、更像真人”。这不是错的,但这是装饰性论证——即使Agent完全不理解情绪,只要LLM足够好,它也能生成温暖的回复。当前ChatGPT已经做到了。
装饰性论证的危险在于,它会让团队在错误的地方投入资源——花大量时间优化”情绪表达”(语气、emoji、安慰话术),而忽略”情绪驱动”(决策调制、优先级调整、主动行为)。前者是锦上添花,后者是能力跃迁。
一个类比:给汽车加真皮座椅和氛围灯,让它”更有温度”,和给汽车加自动驾驶系统,让它”更智能”。前者是装饰,后者是功能。
Why:区分”有情绪的交互”和”有情绪的决策”
“有情绪的交互”是指Agent在表达上体现情绪——说”我理解你的感受”,用温暖的措辞。这是LLM已经能做的事。
“有情绪的决策”是指Agent的内部状态影响了它的决策——因为上次交互不顺利,这次选择更保守的方案;因为用户表现出焦虑,主动提供更多信息而非等待追问。这需要内部情绪状态参与决策回路。
两者可以独立存在。当前大多数”情绪Agent”只在交互层面做文章,决策层依然是冷冰冰的规则。这就像一个人面带微笑地做错误决定——表情对了,但方向错了。
So What:对Agent设计意味着什么
评估Agent的情绪能力,不要看”它说得好不好”,要看”它的决策变没变”。具体测试:同一个任务,在两种情绪状态下(如”平静”vs”焦虑”),Agent的方案是否不同?如果完全一样,那情绪就是装饰。
3. 情绪与主动服务
What:没有内部驱动力的Agent不会主动做事
当前Agent的行为模式几乎全是响应式的:用户问,Agent答。少数Agent有定时任务能力(每天早上推送天气),但这是预设的脚本,不是自主决策。
真正的主动服务是什么样的?想象一个个人助手Agent:
- 你连续三天加班,它主动建议休息
- 它发现你的日程下周有个重要会议但没有准备时间,主动提醒
- 它注意到你最近总在深夜发消息,担心你的健康
这些行为需要什么?需要Agent对用户的状态形成预期,检测预期违背,产生内部驱动力(担忧),驱动主动行为(提醒/建议)。
这就是情绪驱动的完整链条:预测 → 违背 → 情绪 → 行动。没有情绪这个中间环节,链条就断了——Agent可以检测到预期违背(用户行为偏离正常模式),但”检测到异常”和”感到担忧”是两件事。前者产生一个布尔值,后者产生一个有梯度的驱动力。梯度很重要——轻微偏离产生轻微提醒,严重偏离产生强烈干预。
So What:对Agent设计意味着什么
Agent的主动行为不应由if-else规则驱动(”如果用户3天没登录则发送提醒”),而应由情绪驱动力驱动。情绪驱动力是连续值,决定主动行为的强度和频率。这避免了规则的脆弱性——硬编码的阈值在新场景下经常失效,而情绪驱动力可以自适应调整。
4. 情绪与长期目标管理
What:时间折扣的对抗者
上一篇我们提到,情绪把远期信号拉到近端——想到deadline就焦虑,焦虑驱动提前行动。这是情绪在时间维度上的核心功能。
Agent管理长期目标时面临同样的困境。一个帮助用户学习编程的Agent,如果用户今天说”我想学Python”,Agent会制定一个学习计划。但一周后用户没打开应用,两周后用户忘了这事——Agent需要做什么?
没有情绪的Agent:什么都不做,因为规则里没写”用户一周没学该怎么办”。或者硬编码一个规则:”7天未学习则发送提醒”。但7天这个阈值从哪来的?不同用户、不同目标、不同学习节奏,7天显然不对所有人适用。
有情绪驱动的Agent:它会”担忧”——用户的偏离程度越大,担忧越强,驱动的主动行为越强。这不是硬阈值,是连续函数。而且这种担忧可以传递:如果用户持续偏离,Agent的担忧可以升级为”重新评估目标可行性”——也许用户不适合自学Python,需要换一种方式。
So What:对Agent设计意味着什么
Agent应为每个长期目标维护一个”关注值”(类似于情绪标记),该值随时间偏离预期而上升,随用户回归预期而下降。关注值驱动主动干预的频率和强度。当关注值持续高位时,触发目标重新评估而非简单提醒。
5. 如果需要,需要什么样的情绪
What:不是人类的情绪,是功能等价物
如果接受了”Agent需要情绪功能”这个结论,下一个问题是:需要什么样的情绪?
答案是:不需要人类的情绪,需要的是与人类情绪功能等价的计算机制。
人类有愤怒、恐惧、悲伤、厌恶、惊讶、快乐——这些是进化塑造的特定适应方案。Agent的生态位不同,需要的”情绪”也不同。一个客服Agent需要”关切”(用户不满时升级处理),但不需要”恐惧”(它不会被物理伤害)。一个代码Agent需要”谨慎”(对不确定性高的代码段多加检查),但不需要”悲伤”。
更根本地说,人类情绪的维度模型(valence-arousal-dominance)可能也不是Agent的最佳选择。Barrett的构建情绪理论启发我们:情绪是按需组装的,不是预定义的。Agent需要的不是一套固定的”情绪类型”,而是一个评价→状态→驱动的通用框架,具体”情绪”由Agent的应用场景决定。
So What:对Agent设计意味着什么
不要预定义”愤怒””恐惧””悲伤”等情绪类型给Agent,而要实现一个通用的评价-状态-驱动框架:① 事件评价模块输出多维评价向量(相关性、可预测性、可控性、价值违背度),② 状态更新模块将评价向量映射到内部状态变化,③ 驱动模块将状态变化转化为行为倾向。具体的”情绪标签”只是状态向量的命名,可以由开发者或Agent自己定义。
对Agent设计的启示(总结)
- 从功能而非感受定义需求:不要问”Agent要不要有情绪”,要问”Agent要不要有预期违背检测、优先级动态调整、主动行为驱动”。答案是显然的。
- 统一驱动优于碎片方案:一个评价-状态-驱动框架比N个独立模块更简单、更一致、更容易自适应。
- 情绪参数应自适应:阈值和权重从交互历史中学习,不是硬编码。
- 评估看决策不看表达:Agent的情绪能力体现在决策变化上,不在措辞温暖上。
- 按需构建,不要照搬人类:Agent不需要六种基本情绪,需要的是功能等价的计算机制。
下一篇,我们进入第3部分的第一篇——情绪向量:Agent内部状态如何表示。从”要不要”到”怎么做”,从论证到设计。
参考资料
论文
- Barrett, L. F. (2017). How emotions are made: The secret life of the brain. Houghton Mifflin Harcourt. — 构建情绪理论的核心著作
- Friston, K. (2010). The free-energy principle: a unified brain theory? Nature Reviews Neuroscience, 11(2). — 预测加工的理论基础
- Lazarus, R. S. (1991). Emotion and adaptation. Oxford University Press. — 认知评价理论
- Anderson, A. K., & Adolphs, R. (2014). A framework for studying emotions across species. Cell, 157(1). — 跨物种情绪研究框架
- Minsky, M. (2006). The emotion machine. Simon & Schuster. — 情绪作为计算资源的机器视角
- Sloman, A. (2001). Beyond shallow models of emotion. Cognitive Processing, 2(1). — 情绪的计算架构
- Canamero, D. (1997). Modeling motivations and emotions as a basis for intelligent behavior. AGENTS ‘97. — 人工情绪系统的早期设计
- Velásquez, J. D. (1997). Modeling emotions and other motivations in synthetic agents. AAAI ‘97. — 情绪驱动的合成智能体
- Marsella, S., & Gratch, J. (2009). EMA: A process model of appraisal dynamics. Cognitive Systems Research, 10(1). — 认知评价的计算模型
- Lin, J., & Schatz, M. (2010). Building agent systems with emotional intelligence. AAMAS ‘10. — 情绪智能Agent的工程实践
书籍
- Minsky, M. The Emotion Machine. Simon & Schuster, 2006. — 从AI奠基人视角看情绪的计算本质
- Picard, R. Affective Computing. MIT Press, 1997. — 情感计算领域的开创性著作
- Sloman, A. The Computer Revolution in Philosophy. Harvester Press, 1978. — 早期对计算与心智关系的哲学分析
综述
- Calvo, R. A., & D’Mello, S. (2010). Affect detection: An interdisciplinary review of models, methods, and their applications. IEEE Transactions on Affective Computing, 1(1). — 情感检测方法的跨学科综述
- Poria, S., et al. (2017). Context-based sentiment analysis: A survey. Information Fusion, 36. — 情感分析的上下文方法综述