多 Agent 协作设计模式:从拓扑结构到演化架构的体系化综述
当 LLM 从”对话伙伴”进化为”自主智能体”,单个 Agent 的能力边界愈发清晰。多 Agent 协作成为突破这一边界的核心范式——但如何让多个 Agent 有效协作,远比”让它们一起工作”复杂得多。2026 年 4-5 月,一批深度论文从拓扑、架构、演化三个维度系统性地回答了这个问题,本文试图梳理出一个完整的设计模式图谱。
一、问题定义:为什么多 Agent 协作这么难?
1.1 协作失败不是偶然
Nechepurenko & Shuvalov 在 2026 年 5 月发表的 Coordination as an Architectural Layer 中给出了一个震撼的数字:多 Agent LLM 系统在生产环境中的失败率高达 41%-87%,而大部分失败源于协调缺陷,而非基础模型能力的不足。
这意味着:你换了更聪明的模型,协作失败率不会显著下降。问题出在”怎么协作”,而不是”谁在协作”。
1.2 协作的三个根本挑战
挑战一:信息不对称。Agent A 知道 Agent B 不知道的信息,反之亦然。缺乏有效的信息共享机制,Agent 会基于不完整上下文做出冲突决策。
挑战二:决策冲突。多个 Agent 对同一问题可能给出不同甚至矛盾的答案。如何消解冲突、达成共识,是多 Agent 系统的核心难题。
挑战三:规模扩展。Agent 数量线性增长,潜在的交互路径以组合数增长。3 个 Agent 有 3 条交互路径,10 个 Agent 有 45 条,100 个 Agent 有 4950 条。没有合理的拓扑设计,系统会迅速陷入混乱。
1.3 从软件工程借鉴:设计模式的必要性
软件工程领域在 1994 年通过 GoF 的《设计模式》解决了类似问题——面对对象交互的复杂性,需要可复用的抽象。多 Agent 协作面临同样的需求:我们需要一组经过验证的协作模式,让开发者能根据场景选择合适的拓扑和协调策略,而非每次从零设计。
二、六种核心协作设计模式
基于对 2024-2026 年多 Agent 系统文献的系统分析,我们识别出六种核心协作设计模式。每种模式有其独特的拓扑结构、信息流向、适用场景和已知局限。
2.1 模式一:管道式(Pipeline)
别名:链式(Chain)、流水线(Assembly Line)
拓扑结构:
1 | Agent A ──→ Agent B ──→ Agent C ──→ 输出 |
核心机制:任务被分解为有序的阶段,每个 Agent 负责一个阶段,上一个 Agent 的输出是下一个 Agent 的输入。
典型实例:
- MAS-Algorithm(Xu et al., 2026.05):将算法竞赛问题分解为”理解→策略→编码→测试”四阶段管道
- DataFactory(Wang et al., 2026.03):表格问答中的”查询解析→数据检索→答案生成”管道
优势:
- 实现简单,调试直观
- 每个 Agent 的职责清晰,提示词可以高度专业化
- 天然支持增量改进——替换单个阶段的 Agent 不影响其他阶段
局限:
- 线性依赖:任何阶段的失败都会导致整条管道中断
- 无反馈回路:下游发现的问题无法反馈给上游修正
- 瓶颈效应:最慢的阶段决定整体吞吐量
适用场景:任务有明确的阶段划分,各阶段之间信息流动方向单一。
2.2 模式二:层级式(Hierarchical)
别名:树式(Tree)、主从式(Master-Worker)
拓扑结构:
1 | ┌── Agent B₁ (专家) |
核心机制:一个”调度者”Agent 负责任务分解、分配和结果整合,多个”执行者”Agent 并行处理子任务。
典型实例:
- Web2BigTable(Huang et al., 2026.04):双层架构——上层 Planner Agent 负责协调,下层 Worker Agent 并行抓取和提取网页信息
- Orchard(Peng et al., 2026.05):Orchard Env 作为轻量级环境服务层,在 SWE/GUI/Claw 三条产品线中提供统一的调度原语
关键设计决策:
| 决策点 | 选项 | 权衡 |
|---|---|---|
| 调度者数量 | 单一 vs. 多级 | 单一简单但有瓶颈;多级可扩展但增加延迟 |
| 子任务粒度 | 粗粒度 vs. 细粒度 | 粗粒度减少交互但并行度低;细粒度反之 |
| 结果整合策略 | 拼接 vs. 投票 vs. 筛选 | 取决于子任务是否有唯一正确答案 |
优势:
- 天然并行:子任务可以同时执行
- 可扩展:增加执行者 Agent 即可提升吞吐量
- 质量可控:调度者可以做最终把关
局限:
- 调度者瓶颈:调度者成为单点故障和性能瓶颈
- 子任务划分质量决定系统上限
- 调度者自身可能引入偏差或遗漏
适用场景:任务可自然分解为独立子任务,且需要一个全局视角进行结果整合。
2.3 模式三:辩论式(Debate)
别名:对抗式(Adversarial)、讨论式(Discussion)
拓扑结构:
1 | Agent A ←──→ Agent B |
核心机制:多个 Agent 就同一问题提出各自观点,相互质疑和辩护,通过多轮交互逐步收敛到更可靠的结论。
典型实例:
- CollabEval(Qian et al., 2026.03):多 Agent 协作评估 LLM 生成内容质量,通过辩论消解单一评判者的偏差
- OpenDeepThink(Chai et al., 2026.05):通过 Bradley-Terry 成对比较实现群体排序,本质上是一种结构化辩论
辩论收敛机制:
1 | Round 1: A 提出观点 → B/C/D 提出反对 |
优势:
- 自我纠错:辩论过程天然暴露推理缺陷
- 鲁棒性:结论不依赖单一 Agent 的判断
- 置信度校准:辩论的分歧程度可反映结论的不确定性
局限:
- 成本高昂:每轮辩论需要多次 LLM 调用
- 可能不收敛:Agent 可能陷入”固执己见”的死循环
- 回音室效应:如果所有 Agent 基于同一模型,可能放大而非纠正偏差
适用场景:需要高可靠性判断的决策场景,如安全评估、法律分析、代码审查。
2.4 模式四:黑板式(Blackboard)
别名:共享状态式(Shared State)、发布-订阅式(Pub-Sub)
拓扑结构:
1 | ┌──→ ┌──────────┐ ←──┐ |
核心机制:所有 Agent 共享一个中央状态空间(黑板),Agent 可以向黑板写入信息、读取其他 Agent 写入的信息,并基于黑板状态决定自己的下一步行动。
典型实例:
- MAGE(Yang et al., 2026.05):四子图协同进化知识图谱本质上是一种结构化黑板——经验子图、任务子图、技能子图、关系子图作为共享知识源
- Swarm Skills(Zhang et al., 2026.05):多 Agent 协调规范中,Swarm Skill 本身就充当了共享的”协议黑板”,定义了角色、工作流和执行边界
与层级式的关键区别:黑板式中没有中央调度者。每个 Agent 独立决策,通过黑板间接协调。这是一种去中心化的协作模式。
优势:
- 松耦合:Agent 之间没有直接依赖,可以独立开发和部署
- 动态参与:Agent 可以随时加入或离开
- 异步协作:Agent 不需要同步等待
局限:
- 一致性挑战:多个 Agent 同时写入可能导致冲突
- 可观测性差:难以追踪信息流向和定位问题
- 需要精心设计黑板模式(schema),否则会退化为信息垃圾场
适用场景:异构 Agent 的松耦合协作,特别是 Agent 可能动态加入/退出的开放系统。
2.5 模式五:共识式(Consensus)
别名:投票式(Voting)、集成式(Ensemble)
拓扑结构:
1 | Agent A ──→ ┌──────────┐ |
核心机制:多个 Agent 独立处理同一任务,通过共识机制(多数投票、加权投票、Borda 计数等)从多个结果中选出最终答案。
典型实例:
- Coordination as an Architectural Layer(Nechepurenko & Shuvalov, 2026.05):在预测市场场景中比较了 5 种协调配置,发现共识对齐(Consensus Alignment)在 Murphy 分解签名上与其他配置显著不同
- CollabEval 的多评判者投票机制
共识机制类型:
| 机制 | 决策规则 | 适用场景 |
|---|---|---|
| 多数投票 | 少数服从多数 | 答案离散,Agent 能力相近 |
| 加权投票 | 按 Agent 历史表现加权 | Agent 能力差异大 |
| Borda 计数 | 排序式投票 | 多候选排序问题 |
| Bradley-Terry | 成对比较→全局排序 | 难以直接比较的复杂输出 |
| 置信度加权 | 按 Agent 自评置信度加权 | Agent 能自评可靠性的场景 |
优势:
- 简单鲁棒:多数投票是最简单也最被充分研究的共识机制
- 容错性:少数 Agent 的错误不会影响最终结果
- 可并行:所有 Agent 独立工作,无交互开销
局限:
- 多样性税:如果所有 Agent 基于同一模型,投票等于冗余
- 数量与质量的矛盾:更多 Agent 意味着更多 LLM 调用成本
- 不适用开放性任务:对于创意生成等没有”标准答案”的任务,共识可能导致平庸
适用场景:有明确正确答案的任务,需要高可靠性,且 Agent 具有多样性。
2.6 模式六:演化式(Evolutionary)
别名:自适应式(Adaptive)、自组织式(Self-Organizing)
拓扑结构:
1 | ┌───────────────────────────────────────┐ |
核心机制:Agent 群体通过选择-变异-保留的循环持续演化。表现好的 Agent/策略被保留和复制,表现差的被淘汰或修改。
典型实例:
- MAGE(Yang et al., 2026.05):多 Agent 图引导进化——将自我知识外化为四子图协同进化知识图谱,任务级搜索 Bandit 和技能级路由 Bandit 从同一奖励流中更新
- Swarm Skills(Zhang et al., 2026.05):自演化算法自动从成功执行轨迹中提炼新的 Swarm Skills,基于多维度评分(有效性、利用率、新鲜度)持续修补现有技能
- APWA(Rose et al., 2026.05):Agent-Parallel Workload Architecture 将工作流分解为非干扰子问题,支持异构数据和并行处理模式的动态组合
关键洞察:演化式模式不仅仅是一种协作拓扑,更是一种元模式——它可以包裹其他任何模式,让拓扑本身随时间自适应变化。
优势:
- 自适应:系统可以随环境变化自动调整
- 涌现性:可能发现人工设计未预见的有效策略
- 持续改进:理论上没有性能天花板
局限:
- 不稳定性:演化过程可能产生不可预测的行为
- 收敛速度:需要足够的进化轮次才能达到好的策略
- 评估成本:每轮进化都需要在实际任务上验证
- 灾难性遗忘:新策略可能覆盖已有的有效策略
适用场景:环境持续变化、最优策略未知、需要长期运行的自适应系统。
三、模式选择决策框架
3.1 按任务特征选择
| 任务特征 | 推荐模式 | 理由 |
|---|---|---|
| 任务有明确阶段 | 管道式 | 阶段间信息单向流动 |
| 任务可分解为独立子任务 | 层级式 | 天然并行 |
| 需要高可靠性判断 | 辩论式或共识式 | 多视角降低偏差 |
| Agent 异构且动态变化 | 黑板式 | 松耦合支持动态参与 |
| 答案有对错之分 | 共识式 | 投票纠错 |
| 环境持续变化 | 演化式 | 自适应调整 |
3.2 按系统约束选择
| 约束条件 | 推荐模式 | 理由 |
|---|---|---|
| 成本敏感 | 管道式或层级式 | LLM 调用次数最少 |
| 延迟敏感 | 共识式(并行)或层级式 | 并行执行降低延迟 |
| 质量优先 | 辩论式 | 多轮交互提升质量 |
| 可解释性要求高 | 管道式 | 信息流向清晰 |
| 可扩展性要求高 | 黑板式或层级式 | 松耦合易扩展 |
3.3 组合模式
实际系统中,多种模式常常组合使用:
管道 + 层级(最常见):
1 | 管道阶段1 → [层级式: 调度者 + 3个执行者] → 管道阶段2 → ... |
辩论 + 共识:
1 | 多轮辩论 → 投票选择最佳结论 |
层级 + 演化:
1 | 调度者使用演化算法动态选择最优执行者组合 |
黑板 + 演化:
1 | 黑板作为共享状态,演化算法调整写入/读取策略 |
四、协调作为架构层:一个关键思想
4.1 核心论点
Nechepurenko & Shuvalov 的论文提出了一个深刻的主张:协调应该被视为一个可配置的架构层,与 Agent 逻辑和信息访问分离。
这意味着:
- 协调可替换:同一组 Agent 可以在不同协调模式下运行,无需修改 Agent 内部逻辑
- 协调可分析:不同协调配置会产生可区分的”故障签名”(Failure Mode Signature)
- 协调可优化:可以将协调配置作为优化对象,搜索最优拓扑
4.2 三层架构
1 | ┌──────────────────────────────────┐ |
关键洞察:大多数多 Agent 系统的失败不是因为 Agent 逻辑层出了问题,而是协调层配置不当。将协调显式化、可配置化,使得我们可以独立于 Agent 能力来诊断和优化协作效率。
4.3 Murphy 分解:评估协调配置
该论文的另一个贡献是使用 Murphy 分解将 Brier 评分分离为校准度和区分度,使得不同协调配置产生可区分的”签名”:
- 校准度:系统对自身不确定性的认知是否准确
- 区分度:系统区分不同难度问题的能力
两种配置可能在总体 Brier 评分上相同,但 Murphy 签名不同——这为精细化的协调配置选择提供了理论基础。
五、小世界网络:多 Agent 协作的隐藏拓扑原理
5.1 从规则拓扑到小世界
Wang et al.(2025.12)在 Rethinking Multi-Agent Intelligence Through the Lens of Small-World Networks 中提出了一个令人深思的观点:多 Agent 系统的拓扑结构应该借鉴小世界网络理论。
小世界网络有两个关键特性:
- 短路径长度:任意两个节点之间只有少量跳数
- 高聚类系数:节点的邻居之间也互为邻居
5.2 对设计模式的启示
| 拓扑类型 | 路径长度 | 聚类系数 | 协作效率 | 适用场景 |
|---|---|---|---|---|
| 规则网格 | 长 | 高 | 局部高效,全局慢 | 软件模块化团队 |
| 随机图 | 短 | 低 | 全局快,局部弱 | 开放式头脑风暴 |
| 小世界 | 短 | 高 | 局部+全局兼顾 | 大多数协作场景 |
| 全连接 | 极短 | 极高 | 信息过载 | 极小团队 |
实践启示:在构建多 Agent 系统时,应该:
- 保持核心团队的高聚类(频繁交互的 Agent 紧密连接)
- 引入少量”桥梁”Agent 连接不同集群(实现短路径)
- 避免全连接(减少信息过载和冲突)
六、前沿趋势:从静态拓扑到动态演化
6.1 拓扑自优化
Swarm Skills 的自演化算法展示了拓扑自优化的可行路径:
- 多维评分:对每个协调策略计算有效性(Effectiveness)、利用率(Utilization)、新鲜度(Freshness)三个维度
- 自动提炼:从成功的执行轨迹中提炼新的 Swarm Skill
- 持续修补:根据评分修补现有策略,无需人工介入
6.2 并行化架构
APWA(Rose et al., 2026.05)揭示了多 Agent 系统的一个被忽视的优化维度——并行化。现有系统在面对可并行任务时,往往因为缺乏并行化架构而退化为串行执行。
APWA 的核心思想:
- 将工作流分解为非干扰子问题
- 子问题使用独立资源处理,无需跨通信
- 支持异构数据和并行处理模式
6.3 协同进化知识图谱
MAGE 的四子图架构将 Agent 进化从”自然语言反馈”推进到”结构化知识图谱”:
1 | ┌──────────────┐ ┌──────────────┐ |
关键创新:MAGE 使用双 Bandit 机制——任务级搜索 Bandit 决定”学什么”,技能级路由 Bandit 决定”怎么用”——两者从同一奖励流中更新,确保学习和使用的目标一致。
七、工程实践:构建多 Agent 协作系统的检查清单
7.1 设计阶段
- 明确任务类型:是精确推理、创意生成、信息聚合还是流程执行?
- 选择协作模式:根据第三节的决策框架选择主模式
- 设计信息架构:Agent 间共享什么信息?通过什么机制?
- 定义冲突消解策略:Agent 意见不一致时怎么办?
- 规划 Agent 多样性:是否使用不同模型/不同提示词/不同工具集?
7.2 实现阶段
- 协调层分离:将协调逻辑与 Agent 逻辑解耦
- 可观测性:记录所有 Agent 间的消息传递和决策过程
- 超时与降级:单个 Agent 无响应时系统的降级策略
- 成本控制:设置 LLM 调用上限,避免辩论死循环
7.3 评估阶段
- Murphy 签名:不仅看总体准确率,还要分解校准度和区分度
- 消融实验:逐一移除 Agent 或改变拓扑,观察性能变化
- 成本-质量前沿:绘制不同配置的 Pareto 前沿,找到性价比最优点
- 长尾分析:关注系统在极端/边缘情况下的表现
7.4 常见反模式
| 反模式 | 表现 | 修复 |
|---|---|---|
| 全连接幻觉 | 所有 Agent 两两通信 | 引入小世界拓扑,减少连接数 |
| 单一模型投票 | 同一 LLM 的多个实例投票 | 引入模型多样性或提示词多样性 |
| 无限辩论 | Agent 反复争论无法收敛 | 设置最大轮次 + 收敛检测 |
| 调度者瓶颈 | 所有请求经调度者串行处理 | 引入层级式并行或黑板式去中心 |
| 过拟合协调 | 协调策略在训练集上表现优异但在新任务上崩溃 | 引入演化式元学习 |
八、未来方向
8.1 从手动设计到自动发现
当前的六种模式都是人工总结的。未来,我们可能通过分析大量多 Agent 系统的执行轨迹,自动发现新的协作模式——就像数据挖掘从交易记录中发现频繁模式一样。
8.2 跨域协作协议
Swarm Skills 已经提出了”可移植的协调规范”的概念。更进一步的愿景是:跨框架、跨平台的通用协作协议,让不同框架(OpenClaw、LangGraph、CrewAI、AutoGen)构建的 Agent 能无缝协作。
8.3 人机混合协作
当前的设计模式假设所有参与者都是 AI Agent。但在实际应用中,人类专家往往是协作网络的重要节点。未来的设计模式需要显式建模人类在协作中的角色——作为监督者、参与者还是仲裁者。
8.4 协作安全
随着多 Agent 系统的自主性增强,协作安全成为不可忽视的问题。一个被攻破的 Agent 可能通过协作网络影响其他 Agent,产生级联失效。设计模式需要内置安全约束:信息隔离、信任评估、行为审计。
九、结论
多 Agent 协作设计模式是 LLM Agent 工程化的基础设施。本文识别的六种核心模式——管道式、层级式、辩论式、黑板式、共识式、演化式——覆盖了从简单顺序处理到复杂自组织系统的主要协作范式。
三个关键洞察贯穿全文:
协调是架构层,不是实现细节。将协调显式化、可配置化,使得协作效率可以独立于 Agent 能力来优化和评估。
拓扑决定效率。小世界网络理论告诉我们,高聚类+短路径是最优的协作拓扑,而非全连接或纯层级。
演化是终极模式。静态设计模式是起点,动态演化是终点。系统能够根据历史经验自动调整协作策略,是多 Agent 系统走向成熟的标志。
选择模式没有银弹——正如软件设计模式一样,关键是理解每种模式的 trade-off,并根据具体场景做出明智的选择。
参考文献
- Nechepurenko, M. & Shuvalov, P. “Coordination as an Architectural Layer for LLM-Based Multi-Agent Systems.” arXiv:2605.03310, May 2026.
- Zhang, X. et al. “Swarm Skills: A Portable, Self-Evolving Multi-Agent System Specification for Coordination Engineering.” arXiv:2605.10052, May 2026.
- Yang, R. et al. “MAGE: Multi-Agent Self-Evolution with Co-Evolutionary Knowledge Graphs.” arXiv:2605.10064, May 2026.
- Rose, E. et al. “APWA: A Distributed Architecture for Parallelizable Agentic Workflows.” arXiv:2605.15132, May 2026.
- Xu, Y. et al. “MAS-Algorithm: A Workflow for Solving Algorithmic Programming Problems with a Multi-Agent System.” arXiv:2605.xxxxx, May 2026.
- Wang, B. et al. “Rethinking Multi-Agent Intelligence Through the Lens of Small-World Networks.” arXiv:2512.xxxxx, December 2025.
- Huang, Y. et al. “Web2BigTable: A Bi-Level Multi-Agent LLM System for Internet-Scale Information Search and Extraction.” arXiv:2604.xxxxx, April 2026.
- Peng, B. et al. “Orchard: An Open-Source Agentic Modeling Framework.” arXiv:2605.15040, May 2026.
- Qian, Y. et al. “CollabEval: Enhancing LLM-as-a-Judge via Multi-Agent Collaboration.” arXiv:2603.xxxxx, March 2026.
- Wang, T. et al. “DataFactory: Collaborative Multi-Agent Framework for Advanced Table Question Answering.” arXiv:2603.xxxxx, March 2026.
- Chai, W. et al. “OpenDeepThink: Parallel Reasoning via Bradley-Terry Aggregation.” arXiv:2605.15177, May 2026.
- Yu, C. et al. “A Survey on Agent Workflow – Status and Future.” arXiv:2508.xxxxx, August 2025.