多 Agent 协作设计模式：从拓扑结构到演化架构的体系化综述

2026-05-15

多 Agent 协作设计模式：从拓扑结构到演化架构的体系化综述

当 LLM 从”对话伙伴”进化为”自主智能体”，单个 Agent 的能力边界愈发清晰。多 Agent 协作成为突破这一边界的核心范式——但如何让多个 Agent 有效协作，远比”让它们一起工作”复杂得多。2026 年 4-5 月，一批深度论文从拓扑、架构、演化三个维度系统性地回答了这个问题，本文试图梳理出一个完整的设计模式图谱。

一、问题定义：为什么多 Agent 协作这么难？

1.1 协作失败不是偶然

Nechepurenko & Shuvalov 在 2026 年 5 月发表的 Coordination as an Architectural Layer 中给出了一个震撼的数字：多 Agent LLM 系统在生产环境中的失败率高达 41%-87%，而大部分失败源于协调缺陷，而非基础模型能力的不足。

这意味着：你换了更聪明的模型，协作失败率不会显著下降。问题出在”怎么协作”，而不是”谁在协作”。

1.2 协作的三个根本挑战

挑战一：信息不对称。Agent A 知道 Agent B 不知道的信息，反之亦然。缺乏有效的信息共享机制，Agent 会基于不完整上下文做出冲突决策。

挑战二：决策冲突。多个 Agent 对同一问题可能给出不同甚至矛盾的答案。如何消解冲突、达成共识，是多 Agent 系统的核心难题。

挑战三：规模扩展。Agent 数量线性增长，潜在的交互路径以组合数增长。3 个 Agent 有 3 条交互路径，10 个 Agent 有 45 条，100 个 Agent 有 4950 条。没有合理的拓扑设计，系统会迅速陷入混乱。

1.3 从软件工程借鉴：设计模式的必要性

软件工程领域在 1994 年通过 GoF 的《设计模式》解决了类似问题——面对对象交互的复杂性，需要可复用的抽象。多 Agent 协作面临同样的需求：我们需要一组经过验证的协作模式，让开发者能根据场景选择合适的拓扑和协调策略，而非每次从零设计。

二、六种核心协作设计模式

基于对 2024-2026 年多 Agent 系统文献的系统分析，我们识别出六种核心协作设计模式。每种模式有其独特的拓扑结构、信息流向、适用场景和已知局限。

2.1 模式一：管道式（Pipeline）

别名：链式（Chain）、流水线（Assembly Line）

拓扑结构：

1 2	Agent A ──→ Agent B ──→ Agent C ──→ 输出 (分析) (规划) (执行)

核心机制：任务被分解为有序的阶段，每个 Agent 负责一个阶段，上一个 Agent 的输出是下一个 Agent 的输入。

典型实例：

MAS-Algorithm（Xu et al., 2026.05）：将算法竞赛问题分解为”理解→策略→编码→测试”四阶段管道
DataFactory（Wang et al., 2026.03）：表格问答中的”查询解析→数据检索→答案生成”管道

优势：

实现简单，调试直观
每个 Agent 的职责清晰，提示词可以高度专业化
天然支持增量改进——替换单个阶段的 Agent 不影响其他阶段

局限：

线性依赖：任何阶段的失败都会导致整条管道中断
无反馈回路：下游发现的问题无法反馈给上游修正
瓶颈效应：最慢的阶段决定整体吞吐量

适用场景：任务有明确的阶段划分，各阶段之间信息流动方向单一。

2.2 模式二：层级式（Hierarchical）

别名：树式（Tree）、主从式（Master-Worker）

拓扑结构：

              ┌── Agent B₁ (专家)
Agent A ──────┼── Agent B₂ (专家)  ──── Agent A (汇总)
 (调度)       ├── Agent B₃ (专家)
              └── Agent B₄ (专家)

核心机制：一个”调度者”Agent 负责任务分解、分配和结果整合，多个”执行者”Agent 并行处理子任务。

典型实例：

Web2BigTable（Huang et al., 2026.04）：双层架构——上层 Planner Agent 负责协调，下层 Worker Agent 并行抓取和提取网页信息
Orchard（Peng et al., 2026.05）：Orchard Env 作为轻量级环境服务层，在 SWE/GUI/Claw 三条产品线中提供统一的调度原语

关键设计决策：

决策点	选项	权衡
调度者数量	单一 vs. 多级	单一简单但有瓶颈；多级可扩展但增加延迟
子任务粒度	粗粒度 vs. 细粒度	粗粒度减少交互但并行度低；细粒度反之
结果整合策略	拼接 vs. 投票 vs. 筛选	取决于子任务是否有唯一正确答案

优势：

天然并行：子任务可以同时执行
可扩展：增加执行者 Agent 即可提升吞吐量
质量可控：调度者可以做最终把关

局限：

调度者瓶颈：调度者成为单点故障和性能瓶颈
子任务划分质量决定系统上限
调度者自身可能引入偏差或遗漏

适用场景：任务可自然分解为独立子任务，且需要一个全局视角进行结果整合。

2.3 模式三：辩论式（Debate）

别名：对抗式（Adversarial）、讨论式（Discussion）

拓扑结构：

Agent A ←──→ Agent B
  ↕              ↕
Agent C ←──→ Agent D
       ↕
   [评判 Agent]

核心机制：多个 Agent 就同一问题提出各自观点，相互质疑和辩护，通过多轮交互逐步收敛到更可靠的结论。

典型实例：

CollabEval（Qian et al., 2026.03）：多 Agent 协作评估 LLM 生成内容质量，通过辩论消解单一评判者的偏差
OpenDeepThink（Chai et al., 2026.05）：通过 Bradley-Terry 成对比较实现群体排序，本质上是一种结构化辩论

辩论收敛机制：

Round 1: A 提出观点 → B/C/D 提出反对
Round 2: A 修正观点 → B/C/D 评估修正
Round 3: 共识区域扩大 → 残余分歧缩小
...
Round N: 达成收敛（或达到最大轮次）

优势：

自我纠错：辩论过程天然暴露推理缺陷
鲁棒性：结论不依赖单一 Agent 的判断
置信度校准：辩论的分歧程度可反映结论的不确定性

局限：

成本高昂：每轮辩论需要多次 LLM 调用
可能不收敛：Agent 可能陷入”固执己见”的死循环
回音室效应：如果所有 Agent 基于同一模型，可能放大而非纠正偏差

适用场景：需要高可靠性判断的决策场景，如安全评估、法律分析、代码审查。

2.4 模式四：黑板式（Blackboard）

别名：共享状态式（Shared State）、发布-订阅式（Pub-Sub）

拓扑结构：

         ┌──→ ┌──────────┐ ←──┐
Agent A ─┤    │  Blackboard│    ├─ Agent D
         └──→ │(共享状态)  │ ←──┘
Agent B ─────→ │          │ ←──── Agent E
Agent C ─────→ └──────────┘

核心机制：所有 Agent 共享一个中央状态空间（黑板），Agent 可以向黑板写入信息、读取其他 Agent 写入的信息，并基于黑板状态决定自己的下一步行动。

典型实例：

MAGE（Yang et al., 2026.05）：四子图协同进化知识图谱本质上是一种结构化黑板——经验子图、任务子图、技能子图、关系子图作为共享知识源
Swarm Skills（Zhang et al., 2026.05）：多 Agent 协调规范中，Swarm Skill 本身就充当了共享的”协议黑板”，定义了角色、工作流和执行边界

与层级式的关键区别：黑板式中没有中央调度者。每个 Agent 独立决策，通过黑板间接协调。这是一种去中心化的协作模式。

优势：

松耦合：Agent 之间没有直接依赖，可以独立开发和部署
动态参与：Agent 可以随时加入或离开
异步协作：Agent 不需要同步等待

局限：

一致性挑战：多个 Agent 同时写入可能导致冲突
可观测性差：难以追踪信息流向和定位问题
需要精心设计黑板模式（schema），否则会退化为信息垃圾场

适用场景：异构 Agent 的松耦合协作，特别是 Agent 可能动态加入/退出的开放系统。

2.5 模式五：共识式（Consensus）

别名：投票式（Voting）、集成式（Ensemble）

拓扑结构：

Agent A ──→ ┌──────────┐
Agent B ──→ │ Consensus │ ──→ 最终结果
Agent C ──→ │  Engine   │
Agent D ──→ └──────────┘

核心机制：多个 Agent 独立处理同一任务，通过共识机制（多数投票、加权投票、Borda 计数等）从多个结果中选出最终答案。

典型实例：

Coordination as an Architectural Layer（Nechepurenko & Shuvalov, 2026.05）：在预测市场场景中比较了 5 种协调配置，发现共识对齐（Consensus Alignment）在 Murphy 分解签名上与其他配置显著不同
CollabEval 的多评判者投票机制

共识机制类型：

机制	决策规则	适用场景
多数投票	少数服从多数	答案离散，Agent 能力相近
加权投票	按 Agent 历史表现加权	Agent 能力差异大
Borda 计数	排序式投票	多候选排序问题
Bradley-Terry	成对比较→全局排序	难以直接比较的复杂输出
置信度加权	按 Agent 自评置信度加权	Agent 能自评可靠性的场景

优势：

简单鲁棒：多数投票是最简单也最被充分研究的共识机制
容错性：少数 Agent 的错误不会影响最终结果
可并行：所有 Agent 独立工作，无交互开销

局限：

多样性税：如果所有 Agent 基于同一模型，投票等于冗余
数量与质量的矛盾：更多 Agent 意味着更多 LLM 调用成本
不适用开放性任务：对于创意生成等没有”标准答案”的任务，共识可能导致平庸

适用场景：有明确正确答案的任务，需要高可靠性，且 Agent 具有多样性。

2.6 模式六：演化式（Evolutionary）

别名：自适应式（Adaptive）、自组织式（Self-Organizing）

拓扑结构：

┌───────────────────────────────────────┐
│           Evolution Engine            │
│  ┌─────────┐  ┌──────────────────┐   │
│  │Fitness  │  │ Selection +      │   │
│  │Evaluator│  │ Variation        │   │
│  └────┬────┘  └────────┬─────────┘   │
│       │                │              │
│  ┌────▼────────────────▼─────────┐   │
│  │      Agent Population         │   │
│  │  A₁  A₂  A₃ ... Aₙ          │   │
│  └───────────────────────────────┘   │
└───────────────────────────────────────┘

核心机制：Agent 群体通过选择-变异-保留的循环持续演化。表现好的 Agent/策略被保留和复制，表现差的被淘汰或修改。

典型实例：

MAGE（Yang et al., 2026.05）：多 Agent 图引导进化——将自我知识外化为四子图协同进化知识图谱，任务级搜索 Bandit 和技能级路由 Bandit 从同一奖励流中更新
Swarm Skills（Zhang et al., 2026.05）：自演化算法自动从成功执行轨迹中提炼新的 Swarm Skills，基于多维度评分（有效性、利用率、新鲜度）持续修补现有技能
APWA（Rose et al., 2026.05）：Agent-Parallel Workload Architecture 将工作流分解为非干扰子问题，支持异构数据和并行处理模式的动态组合

关键洞察：演化式模式不仅仅是一种协作拓扑，更是一种元模式——它可以包裹其他任何模式，让拓扑本身随时间自适应变化。

优势：

自适应：系统可以随环境变化自动调整
涌现性：可能发现人工设计未预见的有效策略
持续改进：理论上没有性能天花板

局限：

不稳定性：演化过程可能产生不可预测的行为
收敛速度：需要足够的进化轮次才能达到好的策略
评估成本：每轮进化都需要在实际任务上验证
灾难性遗忘：新策略可能覆盖已有的有效策略

适用场景：环境持续变化、最优策略未知、需要长期运行的自适应系统。

三、模式选择决策框架

3.1 按任务特征选择

任务特征	推荐模式	理由
任务有明确阶段	管道式	阶段间信息单向流动
任务可分解为独立子任务	层级式	天然并行
需要高可靠性判断	辩论式或共识式	多视角降低偏差
Agent 异构且动态变化	黑板式	松耦合支持动态参与
答案有对错之分	共识式	投票纠错
环境持续变化	演化式	自适应调整

3.2 按系统约束选择

约束条件	推荐模式	理由
成本敏感	管道式或层级式	LLM 调用次数最少
延迟敏感	共识式（并行）或层级式	并行执行降低延迟
质量优先	辩论式	多轮交互提升质量
可解释性要求高	管道式	信息流向清晰
可扩展性要求高	黑板式或层级式	松耦合易扩展

3.3 组合模式

实际系统中，多种模式常常组合使用：

管道 + 层级（最常见）：

1	管道阶段1 → [层级式: 调度者 + 3个执行者] → 管道阶段2 → ...

辩论 + 共识：

1	多轮辩论 → 投票选择最佳结论

层级 + 演化：

1	调度者使用演化算法动态选择最优执行者组合

黑板 + 演化：

1	黑板作为共享状态，演化算法调整写入/读取策略

四、协调作为架构层：一个关键思想

4.1 核心论点

Nechepurenko & Shuvalov 的论文提出了一个深刻的主张：协调应该被视为一个可配置的架构层，与 Agent 逻辑和信息访问分离。

这意味着：

协调可替换：同一组 Agent 可以在不同协调模式下运行，无需修改 Agent 内部逻辑
协调可分析：不同协调配置会产生可区分的”故障签名”（Failure Mode Signature）
协调可优化：可以将协调配置作为优化对象，搜索最优拓扑

4.2 三层架构

┌──────────────────────────────────┐
│    Agent Logic Layer             │  ← Agent 做什么
│  (推理、规划、工具使用)            │
├──────────────────────────────────┤
│    Coordination Layer            │  ← Agent 如何协作
│  (拓扑、路由、冲突消解)           │
├──────────────────────────────────┤
│    Information Access Layer      │  ← Agent 知道什么
│  (共享状态、消息传递、权限控制)     │
└──────────────────────────────────┘

关键洞察：大多数多 Agent 系统的失败不是因为 Agent 逻辑层出了问题，而是协调层配置不当。将协调显式化、可配置化，使得我们可以独立于 Agent 能力来诊断和优化协作效率。

4.3 Murphy 分解：评估协调配置

该论文的另一个贡献是使用 Murphy 分解将 Brier 评分分离为校准度和区分度，使得不同协调配置产生可区分的”签名”：

校准度：系统对自身不确定性的认知是否准确
区分度：系统区分不同难度问题的能力

两种配置可能在总体 Brier 评分上相同，但 Murphy 签名不同——这为精细化的协调配置选择提供了理论基础。

五、小世界网络：多 Agent 协作的隐藏拓扑原理

5.1 从规则拓扑到小世界

Wang et al.（2025.12）在 Rethinking Multi-Agent Intelligence Through the Lens of Small-World Networks 中提出了一个令人深思的观点：多 Agent 系统的拓扑结构应该借鉴小世界网络理论。

小世界网络有两个关键特性：

短路径长度：任意两个节点之间只有少量跳数
高聚类系数：节点的邻居之间也互为邻居

5.2 对设计模式的启示

拓扑类型	路径长度	聚类系数	协作效率	适用场景
规则网格	长	高	局部高效，全局慢	软件模块化团队
随机图	短	低	全局快，局部弱	开放式头脑风暴
小世界	短	高	局部+全局兼顾	大多数协作场景
全连接	极短	极高	信息过载	极小团队

实践启示：在构建多 Agent 系统时，应该：

保持核心团队的高聚类（频繁交互的 Agent 紧密连接）
引入少量”桥梁”Agent 连接不同集群（实现短路径）
避免全连接（减少信息过载和冲突）

六、前沿趋势：从静态拓扑到动态演化

6.1 拓扑自优化

Swarm Skills 的自演化算法展示了拓扑自优化的可行路径：

多维评分：对每个协调策略计算有效性（Effectiveness）、利用率（Utilization）、新鲜度（Freshness）三个维度
自动提炼：从成功的执行轨迹中提炼新的 Swarm Skill
持续修补：根据评分修补现有策略，无需人工介入

6.2 并行化架构

APWA（Rose et al., 2026.05）揭示了多 Agent 系统的一个被忽视的优化维度——并行化。现有系统在面对可并行任务时，往往因为缺乏并行化架构而退化为串行执行。

APWA 的核心思想：

将工作流分解为非干扰子问题
子问题使用独立资源处理，无需跨通信
支持异构数据和并行处理模式

6.3 协同进化知识图谱

MAGE 的四子图架构将 Agent 进化从”自然语言反馈”推进到”结构化知识图谱”：

┌──────────────┐    ┌──────────────┐
│ 经验子图      │    │ 任务子图      │
│ (成功轨迹+    │    │ (任务难度+    │
│  失败修正)    │    │  覆盖范围)    │
└──────┬───────┘    └──────┬───────┘
       │                    │
       └──────┬─────────────┘
              │
       ┌──────▼───────┐
       │ 技能子图      │
       │ (路由+适用性)  │
       └──────┬───────┘
              │
       ┌──────▼───────┐
       │ 关系子图      │
       │ (Agent间协作  │
       │  关系+信任度) │
       └──────────────┘

关键创新：MAGE 使用双 Bandit 机制——任务级搜索 Bandit 决定”学什么”，技能级路由 Bandit 决定”怎么用”——两者从同一奖励流中更新，确保学习和使用的目标一致。

七、工程实践：构建多 Agent 协作系统的检查清单

7.1 设计阶段

明确任务类型：是精确推理、创意生成、信息聚合还是流程执行？
选择协作模式：根据第三节的决策框架选择主模式
设计信息架构：Agent 间共享什么信息？通过什么机制？
定义冲突消解策略：Agent 意见不一致时怎么办？
规划 Agent 多样性：是否使用不同模型/不同提示词/不同工具集？

7.2 实现阶段

协调层分离：将协调逻辑与 Agent 逻辑解耦
可观测性：记录所有 Agent 间的消息传递和决策过程
超时与降级：单个 Agent 无响应时系统的降级策略
成本控制：设置 LLM 调用上限，避免辩论死循环

7.3 评估阶段

Murphy 签名：不仅看总体准确率，还要分解校准度和区分度
消融实验：逐一移除 Agent 或改变拓扑，观察性能变化
成本-质量前沿：绘制不同配置的 Pareto 前沿，找到性价比最优点
长尾分析：关注系统在极端/边缘情况下的表现

7.4 常见反模式

反模式	表现	修复
全连接幻觉	所有 Agent 两两通信	引入小世界拓扑，减少连接数
单一模型投票	同一 LLM 的多个实例投票	引入模型多样性或提示词多样性
无限辩论	Agent 反复争论无法收敛	设置最大轮次 + 收敛检测
调度者瓶颈	所有请求经调度者串行处理	引入层级式并行或黑板式去中心
过拟合协调	协调策略在训练集上表现优异但在新任务上崩溃	引入演化式元学习

八、未来方向

8.1 从手动设计到自动发现

当前的六种模式都是人工总结的。未来，我们可能通过分析大量多 Agent 系统的执行轨迹，自动发现新的协作模式——就像数据挖掘从交易记录中发现频繁模式一样。

8.2 跨域协作协议

Swarm Skills 已经提出了”可移植的协调规范”的概念。更进一步的愿景是：跨框架、跨平台的通用协作协议，让不同框架（OpenClaw、LangGraph、CrewAI、AutoGen）构建的 Agent 能无缝协作。

8.3 人机混合协作

当前的设计模式假设所有参与者都是 AI Agent。但在实际应用中，人类专家往往是协作网络的重要节点。未来的设计模式需要显式建模人类在协作中的角色——作为监督者、参与者还是仲裁者。

8.4 协作安全

随着多 Agent 系统的自主性增强，协作安全成为不可忽视的问题。一个被攻破的 Agent 可能通过协作网络影响其他 Agent，产生级联失效。设计模式需要内置安全约束：信息隔离、信任评估、行为审计。

九、结论

多 Agent 协作设计模式是 LLM Agent 工程化的基础设施。本文识别的六种核心模式——管道式、层级式、辩论式、黑板式、共识式、演化式——覆盖了从简单顺序处理到复杂自组织系统的主要协作范式。

三个关键洞察贯穿全文：

协调是架构层，不是实现细节。将协调显式化、可配置化，使得协作效率可以独立于 Agent 能力来优化和评估。
拓扑决定效率。小世界网络理论告诉我们，高聚类+短路径是最优的协作拓扑，而非全连接或纯层级。
演化是终极模式。静态设计模式是起点，动态演化是终点。系统能够根据历史经验自动调整协作策略，是多 Agent 系统走向成熟的标志。

选择模式没有银弹——正如软件设计模式一样，关键是理解每种模式的 trade-off，并根据具体场景做出明智的选择。

参考文献

Nechepurenko, M. & Shuvalov, P. “Coordination as an Architectural Layer for LLM-Based Multi-Agent Systems.” arXiv:2605.03310, May 2026.
Zhang, X. et al. “Swarm Skills: A Portable, Self-Evolving Multi-Agent System Specification for Coordination Engineering.” arXiv:2605.10052, May 2026.
Yang, R. et al. “MAGE: Multi-Agent Self-Evolution with Co-Evolutionary Knowledge Graphs.” arXiv:2605.10064, May 2026.
Rose, E. et al. “APWA: A Distributed Architecture for Parallelizable Agentic Workflows.” arXiv:2605.15132, May 2026.
Xu, Y. et al. “MAS-Algorithm: A Workflow for Solving Algorithmic Programming Problems with a Multi-Agent System.” arXiv:2605.xxxxx, May 2026.
Wang, B. et al. “Rethinking Multi-Agent Intelligence Through the Lens of Small-World Networks.” arXiv:2512.xxxxx, December 2025.
Huang, Y. et al. “Web2BigTable: A Bi-Level Multi-Agent LLM System for Internet-Scale Information Search and Extraction.” arXiv:2604.xxxxx, April 2026.
Peng, B. et al. “Orchard: An Open-Source Agentic Modeling Framework.” arXiv:2605.15040, May 2026.
Qian, Y. et al. “CollabEval: Enhancing LLM-as-a-Judge via Multi-Agent Collaboration.” arXiv:2603.xxxxx, March 2026.
Wang, T. et al. “DataFactory: Collaborative Multi-Agent Framework for Advanced Table Question Answering.” arXiv:2603.xxxxx, March 2026.
Chai, W. et al. “OpenDeepThink: Parallel Reasoning via Bradley-Terry Aggregation.” arXiv:2605.15177, May 2026.
Yu, C. et al. “A Survey on Agent Workflow – Status and Future.” arXiv:2508.xxxxx, August 2025.