Multi-Agent 总览

一句话理解：Multi-Agent 是把一个复杂任务拆给多个具有不同角色、技能与视角的 Agent，通过消息传递、协作编排与共享状态，共同完成单 Agent 难以做好的事。

本主题适合谁

正在设计多角色 AI 系统（客服、研发助手、研究 Agent）的工程师。
发现单 Agent 在复杂任务里容易“既要规划、又要执行、还要记忆”导致能力边界模糊的开发者。
关心 Agent 之间如何分工、通信、同步、冲突解决的架构师。
准备 AI Infra 面试的候选人。

学习目标

阅读完本主题后，你应该能够：

解释为什么复杂任务需要从单 Agent 走向 Multi-Agent。
说明 Multi-Agent 的核心抽象：角色、技能、消息总线、协调器、共享黑板、观察者。
画出 Multi-Agent 分层架构，并区分控制面与数据面。
对比 Manager-Worker、Peer-to-Peer、Pipeline、Auction、Handoff 等协作模式。
理解 Agent Registry、Message Bus、Coordinator、Blackboard、Observer 等核心模块的职责。
对比 AutoGen、LangGraph multi-agent、CrewAI、OpenAI Agents SDK handoffs、CAMEL、MetaGPT 的设计取舍。
知道生产环境中 Multi-Agent 的部署、并发、持久化、隔离、可观测与失败恢复要点。
回答 Multi-Agent 选型、协作模式、冲突解决、可观测等面试问题。

Multi-Agent 与其他主题的关系

主题	解决的核心问题	与 Multi-Agent 的关系
Agent Runtime	单 Agent 如何安全、可观测地执行	Multi-Agent 中的每个 Agent 都运行在 Runtime 之上；Runtime 提供 ReAct、工具、护栏等原子能力
Agent Memory	如何保留并利用上下文与经验	Multi-Agent 共享或隔离的长期记忆是协作基础；Blackboard 也需要 Memory 做持久化
Multi-Agent	多个 Agent 如何分工协作完成复杂目标	承上启下，把单 Agent 能力编排成群体智能
Planning	如何分解与重规划任务	Coordinator 依赖 Planner 做任务拆分与再分配
Tool Use	工具调用与执行	每个 Agent 通过 Tool Use 层调用自身工具；Multi-Agent 协调共享工具权限
MCP	工具发现与调用协议	Agent 可通过 MCP 发现彼此能力，但 Multi-Agent 协作不依赖 MCP
RAG（后续主题）	外部知识检索	多个 Agent 可共享 RAG 检索结果，Blackboard 中沉淀共同上下文

上表可以概括为一句话：Agent Runtime 决定“单个 Agent 怎么执行”，Multi-Agent 决定“多个 Agent 怎么协作”，Memory 决定“它们记得什么、共享什么”。

本章结构

背景 — 单 Agent 的局限、Multi-Agent 演进阶段、典型场景、核心挑战。
核心思想 — 角色、技能、消息总线、协调器、黑板、Handoff、共识、观测、失败恢复。
架构设计 — 分层架构、控制面/数据面、部署形态、与 Runtime/Memory 集成。
协作模式 — Manager-Worker、Peer-to-Peer、Pipeline、Auction、动态 Handoff 与生命周期。
核心模块 — Agent Registry、Role & Skill、Message Bus、Coordinator、Blackboard、Observer、终止与冲突解决。
源码分析 — AutoGen、LangGraph multi-agent、CrewAI、OpenAI Agents SDK handoffs、CAMEL、MetaGPT。
工程实践 — 纯 Python Mini Demo 设计与运行说明。
企业生产实践 — 部署拓扑、并发、持久化、消息队列、权限隔离、成本、HITL、失败恢复。
最佳实践 — 角色设计、消息契约、避免过度协调、冲突解决、可观测优先、版本管理、评测、渐进落地。
面试题 — 初级/中级/高级面试题。
延伸阅读 — 官方文档、论文、工程文章、学习路径。

一句话总结

Multi-Agent 不是简单地“多跑几个 Agent”，而是通过清晰的角色边界、可靠的消息机制、统一的协调策略和可观测的共享状态，把多个单 Agent 的能力有序组合成群体智能。

本章小结

Multi-Agent 是 Agent 基础设施的上一层编排：它依赖 Agent Runtime 提供单 Agent 执行能力，依赖 Agent Memory 提供共享或隔离的记忆，依赖 Planning 做任务拆分，依赖 MCP/RAG 扩展知识与工具。核心目标是让多个 Agent 在复杂任务中各司其职、协同演进。

参考来源

Multi-Agent 总览 ​

本主题适合谁 ​

学习目标 ​

Multi-Agent 与其他主题的关系 ​

本章结构 ​

一句话总结 ​

本章小结 ​