1. 背景

一句话理解：当任务复杂到需要同时调用多种专业能力、并行探索多条路径、并在执行中持续协商时，单 Agent 的“一人全包”模式就不再够用。

1. 单 Agent 的局限

单 Agent 通常由“一个 LLM + 工具 + 记忆 + ReAct 循环”组成。它在以下场景会遇到明显天花板：

Multi-Agent 的核心动机就是把复杂任务拆成多个角色，让每个 Agent 聚焦一个专业能力，再通过协作机制把它们串起来。

阶段	特点	代表
单轮 Prompt	无状态问答，依赖单次模型能力	早期 Chatbot
单 Agent + Tools	模型可调用外部工具，但仍是单角色	Function Calling Agent
单 Agent + ReAct + Memory	多轮循环、可读写记忆	LangGraph Agent、OpenAI Agents SDK
Multi-Agent 协作	多角色分工、消息通信、共享状态	AutoGen、CrewAI、MetaGPT
自动编排 + 群体反思	Agent 动态组队、自我评估、共识聚合	研究前沿

一线客服 Agent 处理退换货，遇到复杂投诉时 Handoff 给资深客服 Agent，必要时引入法务 Agent 复核。

架构 Agent 负责设计、Coder Agent 负责实现、Reviewer Agent 负责代码审查、Test Agent 负责生成测试用例。

搜索 Agent 收集资料、摘要 Agent 提炼观点、写作 Agent 生成报告、Fact-check Agent 校验引用。

选题 Agent 提创意、编剧 Agent 写脚本、审核 Agent 检查合规、运营 Agent 生成标题与摘要。

挑战	说明
角色边界	哪些工作分给哪个 Agent？职责不清会互相推诿或重复劳动。
通信开销	Agent 之间消息太多会拖慢整体，太少又会导致信息不对称。
状态一致	共享 Blackboard 的读写冲突、缓存失效、部分失败如何处理？
协调策略	谁来分配任务？Manager-Worker 还是去中心化？
冲突解决	多个 Agent 给出矛盾结论时，如何聚合或投票？
可观测	多个 Agent 的执行路径交织，如何 trace 一次完整任务？
成本与延迟	每增加一个 Agent 就多一次或多次 LLM 调用，必须精打细算。

Multi-Agent 的产生源于单 Agent 在复杂任务中的角色冲突、上下文爆炸与并行能力缺失。它把任务拆给多个专业 Agent，但也带来了角色边界、通信、状态一致、协调、冲突解决、可观测和成本等新挑战。理解这些挑战，是设计 Multi-Agent 架构的前提。

参考来源