Skip to content

1. 背景

一句话理解:当任务复杂到需要同时调用多种专业能力、并行探索多条路径、并在执行中持续协商时,单 Agent 的“一人全包”模式就不再够用

1. 单 Agent 的局限

单 Agent 通常由“一个 LLM + 工具 + 记忆 + ReAct 循环”组成。它在以下场景会遇到明显天花板:

  • 角色冲突:同一个 Prompt 里既要它做架构师又要它写代码,容易顾此失彼。
  • 上下文爆炸:任务越复杂,需要携带的 instructions、历史、工具描述越长,反而降低决策质量。
  • 能力边界模糊:模型自己决定什么时候调用工具、什么时候做规划,出错后难以定位是模型问题还是编排问题。
  • 难以并行:单 Agent 一次只能走一条推理链,无法让多个专家同时探索不同方案。
  • 安全与隔离:高权限工具和低权限工具混在一起,容易越权。

Multi-Agent 的核心动机就是把复杂任务拆成多个角色,让每个 Agent 聚焦一个专业能力,再通过协作机制把它们串起来

2. 演进阶段

阶段特点代表
单轮 Prompt无状态问答,依赖单次模型能力早期 Chatbot
单 Agent + Tools模型可调用外部工具,但仍是单角色Function Calling Agent
单 Agent + ReAct + Memory多轮循环、可读写记忆LangGraph Agent、OpenAI Agents SDK
Multi-Agent 协作多角色分工、消息通信、共享状态AutoGen、CrewAI、MetaGPT
自动编排 + 群体反思Agent 动态组队、自我评估、共识聚合研究前沿

3. 典型场景

客服升级

一线客服 Agent 处理退换货,遇到复杂投诉时 Handoff 给资深客服 Agent,必要时引入法务 Agent 复核。

编程助手

架构 Agent 负责设计、Coder Agent 负责实现、Reviewer Agent 负责代码审查、Test Agent 负责生成测试用例。

研究助手

搜索 Agent 收集资料、摘要 Agent 提炼观点、写作 Agent 生成报告、Fact-check Agent 校验引用。

内容生产

选题 Agent 提创意、编剧 Agent 写脚本、审核 Agent 检查合规、运营 Agent 生成标题与摘要。

4. 核心挑战

挑战说明
角色边界哪些工作分给哪个 Agent?职责不清会互相推诿或重复劳动。
通信开销Agent 之间消息太多会拖慢整体,太少又会导致信息不对称。
状态一致共享 Blackboard 的读写冲突、缓存失效、部分失败如何处理?
协调策略谁来分配任务?Manager-Worker 还是去中心化?
冲突解决多个 Agent 给出矛盾结论时,如何聚合或投票?
可观测多个 Agent 的执行路径交织,如何 trace 一次完整任务?
成本与延迟每增加一个 Agent 就多一次或多次 LLM 调用,必须精打细算。

本章小结

Multi-Agent 的产生源于单 Agent 在复杂任务中的角色冲突、上下文爆炸与并行能力缺失。它把任务拆给多个专业 Agent,但也带来了角色边界、通信、状态一致、协调、冲突解决、可观测和成本等新挑战。理解这些挑战,是设计 Multi-Agent 架构的前提。

参考来源

Released under CC-BY-SA-4.0 License.