Skip to content

3. 架构设计

一句话理解:Multi-Agent 架构可以概括为“角色层 + 通信层 + 协调层 + 记忆层 + 观测层”的五层结构,控制面负责生命周期与策略,数据面负责消息流转与状态更新

整体架构

分层职责

层级职责典型组件
接入层接收任务、鉴权、路由API Gateway、LLM Gateway
控制面Agent 注册、角色策略、权限、审计Agent Registry、Policy Store、Secret Manager
协调层任务分配、Handoff、终止判定Coordinator、Planner、Aggregator
通信层消息路由、收件箱、重试、顺序保证Message Bus、Inbox、Queue
Agent 层具体执行任务的 Agent多个带 Role/Skill 的 Runtime 实例
记忆层共享 Blackboard、跨 Agent 记忆Blackboard、Agent Memory、持久化存储
可观测层跨 Agent trace、metrics、logsOpenTelemetry、LangSmith、Prometheus

控制面 vs 数据面

维度控制面数据面
职责Agent 注册、角色权限、任务路由策略、审计Agent 执行、消息流转、黑板读写
状态长期、持久化会话级、可 checkpoint
扩展管理 API、配置中心水平扩展 Agent worker、消息队列分片
示例谁能调用哪个 Agent、哪些任务必须 HITLAgent 之间的一次 Handoff、黑板更新

控制面决定“谁能做什么”,数据面决定“正在怎么做”。

核心模块协作

部署形态

形态 1:同进程多 Agent

所有 Agent 跑在同一个进程内,Message Bus 是内存队列,Blackboard 是共享对象。

优点:低延迟、易调试。 缺点:无法横向扩展,单点故障影响全部。

形态 2:独立服务集群

每个 Agent 类型是一个独立服务,通过消息队列通信。

text
User → Coordinator Service → MQ → Agent Services → Blackboard Service

优点:可独立扩缩、按角色优化资源。 缺点:网络延迟增加,需要消息序列化与持久化。

形态 3:Serverless / 云托管

例如 Azure AI Agent Service、AWS Bedrock Multi-Agent Orchestration。

优点:按需计费、自动扩缩。 缺点:供应商锁定、自定义协调策略受限。

与 Runtime、Memory、Gateway 的关系

text
User → LLM Gateway → Multi-Agent Coordinator → Agent Runtime → Tools

                    Agent Memory / Blackboard

                       Observer
  • LLM Gateway:提供统一模型接入。
  • Multi-Agent Coordinator:负责任务分配与协作编排。
  • Agent Runtime:每个 Agent 的 ReAct 执行容器。
  • Agent Memory / Blackboard:提供共享或隔离的记忆。
  • Observer:记录跨 Agent 的 trace 与事件。

本章小结

Multi-Agent 架构通过五层设计把复杂的群体协作拆解为清晰的模块边界:角色层定义能力,通信层传递消息,协调层决定调度,记忆层共享上下文,观测层记录全局 trace。控制面与数据面分离后,系统才能在生产环境中横向扩展、独立升级与故障隔离。

参考来源

Released under CC-BY-SA-4.0 License.