Skip to content

Agent Planning 总览

一句话理解:Agent Planning 是 Agent 的“任务拆解与路线规划系统”,负责把模糊目标转化为可执行、可观测、可动态调整的计划。

在 AI Infra 中,Planning 是 Agent 从“单次交互”走向“长程自治”的关键层。它不是让模型直接生成答案,而是让模型先思考“要做什么、按什么顺序做、失败了怎么办”,并把这些思考显式地结构化成计划,再交给下游执行。

学习目标

读完本章后,你应能:

  1. 解释 Planning 与 prompt engineering、CoT、ReAct 的演进关系。
  2. 描述 Planning 的核心循环:分解目标、表示计划、执行步骤、观测结果、动态重规划。
  3. 画出 Planning 层的典型架构,并说明 Planner、Plan Store、Executor、Observer、Replan Trigger 等组件的职责边界。
  4. 对比 ReAct、Plan-and-Execute、Tree of Thoughts、LLM+P、HuggingGPT、LangGraph planner、OpenAI Agents SDK handoffs、AutoGen planner 等主流方案的设计取舍。
  5. planning_mini 实现一个最小可用的 Planning Agent,并解释生产落地的关键差异。
  6. 识别生产中的典型陷阱:重规划风暴、计划粒度过细/过粗、计划不可验证、与人类协作断层等。

Planning 与相邻主题的关系

主题与 Planning 的关系边界说明
Agent RuntimeRuntime 负责步骤调度、工具调用、生命周期管理;Planning 负责“做什么”Planning 生成计划,Runtime 执行计划;Runtime 不决定任务拆解策略,只负责把计划项调度到工具/模型/人。
MemoryMemory 提供上下文、历史计划、经验教训;Planning 需要读写 Plan Store 与长期记忆Planning 只负责计划本身的语义,Memory 负责存储、检索与向量化。
ReflectionReflection 负责从执行结果中提炼失败根因与改进策略,触发重规划Planning 响应 Reflection 的输出;Reflection 不直接生成新计划。
Multi-AgentMulti-Agent 解决“谁来做”,Planning 解决“做什么、按什么顺序做”两者常组合:中央 Planner 拆计划,各 Agent 领取子任务执行。
MCPMCP 提供标准化的外部能力接入;Planning 通过 Tool/MCP Gateway 使用这些能力Planning 不关心 MCP 协议细节,只依赖工具描述与调用结果。
Tool UseTool Use 负责单次工具调用的语法与结果解析;Planning 决定何时、为何、以什么参数调用Planning 把工具调用作为计划中的原子步骤。

本章结构

一句话总结

Agent Planning 把“模糊目标”变成“可执行、可观测、可回滚、可重规划”的结构化计划,是 Agent 从“想到哪做到哪”走向“长程自治”的必经之路。

本章小结

  • Planning 是 Agent 的控制中枢之一,核心职责是目标拆解、计划表示、执行调度与动态调整。
  • 它与 Runtime、Memory、Reflection、Multi-Agent、MCP、Tool Use 各司其职,边界清晰才能避免系统耦合。
  • 本章将从背景、核心思想、架构、循环、模块、源码、实践到面试题,系统讲解 Planning 的工程落地。

参考来源

Released under CC-BY-SA-4.0 License.