Agent Planning 总览

一句话理解：Agent Planning 是 Agent 的“任务拆解与路线规划系统”，负责把模糊目标转化为可执行、可观测、可动态调整的计划。

在 AI Infra 中，Planning 是 Agent 从“单次交互”走向“长程自治”的关键层。它不是让模型直接生成答案，而是让模型先思考“要做什么、按什么顺序做、失败了怎么办”，并把这些思考显式地结构化成计划，再交给下游执行。

学习目标

读完本章后，你应能：

解释 Planning 与 prompt engineering、CoT、ReAct 的演进关系。
描述 Planning 的核心循环：分解目标、表示计划、执行步骤、观测结果、动态重规划。
画出 Planning 层的典型架构，并说明 Planner、Plan Store、Executor、Observer、Replan Trigger 等组件的职责边界。
对比 ReAct、Plan-and-Execute、Tree of Thoughts、LLM+P、HuggingGPT、LangGraph planner、OpenAI Agents SDK handoffs、AutoGen planner 等主流方案的设计取舍。
用 planning_mini 实现一个最小可用的 Planning Agent，并解释生产落地的关键差异。
识别生产中的典型陷阱：重规划风暴、计划粒度过细/过粗、计划不可验证、与人类协作断层等。

主题	与 Planning 的关系	边界说明
Agent Runtime	Runtime 负责步骤调度、工具调用、生命周期管理；Planning 负责“做什么”	Planning 生成计划，Runtime 执行计划；Runtime 不决定任务拆解策略，只负责把计划项调度到工具/模型/人。
Memory	Memory 提供上下文、历史计划、经验教训；Planning 需要读写 Plan Store 与长期记忆	Planning 只负责计划本身的语义，Memory 负责存储、检索与向量化。
Reflection	Reflection 负责从执行结果中提炼失败根因与改进策略，触发重规划	Planning 响应 Reflection 的输出；Reflection 不直接生成新计划。
Multi-Agent	Multi-Agent 解决“谁来做”，Planning 解决“做什么、按什么顺序做”	两者常组合：中央 Planner 拆计划，各 Agent 领取子任务执行。
MCP	MCP 提供标准化的外部能力接入；Planning 通过 Tool/MCP Gateway 使用这些能力	Planning 不关心 MCP 协议细节，只依赖工具描述与调用结果。
Tool Use	Tool Use 负责单次工具调用的语法与结果解析；Planning 决定何时、为何、以什么参数调用	Planning 把工具调用作为计划中的原子步骤。

Agent Planning 把“模糊目标”变成“可执行、可观测、可回滚、可重规划”的结构化计划，是 Agent 从“想到哪做到哪”走向“长程自治”的必经之路。

参考来源