延伸阅读

一句话理解：Planning 的理论基础来自经典规划、强化学习与 LLM 推理，工程实现则分布在各大 Agent 框架与工业实践中，推荐阅读顺序是：论文 → 框架文档 → 工程文章 → 源码。

本章提供论文、框架文档、工程文章与学习路径，帮助读者从理论到实践系统掌握 Planning。

论文

基础与演进

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
- CoT 的开山之作，理解 LLM 逐步推理的基础。
ReAct: Synergizing Reasoning and Acting in Language Models
- 推理与行动交错，是 Planning 从隐式到显式的重要过渡。
Plan-and-Solve Prompting: Improving Zero-Shot Chain-of-Thought Reasoning by Large Language Models
- 先制定计划再求解，是显式 Planning 的重要早期工作。

显式 Planning 与搜索

Tree of Thoughts: Deliberate Problem Solving with Large Language Models
- 把推理组织成树并搜索，适合需要多路径探索的任务。
LLM+P: Empowering Large Language Models with Optimal Planning Proficiency
- LLM + 经典规划器（PDDL），适合状态/动作可形式化的问题。
HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in HuggingFace
- LLM 作为任务规划器，调度多个专家模型。

Multi-Agent 与协作规划

AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation
- AutoGen 的论文，理解多 Agent 对话式规划。
MetaGPT: Meta Programming for A Multi-Agent Collaborative Framework
- 用角色化协作完成复杂软件工程任务，体现分层 Planning。

反思与自我改进

Reflexion: Self-Reflective Agents with Verbal Reinforcement Learning
- 理解 Reflection 如何与 Planning 配合。
Self-Refine: Iterative Self-Refinement with Feedback-LLMs
- 自我迭代的生成-反馈-改进循环。

框架文档

LangGraph Plans
- LangGraph 的计划概念与图结构执行。
LangChain Planning for Agents
- LangChain 对 Planning 的工程设计思考。
OpenAI Agents SDK Handoffs
- OpenAI Agents SDK 中的 Agent 转交机制。
AutoGen Planning Tutorial
- AutoGen 的 Planning 教程与多 Agent 协作示例。
Semantic Kernel Planners
- 微软 Semantic Kernel 的 Planner 能力介绍。

工程文章

Building LLM Agents: A Practical Guide
- 关于 LLM Agent 构建的实用指南，涵盖 Planning。
The Rise and Potential of Large Language Model Based Agents: A Survey
- LLM Agent 综述，Planning 是其中重要章节。
A Survey on Large Language Model based Autonomous Agents
- 另一篇高质量综述，系统梳理 Agent 架构。

相关主题链接

本章所在 AI Infra Handbook 的相关主题：

Agent Runtime：Planning 层的执行伙伴，负责任务调度与生命周期。
Memory：为 Planning 提供上下文、历史计划与经验教训。
Reflection：从失败中总结，驱动 Planning 重规划。
Multi-Agent：与 Planning 协作，解决“谁来做”。
MCP：为 Planning 提供标准化的外部能力接入。
Tool Use：Planning 把工具调用作为计划中的原子步骤。

推荐学习路径

路径一：快速上手（1-2 周）

阅读 ReAct 论文与 LangChain Planning 博客。
用 LangGraph 或 OpenAI Agents SDK 实现一个 Plan-and-Execute 原型。
阅读本章的 02-core-ideas 与 07-mini-demo。

路径二：系统深入（1-2 月）

精读 ToT、LLM+P、HuggingGPT 三篇论文。
对比 ReAct、Plan-and-Execute、LangGraph、AutoGen 的源码实现。
阅读本章的 03-architecture、04-planning-loop、05-core-modules。
设计并实现一个带 DAG 执行、Observer、Replan Trigger 的 Planning 层。

路径三：生产落地（持续）

阅读 08-production-practice 与 09-best-practices。
在真实业务中接入 Planning 层，重点验证计划验证、重规划风暴防护、HITL、审计。
建立 SLO 监控体系，持续优化分解模板与模型策略。
定期复盘失败案例，沉淀到 Plan Memory。

本章小结

Planning 的理论基础包括 CoT、ReAct、显式规划、树搜索、经典规划、多 Agent 协作与 Reflection。
工程实现可重点参考 LangGraph、OpenAI Agents SDK、AutoGen、Semantic Kernel。
推荐按“快速上手 → 系统深入 → 生产落地”的路径学习，并结合本主题其他章节建立完整知识网络。

参考来源