Skip to content

延伸阅读

一句话理解:Planning 的理论基础来自经典规划、强化学习与 LLM 推理,工程实现则分布在各大 Agent 框架与工业实践中,推荐阅读顺序是:论文 → 框架文档 → 工程文章 → 源码。

本章提供论文、框架文档、工程文章与学习路径,帮助读者从理论到实践系统掌握 Planning。

论文

基础与演进

显式 Planning 与搜索

Multi-Agent 与协作规划

反思与自我改进

框架文档

工程文章

相关主题链接

本章所在 AI Infra Handbook 的相关主题:

  • Agent Runtime:Planning 层的执行伙伴,负责任务调度与生命周期。
  • Memory:为 Planning 提供上下文、历史计划与经验教训。
  • Reflection:从失败中总结,驱动 Planning 重规划。
  • Multi-Agent:与 Planning 协作,解决“谁来做”。
  • MCP:为 Planning 提供标准化的外部能力接入。
  • Tool Use:Planning 把工具调用作为计划中的原子步骤。

推荐学习路径

路径一:快速上手(1-2 周)

  1. 阅读 ReAct 论文LangChain Planning 博客
  2. 用 LangGraph 或 OpenAI Agents SDK 实现一个 Plan-and-Execute 原型。
  3. 阅读本章的 02-core-ideas07-mini-demo

路径二:系统深入(1-2 月)

  1. 精读 ToT、LLM+P、HuggingGPT 三篇论文。
  2. 对比 ReAct、Plan-and-Execute、LangGraph、AutoGen 的源码实现。
  3. 阅读本章的 03-architecture04-planning-loop05-core-modules
  4. 设计并实现一个带 DAG 执行、Observer、Replan Trigger 的 Planning 层。

路径三:生产落地(持续)

  1. 阅读 08-production-practice09-best-practices
  2. 在真实业务中接入 Planning 层,重点验证计划验证、重规划风暴防护、HITL、审计。
  3. 建立 SLO 监控体系,持续优化分解模板与模型策略。
  4. 定期复盘失败案例,沉淀到 Plan Memory。

本章小结

  • Planning 的理论基础包括 CoT、ReAct、显式规划、树搜索、经典规划、多 Agent 协作与 Reflection。
  • 工程实现可重点参考 LangGraph、OpenAI Agents SDK、AutoGen、Semantic Kernel。
  • 推荐按“快速上手 → 系统深入 → 生产落地”的路径学习,并结合本主题其他章节建立完整知识网络。

参考来源

Released under CC-BY-SA-4.0 License.