Skip to content

11. 延伸阅读

一句话理解:Agent Reflection 的理论基础来自 Self-Refine、Reflexion、CRITIC 等论文,工程落地可以参考 LangGraph、AutoGen 等框架的反射教程,同时要与 Agent Runtime、Memory、Multi-Agent 等主题联动学习

论文

论文核心贡献链接
Self-Refine: Iterative Refinement with Self-Feedback提出“生成—反馈—精炼”的通用迭代框架,无需额外训练数据arXiv
Reflexion: Self-Reflective Agents with Verbal Reinforcement Learning用语言反馈替代强化学习的奖励信号,Agent 通过反思失败经验改进后续行动arXiv
CRITIC: Large Language Models Can Self-Correct with Tool-Interactive Critiquing引入外部工具交互进行批判,解决 LLM 自评的事实性问题arXiv
Tree of Thoughts: Deliberate Problem Solving with Large Language Models用树搜索结构组织多步推理与评估,支持回溯和全局决策arXiv
Language Models Can Teach Themselves to Program Better展示代码生成任务中自我批判与测试反馈结合的效果OpenReview

框架与官方文档

资源说明链接
LangGraph Reflection TutorialLangGraph 官方反射教程,含代码示例和状态图官方教程
LangGraph Blog — Reflection Agents反射 Agent 的设计模式与实践建议博客
AutoGen Reflection TutorialMicrosoft AutoGen 的反思 Agent 教程官方文档
OpenAI o1 / Reasoning ModelsOpenAI 关于推理模型的官方介绍OpenAI

工程文章

  • "Building LLM Systems: Reflection" — 讨论何时以及如何在生产系统中引入 Reflection。
  • "Self-Correction in LLMs" — 综述 LLM 自我纠错的研究进展与挑战。
  • "LLM as a Critic" — 探讨用 LLM 作为 Critic 的 prompt 工程与校准方法。
  • "Test-Time Compute" — 讨论通过增加推理时计算(包括反思)提升模型性能的趋势。

相关主题

主题关系链接
Agent RuntimeRuntime 提供执行循环,Reflection 叠加自我纠错阅读
Agent MemoryMemory 存储反思产生的经验与 episode阅读
Multi-Agent群体反思依赖多 Agent 通信与协调阅读
Planning 详解Plan Reflection 在规划层面做批判与重规划阅读
Tool Use 详解Tool-use Reflection 反思工具选择、参数与调用结果阅读
Tool Use(后续主题)工具结果可作为 Reflection 的外部反馈敬请期待
MCPReflection 可调用外部验证工具;MCP 提供标准化工具发现阅读

推荐学习路径

  1. 先读论文:Self-Refine → Reflexion → CRITIC,理解三种典型反思范式。
  2. 再看框架:LangGraph Reflection Tutorial 动手跑一遍代码。
  3. 结合本主题:阅读本主题 01~07 章,理解架构与 Mini Demo。
  4. 深入学习:结合 Agent Runtime、Memory、Multi-Agent 主题,思考 Reflection 在整个 Agent 系统中的位置。
  5. 动手实践:在真实任务中尝试构建一个最小 Reflection 系统,用真实 LLM 替换 Demo 中的 MockLLMClient。

Mini Demo 本地入口

  • Mini Demo README
  • 源码包:mini-demo/reflection_mini/
  • 测试目录:mini-demo/tests/

本章小结

Agent Reflection 的延伸阅读覆盖了理论基础、工程框架、相关主题和学习路径。建议从 Self-Refine、Reflexion、CRITIC 三篇论文入手,结合 LangGraph 或 AutoGen 的教程进行实践,再与本主题的架构设计、Mini Demo 和企业生产实践章节对照阅读,形成从理论到落地的完整认知。

参考来源

Released under CC-BY-SA-4.0 License.