11. 延伸阅读

一句话理解：Agent Reflection 的理论基础来自 Self-Refine、Reflexion、CRITIC 等论文，工程落地可以参考 LangGraph、AutoGen 等框架的反射教程，同时要与 Agent Runtime、Memory、Multi-Agent 等主题联动学习。

论文

论文	核心贡献	链接
Self-Refine: Iterative Refinement with Self-Feedback	提出“生成—反馈—精炼”的通用迭代框架，无需额外训练数据	arXiv
Reflexion: Self-Reflective Agents with Verbal Reinforcement Learning	用语言反馈替代强化学习的奖励信号，Agent 通过反思失败经验改进后续行动	arXiv
CRITIC: Large Language Models Can Self-Correct with Tool-Interactive Critiquing	引入外部工具交互进行批判，解决 LLM 自评的事实性问题	arXiv
Tree of Thoughts: Deliberate Problem Solving with Large Language Models	用树搜索结构组织多步推理与评估，支持回溯和全局决策	arXiv
Language Models Can Teach Themselves to Program Better	展示代码生成任务中自我批判与测试反馈结合的效果	OpenReview

框架与官方文档

资源	说明	链接
LangGraph Reflection Tutorial	LangGraph 官方反射教程，含代码示例和状态图	官方教程
LangGraph Blog — Reflection Agents	反射 Agent 的设计模式与实践建议	博客
AutoGen Reflection Tutorial	Microsoft AutoGen 的反思 Agent 教程	官方文档
OpenAI o1 / Reasoning Models	OpenAI 关于推理模型的官方介绍	OpenAI

工程文章

"Building LLM Systems: Reflection" — 讨论何时以及如何在生产系统中引入 Reflection。
"Self-Correction in LLMs" — 综述 LLM 自我纠错的研究进展与挑战。
"LLM as a Critic" — 探讨用 LLM 作为 Critic 的 prompt 工程与校准方法。
"Test-Time Compute" — 讨论通过增加推理时计算（包括反思）提升模型性能的趋势。

主题	关系	链接
Agent Runtime	Runtime 提供执行循环，Reflection 叠加自我纠错	阅读
Agent Memory	Memory 存储反思产生的经验与 episode	阅读
Multi-Agent	群体反思依赖多 Agent 通信与协调	阅读
Planning 详解	Plan Reflection 在规划层面做批判与重规划	阅读
Tool Use 详解	Tool-use Reflection 反思工具选择、参数与调用结果	阅读
Tool Use（后续主题）	工具结果可作为 Reflection 的外部反馈	敬请期待
MCP	Reflection 可调用外部验证工具；MCP 提供标准化工具发现	阅读

Mini Demo 本地入口

Mini Demo README
源码包：mini-demo/reflection_mini/
测试目录：mini-demo/tests/

本章小结

Agent Reflection 的延伸阅读覆盖了理论基础、工程框架、相关主题和学习路径。建议从 Self-Refine、Reflexion、CRITIC 三篇论文入手，结合 LangGraph 或 AutoGen 的教程进行实践，再与本主题的架构设计、Mini Demo 和企业生产实践章节对照阅读，形成从理论到落地的完整认知。

参考来源

11. 延伸阅读 ​

论文 ​

框架与官方文档 ​

工程文章 ​

相关主题 ​

推荐学习路径 ​

Mini Demo 本地入口 ​

本章小结 ​

11. 延伸阅读

论文

框架与官方文档

工程文章

相关主题

推荐学习路径

Mini Demo 本地入口

本章小结