11. 延伸阅读

官方文档（必读）

Letta Documentation
- 前身 MemGPT 的后续项目，学习 Core / Recall / Archival Memory 的分层设计。
Letta GitHub
- 开源实现，重点看 memory 模块与 agent loop 的交互。
LangGraph Persistence
- 生产级状态持久化，重点看 checkpoint、thread、中断恢复。
LangGraph Add Memory
- 跨会话长期记忆的 Store 机制。
OpenAI Agents SDK Sessions
- OpenAI 生态的会话与记忆管理。
Mem0 Documentation
- 面向 AI 助手的记忆层，重点看 user/session/memory 抽象。

向量数据库文档

Chroma Documentation
- 轻量向量数据库，适合原型与本地开发。
Weaviate Documentation
- 云原生向量数据库，支持模块化 pipeline 与 hybrid search。
Milvus Documentation
- 面向大规模向量检索的数据库，重点看索引类型与分布式部署。
pgvector GitHub
- PostgreSQL 向量扩展，适合已有 Postgres 基础设施的团队。

论文

MemGPT: Towards LLMs as Operating Systems
- Agent 分层记忆的奠基论文，必读。
ReAct: Synergizing Reasoning and Acting in Language Models
- Agent Runtime 的基础范式，理解 Runtime 如何调用 Memory。
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
- RAG 基础论文，帮助区分 Memory 与 RAG。

工程文章

Steve Kinney — Agent Memory Systems
- 系统梳理 Agent 记忆分类与设计权衡。
LangGraph Memory Store Guide
- 跨会话记忆的工程实践。
Mem0 Blog / Guides
- 用户-centric 记忆层的实现思路。

相关主题

Agent Runtime 详解 — Memory 的调用方，理解 ReAct 循环中的记忆读写。
LLM Gateway 详解 — Agent Runtime 通常通过 Gateway 调用模型，记忆系统也可通过 Gateway 调用 embedding 模型。
vLLM 详解 — 可作为 Agent Runtime 的上游推理引擎。
RAG 主题（后续主题）— 外部知识检索，与 Memory 同源但数据不同。
Planning 详解 — Planner 可以利用 Episodic Memory 中的经验生成更优计划。
Tool Use 详解 — 工具调用层；工具结果与偏好可写入 Memory。
Multi-Agent 主题 — 共享或隔离的长期记忆池是多 Agent 协作的基础。
Reflection 主题 — Reflection 系统产出 critique、score 与改进经验，是 Episodic Memory 的重要输入。
MCP 主题 — Memory 可以暴露 remember/recall 接口供 Runtime 通过 MCP 调用。

推荐学习路径

先读 MemGPT 论文，理解 Core / Recall / Archival Memory 的分层思想。
阅读 Steve Kinney 的文章，建立记忆分类与生命周期的系统认知。
用 Letta 或 Mem0 跑一个带长期记忆的对话 Agent，观察记忆如何影响回答。
阅读本主题的 Mini Demo，理解零外部依赖下的记忆机制实现。
结合生产实践与最佳实践，思考多租户、隐私、embedding 版本管理与评测落地。
如果已读过 Agent Runtime，重点对比 Runtime 与 Memory 的边界与协作方式。

本章小结

Agent Memory 的延伸阅读覆盖了官方文档、论文、工程文章与相关主题。MemGPT 论文奠定了分层记忆的理论基础；Letta、LangGraph、Mem0 代表了不同的工程实现取向；Chroma、Weaviate、Milvus、pgvector 提供了多样化的向量存储选择。结合本主题的 Mini Demo、生产实践与最佳实践，可以从理论到工程全面掌握 Agent Memory。

参考来源