Skip to content

11. 延伸阅读

官方文档(必读)

向量数据库文档

论文

工程文章

相关主题

  • Agent Runtime 详解 — Memory 的调用方,理解 ReAct 循环中的记忆读写。
  • LLM Gateway 详解 — Agent Runtime 通常通过 Gateway 调用模型,记忆系统也可通过 Gateway 调用 embedding 模型。
  • vLLM 详解 — 可作为 Agent Runtime 的上游推理引擎。
  • RAG 主题(后续主题)— 外部知识检索,与 Memory 同源但数据不同。
  • Planning 详解 — Planner 可以利用 Episodic Memory 中的经验生成更优计划。
  • Tool Use 详解 — 工具调用层;工具结果与偏好可写入 Memory。
  • Multi-Agent 主题 — 共享或隔离的长期记忆池是多 Agent 协作的基础。
  • Reflection 主题 — Reflection 系统产出 critique、score 与改进经验,是 Episodic Memory 的重要输入。
  • MCP 主题 — Memory 可以暴露 remember/recall 接口供 Runtime 通过 MCP 调用。

推荐学习路径

  1. 先读 MemGPT 论文,理解 Core / Recall / Archival Memory 的分层思想。
  2. 阅读 Steve Kinney 的文章,建立记忆分类与生命周期的系统认知。
  3. 用 Letta 或 Mem0 跑一个带长期记忆的对话 Agent,观察记忆如何影响回答。
  4. 阅读本主题的 Mini Demo,理解零外部依赖下的记忆机制实现。
  5. 结合 生产实践最佳实践,思考多租户、隐私、embedding 版本管理与评测落地。
  6. 如果已读过 Agent Runtime,重点对比 Runtime 与 Memory 的边界与协作方式。

本章小结

Agent Memory 的延伸阅读覆盖了官方文档、论文、工程文章与相关主题。MemGPT 论文奠定了分层记忆的理论基础;Letta、LangGraph、Mem0 代表了不同的工程实现取向;Chroma、Weaviate、Milvus、pgvector 提供了多样化的向量存储选择。结合本主题的 Mini Demo生产实践最佳实践,可以从理论到工程全面掌握 Agent Memory。

参考来源

Released under CC-BY-SA-4.0 License.