Skip to content

延伸阅读

本章列出 RAG 相关的论文、官方文档、博客与学习路径,并给出相邻主题的交叉引用。

学术论文

官方文档与框架

工程博客与文章

相邻主题交叉引用

主题链接与本主题关系
LLM Gateway/04-llmops/llm-gateway/RAG 在线服务的流量入口与模型路由。
Agent Runtime/05-agent/agent-runtime/Agent 把 Retriever 当作工具调用。
Memory/05-agent/memory/向量存储是长期语义记忆的载体。
MCP/05-agent/mcp/把 Retriever 封装为 MCP Server。
Planning/05-agent/planning/复杂查询需要先规划再多次检索。
Tool Use/05-agent/tool-use/检索器是一种返回文档的工具。
Agent OS/05-agent/agent-os/为 RAG 任务提供进程与资源隔离。
AI SRE/07-ai-sre/为 RAG 服务提供可观测性、SLO 与事故响应保障。

推荐学习路径

  1. 入门:读 RAG 奠基论文,用 LangChain/LlamaIndex 跑通一个 PDF 问答 Demo。
  2. 进阶:评估 dense/sparse/hybrid 检索,加入 reranker,建立 RAGAS 评估集。
  3. 深入:阅读 ColBERT/SPLADE/GraphRAG,理解高级检索与推理增强。
  4. 生产:设计多租户、增量更新、缓存、可观测与反馈闭环的 RAG 服务。

一句话收尾

RAG 是连接“静态知识库”与“动态语言模型”的桥梁;桥梁的承载力取决于索引质量、检索精度、生成可控性与持续迭代机制。

Released under CC-BY-SA-4.0 License.