Skip to content
AI Infra Handbook
Search
K
Main Navigation
首页
阅读指南
学习路线
LLMOps
vLLM
SGLang
TensorRT-LLM
Triton Inference Server
LLM Gateway
Agent
Agent Runtime
Memory
Multi-Agent
Reflection
MCP
Planning
Tool Use
主题
菜单
回到顶部
目录
RAG 篇
本章节覆盖检索增强生成的技术与工程实现。
计划中主题
Embedding
Retriever
Hybrid Search
GraphRAG
Evaluation
一句话理解
RAG 让大模型能够基于私有、实时、结构化的外部知识进行推理,基础设施要解决的是检索质量、延迟与成本的平衡。
本章节正在建设中,敬请期待。