Skip to content

Agent Runtime 总览

一句话理解:Agent Runtime 是大模型与外部世界交互的执行容器,它把“用户目标”反复拆解成“思考 → 行动 → 观察”,并在循环中管理工具、记忆、状态、权限、可观测与恢复。

学习目标

阅读完本主题后,你应该能够:

  1. 解释为什么 Agent 需要独立的 Runtime,而不是直接调用 LLM API。
  2. 说清楚 Agent Runtime 与 workflow engine、LLM Gateway、MCP、Agent OS、Multi-Agent Framework 的边界。
  3. 画出典型 Agent Runtime 架构,并说明各模块职责。
  4. 描述一个任务从进入 Runtime 到完成的完整生命周期。
  5. 对比 OpenAI Agents SDK、LangGraph、CrewAI、Smolagents、PydanticAI 的设计取舍。
  6. 跑通并扩展本主题的 Mini Demo,理解 ReAct 循环与工具注册机制。
  7. 回答生产部署、沙箱、护栏、可观测、状态持久化相关的面试问题。

Agent Runtime 与其他主题的关系

主题解决的核心问题与 Agent Runtime 的关系
vLLM / SGLang单个模型如何跑得快Runtime 通过 LLM Client 调用这些推理引擎
LLM Gateway多供应商/多引擎统一接入Runtime 通常位于 Gateway 之后,使用其暴露的统一模型接口
Agent Runtime如何安全、可观测、可扩展地执行 Agent 任务承上启下,把模型能力转化为任务执行能力
MCP工具发现与调用协议Runtime 可通过 function calling 直接调用工具,也可按需接入 MCP 实现标准化能力发现
Memory长期记忆与上下文管理Runtime 负责在循环中读写 Memory,具体存储/检索/持久化由 Memory 主题负责
Planning任务分解与重规划Runtime 内嵌轻量 Planner,复杂规划由 Planning 主题负责
Tool Use工具定义、调用与执行Runtime 调用 Tool Use 层完成工具注册、解析、校验、执行与结果反馈
Multi-Agent多 Agent 协作本主题聚焦单 Agent Runtime,Multi-Agent 在其之上做协调与调度

本章结构

  1. 背景 — 从 prompt engineering 到 Agent 的演进与 Runtime 必要性。
  2. 核心思想 — ReAct、工具调用、记忆、规划、护栏、可观测、恢复。
  3. 架构设计 — 模块分层、控制面/数据面、部署形态。
  4. Runtime 工作流程 — 任务生命周期详解。
  5. 核心模块 — Task Parser、Planner、Executor、Tool Registry、Memory、State、LLM Client、Guardrails、Observer、Recovery。
  6. 源码分析 — OpenAI Agents SDK、LangGraph、Smolagents、PydanticAI。
  7. 工程实践 — 纯 Python 可运行的 Mini Demo。
  8. 企业生产实践 — 部署、持久化、沙箱、评测、与 LLM Gateway 集成。
  9. 最佳实践 — 模型选择、工具设计、可观测、沙箱、评测、避免过度编排。
  10. 面试题 — 初级/中级/高级面试题。
  11. 延伸阅读 — 官方文档、论文、工程文章。

一句话总结

Agent Runtime 不是又一个 LLM 调用库,而是把“模型会回答问题”变成“模型会执行任务”的工程底座;它让业务方定义目标,让 Runtime 负责思考、调用工具、管理状态并在失败时恢复。

Released under CC-BY-SA-4.0 License.