Skip to content

10. 面试题

初级

Q1:Agent Runtime 与 LLM Gateway 有什么区别?

参考答案

  • LLM Gateway 解决“调哪家模型”的问题:路由、限流、重试、多供应商统一接入。
  • Agent Runtime 解决“怎么让模型持续执行任务”的问题:ReAct 循环、工具调用、状态管理、护栏、可观测。
  • 典型关系:Agent Runtime → LLM Gateway → LLM

Q2:什么是 ReAct?

参考答案

ReAct = Reasoning + Acting。模型在每一步先进行推理(Thought),然后决定执行什么动作(Action),Runtime 执行动作后把观察结果(Observation)回传给模型,循环直到任务完成。

Q3:Agent Runtime 为什么需要状态管理?

参考答案

因为 Agent 任务通常是多轮的,需要记录当前处于 planning/acting/observing/done/error 哪个状态,还要支持 checkpoint 与断点续跑。

中级

Q4:工具调用时如何防止模型参数幻觉?

参考答案

  • 给工具提供清晰的 JSON Schema 和描述。
  • Runtime 对参数做类型校验和范围检查。
  • 参数错误时让模型重试,但限制重试次数。
  • 对枚举值、路径等做白名单校验。

Q5:Agent 无限循环怎么解决?

参考答案

  • 设置 max_steps 上限。
  • 检测重复工具调用(相同 name + 相同参数)。
  • 检测状态是否长期没有进展。
  • 对模型提示“如果无法推进,请承认失败”。

Q6:长时任务如何保证可恢复?

参考答案

  • 每轮循环后 checkpoint:保存 state、messages、plan、trace_id。
  • 使用外部持久化(Redis/Postgres)存储 checkpoint。
  • 失败或进程重启后从最近 checkpoint 恢复。
  • HITL 请求本身也是状态机的一部分。

Q7:Agent Runtime 中 Guardrails 应该放在哪些位置?

参考答案

  • 输入层:过滤敏感/越权请求。
  • 工具前置:检查参数、权限、调用次数。
  • 工具后置:检查结果是否合规。
  • 输出层:校验最终答案。
  • 资源层:限制迭代次数、超时、token 预算。

高级

Q8:设计一个生产级 Agent Runtime,你会怎么设计?

参考答案

  • 数据面无状态:Runtime worker 可水平扩展,状态外置。
  • 状态持久化:checkpoint 到 Redis/Postgres,支持断点续跑。
  • 任务队列:接收任务后入队,worker 异步消费。
  • LLM Client:通过 LLM Gateway 调用多模型,支持 fallback。
  • Tool Registry:声明式注册,自动生成 schema,带权限标签。
  • Executor:危险工具进沙箱,超时隔离。
  • Guardrails:多层策略,HITL 高风险操作。
  • Observer:OpenTelemetry trace + Prometheus metrics + 结构化日志。
  • Eval:固定评测集 + 影子运行 + A/B 测试。

Q9:LangGraph 与 OpenAI Agents SDK 的主要区别是什么?

参考答案

  • OpenAI Agents SDK:SDK 式,Agent/Runner/Tool 抽象,快速落地,绑定 OpenAI 生态。
  • LangGraph:图编排式,StateGraph/Node/Edge,显式状态管理,强持久化与可观测,适合复杂生产工作流。
  • 选型:简单 OpenAI-only 任务用 SDK;复杂有状态任务用 LangGraph。

Q10:Agent Runtime 中如何处理工具执行失败?

参考答案

  • 参数错误:把错误信息作为 observation 回传,让模型修正后重试。
  • 超时/异常:返回统一的 error observation,Runtime 决定是否 fallback。
  • 连续失败:触发熔断或进入 error 状态。
  • 不可恢复:记录失败 trace,必要时请求 HITL。

Q11:为什么 Agent 的可观测比传统服务更重要?

参考答案

因为 Agent 的执行路径是模型动态决定的,无法像传统服务那样通过代码路径预测。必须记录完整的 thought-action-observation 链、guardrail 事件、token 成本,才能调试、审计和优化。

本章小结

面试中关于 Agent Runtime 的问题通常集中在:ReAct 循环工具调用与参数校验状态与持久化Guardrails 与 HITL可观测框架对比。掌握本章问题,基本可以覆盖中级到高级面试场景。

参考来源

Released under CC-BY-SA-4.0 License.