Skip to content

AI SRE 篇

本章节覆盖 AI 系统的可观测性、可靠性工程与 AIOps。

计划中主题

  • OpenTelemetry
  • Observability
  • AIOps
  • SLO
  • Error Budget
  • Incident Response

一句话理解

AI 系统不仅要跑得快,还要跑得稳;AI SRE 负责在不确定性中建立可度量的可靠性。

本章节正在建设中,敬请期待。

Released under CC-BY-SA-4.0 License.