Skip to content

延伸阅读

本章汇总 AI 安全相关的权威论文、法规、官方文档、开源项目与工程文章,并给出与本手册其他主题的交叉引用。

权威框架与标准

身份与访问

密钥与供应链

网络与零信任

数据隐私与 Guardrails

红队与评估

论文

  • ReAct: Synergizing Reasoning and Acting in Language Models — 虽然主题是 Agent,但其中工具调用的安全边界值得参考。
  • Llama Guard: Llama Guard: LLM-based Input-Output Safeguard for Human-AI Conversations — Meta 的内容安全分类模型。
  • Tree of Thoughts / Chain-of-Thought 系列 — 规划与推理中的提示注入风险。
  • Membership Inference Attacks on Machine Learning Models — 成员推断攻击基础。
  • Model Inversion Attacks — 模型反演攻击。

工程博客与案例

  • Google Cloud Blog: BeyondCorp 系列
  • Netflix Tech Blog: Zero Trust in the Cloud
  • OpenAI / Anthropic 安全博客:红队、对齐、模型评估
  • Cloudflare Blog: AI 安全与零信任实践

本手册交叉引用

学习路径建议

  1. 概念入门:先读 OWASP LLM Top 10 与 NIST AI RMF。
  2. 架构设计:结合本章 03-architecture 与开源项目文档,画出自己的分层架构图。
  3. 动手实践:跑通 Mini Demo,再尝试集成 OPA 或 Presidio。
  4. 生产视角:阅读 Vault、Istio、SPIRE 官方文档,设计零信任落地路径。
  5. 合规治理:研究 GDPR、AI Act、SOC2 与模型卡片,建立审计与影响评估流程。

小结

AI 安全是一个快速发展的交叉领域,法规、攻击技术与防御工具都在快速演进。持续关注 OWASP、NIST、MITRE ATLAS、主流云厂商与 AI 实验室的安全发布,是保持竞争力的必要投入。

Released under CC-BY-SA-4.0 License.