跳转至

安全 AI 智能体架构

这本书写给那些需要的不是炫目的演示,而是能够承受生产现实的智能体系统团队。

它的中心论点很简单:智能体需要平台,而不是魔法。一旦系统拥有高风险动作、记忆、审批、发布和长期运维尾部,单靠模型加几个工具就不够了。你需要明确的信任边界、策略层、受控执行、可观测性、质量判断与生命周期纪律。

构建智能体很枯燥,但结果令人震撼:团队得到的不是一次性的炫技,而是一个可以约束、观察、发布并持续改进的系统,不必靠猜。

本书封面

这本书适合谁

  • 想构建智能体功能、又不想把系统做成提示和例外堆的产品工程师。
  • 需要共享运行时、策略层、审批、可观测性和受控发布的平台团队。
  • 关心信任边界、高风险执行路径和滥用表面的安全工程师。
  • 需要可复用工程纪律、而不是智能体剧场的技术负责人和架构师。

它应该改变读者什么思维

读完这本书,读者应该停止把智能体想成“LLM 加一点编排”,而开始把它想成一个受治理的生产系统:

  • 有明确的信任与动作边界;
  • 执行受策略约束;
  • 高风险路径有审批;
  • 具备运行级可观测性与证据;
  • 拥有发布纪律、负责人机制与生命周期治理。

这本书怎么读

如果你只想要最短入口,就从 第 1 章 开始。如果你需要按角色或任务选择路线,就打开从这里开始。如果你更关心结构与状态,就看全书计划。如果你需要可复用工件、Schema 和契约,就进入参考层

穿过全书的最短实用途径大致是:

  1. 第 1 章:为什么智能体需要的是平台,而不是魔法
  2. 第 3 章:安全边界与信任边界
  3. 第 8 章:执行模型与工具目录
  4. 第五部分:可靠性与可观测性
  5. 第 18 章:生产上线检查清单

这里已经有什么

  • 已发布的俄文核心原稿,覆盖从架构基础到生命周期治理的八个部分。
  • 可用于阅读、但仍在进行编辑清理的 enzh 翻译层。
  • 可运行的参考包 agent_runtime_ref
  • 覆盖追踪、评测、策略包、审批、记忆与生命周期工件的参考页面。
  • 实战案例、检查清单、策略模板与术语表。
  • 正在推进的书稿与公开站点表面编辑打磨。

这本书不打算成为什么

它不是某个框架的手册,不是提示技巧合集,也不是 AI 市场巡礼。本书站在具体 SDK 和平台文档之上,去回答更棘手的问题:智能体到底该被允许做什么,写入路径应该怎样受限,应该观察什么,变更应该怎样发布,系统上线后到底谁负责。

接下来去哪里