安全 AI 智能体架构¶
这本书写给那些需要的不是炫目的演示,而是能够承受生产现实的智能体系统团队。
它的中心论点很简单:智能体需要平台,而不是魔法。一旦系统拥有高风险动作、记忆、审批、发布和长期运维尾部,单靠模型加几个工具就不够了。你需要明确的信任边界、策略层、受控执行、可观测性、质量判断与生命周期纪律。
构建智能体很枯燥,但结果令人震撼:团队得到的不是一次性的炫技,而是一个可以约束、观察、发布并持续改进的系统,不必靠猜。
这本书适合谁¶
- 想构建智能体功能、又不想把系统做成提示和例外堆的产品工程师。
- 需要共享运行时、策略层、审批、可观测性和受控发布的平台团队。
- 关心信任边界、高风险执行路径和滥用表面的安全工程师。
- 需要可复用工程纪律、而不是智能体剧场的技术负责人和架构师。
它应该改变读者什么思维¶
读完这本书,读者应该停止把智能体想成“LLM 加一点编排”,而开始把它想成一个受治理的生产系统:
- 有明确的信任与动作边界;
- 执行受策略约束;
- 高风险路径有审批;
- 具备运行级可观测性与证据;
- 拥有发布纪律、负责人机制与生命周期治理。
这本书怎么读¶
如果你只想要最短入口,就从 第 1 章 开始。如果你需要按角色或任务选择路线,就打开从这里开始。如果你更关心结构与状态,就看全书计划。如果你需要可复用工件、Schema 和契约,就进入参考层。
穿过全书的最短实用途径大致是:
这里已经有什么¶
- 已发布的俄文核心原稿,覆盖从架构基础到生命周期治理的八个部分。
- 可用于阅读、但仍在进行编辑清理的
en与zh翻译层。 - 可运行的参考包
agent_runtime_ref。 - 覆盖追踪、评测、策略包、审批、记忆与生命周期工件的参考页面。
- 实战案例、检查清单、策略模板与术语表。
- 正在推进的书稿与公开站点表面编辑打磨。
这本书不打算成为什么¶
它不是某个框架的手册,不是提示技巧合集,也不是 AI 市场巡礼。本书站在具体 SDK 和平台文档之上,去回答更棘手的问题:智能体到底该被允许做什么,写入路径应该怎样受限,应该观察什么,变更应该怎样发布,系统上线后到底谁负责。
