安全 AI 智能体架构（Secure AI Agent Architecture）¶

这本书写给那些需要的不是炫目的演示，而是能够承受生产现实（production reality）的智能体系统团队。

它的中心论点很简单：智能体需要平台，而不是魔法。一旦系统拥有高风险动作（risky actions）、记忆（memory）、审批（approvals）、发布（rollout）和长期运维尾部（long operational tail），单靠模型加几个工具（tools）就不够了。你需要明确的信任边界、策略层（policy layer）、受控执行（controlled execution）、可观测性（observability）、质量评估（quality assessment）与生命周期纪律（lifecycle discipline）。

构建智能体很枯燥，但结果令人震撼：团队得到的不是一次性炫技（one-off trick），而是一个可以约束（constrain）、观察（observe）、发布（ship）并无需猜测地持续改进（improve without guessing）的系统。

中文本地化预览

中文层目前是可阅读的本地化预览，而不是最终中文版。它适合社区预览、结构审查和术语对齐；正式出版前仍需要完整中文编辑、术语统一、图表/导出 QA 和母语审校。

从这里开始（Start Here）阅读第 1 章（chapter 1）打开全书计划（book plan）

这本书适合谁（who this book is for）¶

想构建智能体功能（agent features）、又不想把系统做成提示和例外堆的产品工程师。
需要共享运行时（runtime）、策略层（policy layer）、审批（approvals）、可观测性（observability）和受控发布（rollout）的平台团队。
关心信任边界（trust boundaries）、高风险执行路径（risky execution paths）和滥用表面（abuse surfaces）的安全工程师。
需要可复用工程纪律、而不是智能体剧场的技术负责人和架构师。

它应该改变读者什么思维（reader mindset shift）¶

读完这本书，读者应该停止把智能体想成“LLM 加一点编排（orchestration）”，而开始把它想成一个受治理的生产系统（governed production system）：

有明确的信任边界（trust boundaries）与动作边界（action boundaries）；
策略约束的执行（policy-constrained execution）；
高风险路径（risky paths）有审批（approvals）；
具备运行级可观测性（run-level observability）与证据（evidence）；
拥有发布纪律（rollout discipline）、负责人机制（ownership）与生命周期治理（lifecycle governance）。

这本书怎么读（how to read the book）¶

如果你只想要短入口（short entry），就从第 1 章开始。如果你需要按任务和角色路线（task and role route）选择，就打开从这里开始（Start Here）。如果你更关心结构与章节状态（structure and section status），就看全书计划（book plan）。如果你需要可复用工件（reusable artifacts）、模式（schemas）和契约（contracts），就进入参考层（reference layer）。

穿过全书（through the book）的最短路径（shortest path）大致是：

规范案例地图（Canonical case map）

阅读这条路线时，要同时保留三个规范案例（canonical cases）。支持分流（Support triage） 检查写入能力（write capabilities）、审批（approvals）和重复工单恢复（duplicate-ticket recovery）。内部知识助手（Internal knowledge assistant） 检查检索（retrieval）、记忆（memory）、新鲜度（freshness）和知识来源（knowledge provenance）。事件协调（Incident coordination） 检查追踪（traces）、升级（escalation）、通知副作用（notification side effects）、响应归属（response ownership）和事件后学习（post-incident learning）。

安全智能体模式主线（Safe-agent schema spine）

如果需要一条简短的安全智能体架构（safe-agent architecture）路线，可以从追踪模式（trace schema）、评测模式（eval schema）和记忆/检索模式（memory/retrieval schema）开始。这条主线（spine）连接 MCP 威胁模型（MCP threat model）、A2A 移交信任契约（A2A handoff trust contract）、验证器裁决记录（verifier verdict record）、治理动作记录（governance action record）、记忆投毒审查字段（memory poisoning review fields）和统一智能体威胁证据（unified agent threat evidence）。

这里已经有什么（what already exists）¶

已发布的俄文核心原稿（core manuscript），覆盖从架构基础到生命周期治理（lifecycle governance）的八个部分。
可用于阅读、但仍在进行编辑清理（editorial cleanup）的 en 与 zh 翻译层。
可运行的参考包 agent_runtime_ref。
覆盖追踪（traces）、评测（evals）、策略包（policy bundles）、审批（approvals）、记忆与生命周期工件（lifecycle artifacts）的参考页面。
实战案例、检查清单、策略模板与术语表。
正在推进的书稿与公开站点表面编辑打磨（editorial pass）。

这本书不打算成为什么（what the book is not）¶

它不是某个框架（framework）的手册，不是提示技巧合集（prompt tricks），也不是 AI 市场巡礼（AI market overview）。本书站在具体 SDK 和平台文档（platform docs）之上，去回答更棘手的问题：智能体到底该被允许做什么，写入路径（write path）应该怎样受限，应该观察什么，变更应该怎样发布，系统上线后到底谁负责。

接下来去哪里（where to go next）¶

从这里开始（Start Here）进入第一部分（Part I）打开参考包（reference package）