跳转至

为什么需要这本书

关于 AI 智能体的材料已经很多了。真正更少的是那些把智能体系统当成必须在生产环境里被设计、约束、发布、调查和维护的系统来讨论的材料。

这本书就是为了补上这个缺口。

它不是什么

它不是:

  • 某个框架的手册;
  • 某个供应商产品的指南;
  • 提示集合;
  • 基准测试和 AI 新闻巡礼;
  • 没有架构模型的安全检查清单。

它想做什么

这本书把智能体系统看成受治理的生产系统,它们应该具备:

  • 信任边界;
  • 受策略约束的执行;
  • 面向高风险动作的审批;
  • 记忆与上下文纪律;
  • 追踪、SLO 与评测;
  • 发布控制、负责人边界与生命周期治理。

它的主要目标不是帮助人们做出“最自主的智能体”,而是帮助他们做出一个在运行中值得信任的系统。

和框架文档相比

框架文档在你已经知道自己想构建什么系统时非常有用。它们通常很擅长解释编排模式、状态图、SDK 用法和集成细节。

但它们很少回答这类问题:

  • 智能体到底该被允许做什么;
  • 哪些动作必须经过审批;
  • 记忆应该怎样被约束;
  • 怎样在不失去控制的前提下发布变更;
  • 事故之后应该怎样做评审。

这本书试图站在框架之上,而不是和框架争论。

和供应商文档相比

供应商文档往往给出通往演示的最短路径。这当然有用,但它天然受限于单一供应商的表面。

这本书试图让架构站在产品表面之上,并把更稳定的工程纪律和变化更快的平台工具分开。

和安全检查清单方法相比

检查清单方法是必要的,但它本身并不会自动变成一套可工作的架构。它会告诉你该看哪里,却不会告诉你怎样把运行时、审批、遥测、负责人边界和生命周期连接成一个受治理的轮廓。

这正是这本书试图完成的事情。

希望达到什么结果

读完这本书后,读者应该:

  • 看清信任边界与动作边界真正在哪里;
  • 理解如何捕获运行行为,而不是只从症状去猜;
  • 知道怎样定义健康预算与风险预算;
  • 知道怎样产出关于质量与回归风险的可评审判断;
  • 能把发布、响应、谱系与问责区分成不同的运行职能。

如果这些问题比另一篇智能体剧场更接近你的现实,那么这本书就是为你写的。