跳转至

从这里开始(Start Here)

如果你第一次来到这本书,先问自己一个问题:你需要的是一个惊艳的演示智能体(impressive demo agent),还是一个能承受生产现实(production reality)的系统?

这本书是写给第二种情况的。最适合把它读成一个完整论证(single argument):智能体系统怎样从提示堆出来的原型(prompt-heavy prototypes),长成带有信任边界(trust boundaries)、策略层(policy layer)、审批(approvals)、可观测性(observability)、评测(evals)和生命周期纪律(lifecycle discipline)的受治理系统(governed systems)。

构建智能体很枯燥,但结果令人震撼:围绕信任边界(trust boundaries)、追踪(traces)、审批(approvals)和发布(rollout)建立纪律,才能把演示变成可以安全改进的系统(safely improve)。

中文本地化预览

这份中文版本当前定位为本地化预览:内容可用于阅读和评审,但还不是最终中文版。请优先把它看作社区预览;正式出版前还需要统一术语、母语编辑和 print/PDF 导出检查。

这页只做一件事:帮你尽快选出阅读路线(reading route)。

如果你只读一章(read only one)

如果你想用最短入口(shortest entry point)进入本书的核心论点,请先读第 1 章:为什么智能体需要的是平台,而不是魔法

那一章把主张说得很直接:生产级智能体系统(production agent system)不能被建成“模型加几个工具(tools)”,它必须被设计成一个受治理的运行系统。

这是什么样的书(what kind of book)

这不是某个框架(framework)的指南,也不是 AI 功能目录(AI feature catalog)。这是一本实践型架构书,写给那些需要在真实环境里运行智能体的团队:那里有写入路径(write paths)、人工审批(human approvals)、访问边界(access boundaries)、遥测(telemetry)、评测(evals),以及明确的运维负责人机制(operational ownership)。

30 分钟路线(30-minute route)

如果时间很少,就先读这条路径(path):

  1. 第 1 章:为什么智能体需要的是平台,而不是魔法
  2. 第 3 章:安全边界与信任边界
  3. 第 8 章:执行模型与工具目录
  4. 第五部分:可靠性与可观测性
  5. 第 18 章:生产上线检查清单

走完这条路径后,你至少应该已经获得一个工作框架(working frame),能回答:

  • 智能体的真实信任边界(trust boundaries)在哪里;
  • 安全工具执行(safe tool execution)应该长什么样;
  • 为什么没有追踪(traces)、SLO 和评测(evals)时,单靠“聪明模型”(smart model)不够;
  • 第一次认真发布(first serious rollout)之前到底需要什么。

如果你想跟随贯穿案例(throughline case)

可以一路跟着支持分诊(support-triage)故事走:它从检索(retrieval)和安全工具执行(safe tool execution)开始,经过重复工单恢复(duplicate-ticket recovery)、追踪(traces)、SLO 和评测门(eval gates),然后继续进入发布(rollout)、ADLC、保障(assurance)、来源谱系(provenance)、退役(retirement)、失配控制(misalignment controls)、遥测(telemetry)和注册表(registry)。如果你想看到的是一条从事故到平台契约的路径(incident-to-platform-contract path),而不是一组抽象层,这是最好的路线。

规范案例路线(Canonical case routes)

阅读路线旁边要同时保留三个规范案例(canonical cases)作为覆盖检查。支持分流(Support triage) 承载写入能力(write capabilities)、审批(approvals)和重复工单恢复(duplicate-ticket recovery)。内部知识助手(Internal knowledge assistant) 突出检索(retrieval)、记忆(memory)、新鲜度(freshness)和知识来源(knowledge provenance)。事件协调(Incident coordination) 检查追踪(traces)、升级(escalation)、通知副作用(notification side effects)、响应归属(response ownership)和事件后学习(post-incident learning)。

按角色阅读(role-based routes)

如果你是产品工程师(product engineer)

  1. 第一部分:基础
  2. 第二部分:安全边界
  3. 第四部分:工具与执行
  4. 第七部分:参考实现

这条路线适合从智能体想法(agent idea)快速走到可运行架构(working architecture)。

如果你是平台工程师(platform engineer)

  1. 第 2 章:安全智能体的参考架构
  2. 第三部分:记忆与知识
  3. 第四部分:工具与执行
  4. 第五部分:可靠性与可观测性
  5. 第七部分:参考实现

这条路线适合那些在搭平台骨架(platform skeleton)、而不只是给一个模型包壳(model wrapper)的团队。

如果你是安全工程师(security engineer)

  1. 第二部分:安全边界
  2. 第 5 章:为什么智能体需要记忆,以及为什么记忆很危险
  3. 第 9 章:沙箱执行与 MCP 作为集成契约
  4. 第 10 章:幂等性、重试、速率限制与回滚边界
  5. 第 18 章:生产上线检查清单

这条路线适合那些不仅要看模型风险(model risk),还要看真实执行风险(real execution risk)的人。

如果你是负责人或架构师(leader or architect)

  1. 第 1 章:为什么智能体需要的是平台,而不是魔法
  2. 第五部分:可靠性与可观测性
  3. 第六部分:组织模型
  4. 第 18 章:生产上线检查清单

这条路线适合那些不想只交付演示(demo),而是要把项目放进真实运营纪律(operating discipline)的人。

如果你想先看代码和工件(code and artifacts)

如果可执行支撑(executable supports)比线性阅读(linear reading)更重要,就先看这里:

如果你现在就需要运行时骨架(runtime skeleton)、策略契约(policy contracts)、记忆路径(memory path)、遥测(telemetry)和发布工件(rollout artifacts),这条路线会更合适。

如果你要快速解决一个具体问题(specific task)

安全工具执行(safe tool execution)

记忆与检索(memory and retrieval)

可观测性、评测与发布(observability, evals, and rollout)

安全智能体模式主线(Safe-agent schema spine)

如果需要快速检查 MCP 威胁模型(MCP threat model)、A2A 移交信任契约(A2A handoff trust contract)、验证器裁决记录(verifier verdict record)、治理动作记录(governance action record)、记忆投毒审查字段(memory poisoning review fields)和统一智能体威胁证据(unified agent threat evidence),可以走这条路线。

读书时旁边还可以打开什么(companion references)

如果这本书对你来说,比另一页关于“自主性”的 AI 落地页(AI landing page)更接近真实工程(real engineering),那你来对地方了。