跳转至

最新进展

这一页是面向读者的简短更新日志,用来展示这本书和参考运行时最近有哪些重要增强。它不是 Git 历史记录(Git history)的替代品,而是让读者快速看到项目是否持续演进。

更新于 2026 年 6 月 4 日。

规范案例更新

2026 年 5 月 15 日的主要更新,是贯穿全书的三个规范案例(canonical cases)路线图。支持分流(Support triage)内部知识助手(Internal knowledge assistant)事件协调(Incident coordination) 现在已经出现在章节(book chapters)、公共入口(public entry points)、参考页(reference pages)和附录工件(appendix artifacts)中,并且覆盖率守卫(coverage guards)会防止章节与附录页面(appendix pages)丢失这些路线。

安全智能体架构(safe-agent)模式更新

2026 年 5 月 17 日到 2026 年 5 月 19 日的更新,把安全智能体架构(safe-agent architecture)的正文(prose)、附录(appendices)和防护检查(guards)连接了起来:MCP 威胁模型(MCP threat model)与 mcp_server 合约(contract)、A2A 交接信任合约(A2A handoff trust contract)与信任委派工件(trust-delegation artifact)、纵深防御控制图(defense-in-depth control map)、验证者裁决记录(verifier verdict record)、治理动作记录(governance action record)、NIST AI RMF 遥测映射(NIST AI RMF telemetry mapping)、记忆投毒审查字段(memory poisoning review fields)和统一智能体威胁证据(unified agent threat evidence)现在都反映在 跟踪模式(trace schema)评测模式(eval schema)记忆/检索模式(memory/retrieval schema) 中。

书籍

2026 年 5 月 14 日编辑质量检查(QA)

第一轮评审修复质量检查(QA)切片已经关闭:第 1 章的判断框架从表格改成了更适合 HTML/PDF 与纯文本抽取的文字块;变化较快的章节、参考来源页和最新进展页也更新了编辑审查日期。 更广泛的印刷与发布质量检查仍在进行中。

为什么这很重要:外部阅读表面现在更少依赖表格渲染细节,也更清楚地说明了快速变化的智能体安全(agent-security)章节何时被复核。

第八部分:智能体系统生命周期

现在全书已经包含从软件开发生命周期到智能体开发生命周期(SDLC→ADLC)的迁移、变更管理、保障回路、供应链、退役、错位、行为评测、AI 原生(AI-native)可观测性与清单控制的完整内容。

为什么这很重要:现在这本书覆盖的不只是架构与上线,还覆盖了智能体系统发布后的生命周期管理。

第一到第五部分的生产轮廓更完整了

书里现在补上了更多连接架构、检索、执行和评测纪律的桥:

  • 第一部分更明确地区分了运行时架构、训练层和产品表面;
  • 第二部分加入了更清晰的提示注入(prompt injection)、越狱(jailbreaking)与动作幻觉(action hallucination)分类法;
  • 第三部分加强了检索轮廓:语义鸿沟(semantic gap)、HyDE、RAG 优先(RAG first),以及持续预训练(continued pretraining)与 SFT 的区别;
  • 第四部分补上了大型工具目录、语义工具过滤(semantic tool filtering)和 MCP 主机/客户端/服务器(MCP host/client/server)角色的实践指导;
  • 第五部分补强了延迟预算(latency budget)的产品视角,以及更实用的以 LLM 作为评审器(LLM-as-a-judge)表述。

为什么这很重要:这本书现在覆盖的不只是基础平台层,也更贴近日常生产团队在设计评审、评测回路和发布之间反复遇到的问题。

参考层

可复用的模式与契约

站点现在已经包含以下参考页:

  • 追踪与事件目录(traces and event catalog);
  • 评测数据集与评分契约(eval datasets and grading contracts);
  • 策略包与审批(policy bundles and approvals);
  • 变更评审与发布门禁(change review and rollout gates);
  • 生命周期工件(lifecycle artifacts);
  • 记忆检索契约(memory retrieval contracts)。

为什么这很重要:读者现在可以从解释性章节直接跳到可审阅的模式与契约工件。

运行时

可运行的参考运行时

仓库中的 agent_runtime_ref 现在支持:

  • 审批与委派授权上下文(delegated authorization context);
  • 控制机制与生命周期内的运行时控制检查(runtime-control inspection);
  • 生命周期工件(lifecycle artifacts);
  • 会话导出与回放摘要(replay summaries);
  • 评测数据集导出(eval dataset export);
  • 带数据遮蔽(redaction)、遮蔽后摘要(redacted summaries)、回放保留(replay preservation)与模式版本控制(schema versioning)的追踪导出(trace export)。

为什么这很重要:这本书现在不只依赖叙述性章节,也有可运行的参考实现作为支撑。

实践附录

检查清单与实践工件

站点已经包含:

  • 术语表(glossary);
  • 速查清单(cheat sheets);
  • 案例研究(case studies);
  • 策略模板(policy templates);
  • 研究前沿页面(research frontier page);
  • 社区路线图(community roadmap)。

为什么这很重要:读者现在可以不按线性顺序通读全书,也能直接进入检查清单、案例研究、术语表与实践工件。

导航

读者入口页更清晰

已更新的入口页:

这些页面现在更容易把读者带到下面这些主题:

  • 语义工具过滤(semantic tool filtering);
  • HyDE 与 RAG 与训练之间的取舍(RAG vs training);
  • 延迟预算(latency budget)与路由管线;
  • 以 LLM 作为评审器(LLM-as-a-judge)与评审器校准;
  • 提示注入(prompt injection)、越狱(jailbreaking)与动作幻觉(action hallucination)的区别。

为什么这很重要:这些新主题现在不只藏在单个章节里,也已经出现在读者真正会先打开的入口页上。

发布就绪度

发布前站点表面更干净

面向印刷与发布的质量检查正在进行中,但还没有完全关闭。

已完成的站点工作:

  • 草稿与规划页面已从发布站点和站点地图(sitemap)中排除;
  • 添加了 OpenGraph/Twitter 元数据和社交预览图(social preview image);
  • 检查了搜索索引(search index)、站点地图(sitemap)、robots 文件(robots file)、本地资源(local assets)、锚点(anchors)、图片替代文本(alt text)和外部链接(external links);
  • 基础导航和规范备用重定向(canonical fallback redirects)已覆盖人们最容易手动复制的主要入口;
  • 公共链接可用性记录(public-link availability record)已在 2026 年 5 月 20 日刷新,公开材料包中的九个链接全部返回 HTTP 200;
  • 公开材料包的阻塞项登记表(blocker register)、豁免与决策日志(waiver/decision log)、行长限制(line-length guard)与材料包标签(packet labels)现在都适合打印和导出;
  • 第 VIII 部分角色图(role map)现在适合打印和导出;
  • 第 1 章现在有读者导向块、稳定的判断框架,以及不依赖网站实时导航也能成立的适合印刷章节结尾;
  • 第 13 章现在有技术读者导向,并为评测数据集 -> 验证器契约 -> 发布门禁这条链路补上了适合印刷的章节结尾;
  • 三种语言的 README 都加入了面向 maindocs-prod 的快速同步发布检查清单(quick sync publish checklist)。

在称为可印刷版本之前,仍然需要完成 EN/ZH 清理(deep EN/ZH cleanup)、独立 HTML/PDF 渲染/导出质量检查(independent rendering/export QA)、独立样章审校(independent sample copy-edit)、样章导出质量检查(sample export QA),以及面向具体提交格式的纸质稿件与在线配套材料包装。

为什么这很重要:发布出来的站点应该持续接近一个打磨过的读者产品,而不是一堆 Markdown 文件的原始构建结果。

这对读者意味着什么

  • 你可以把这本书当作手册使用。
  • 你可以把参考页当作工程起点复用。
  • 你可以运行示例运行时,而不仅仅是阅读 Markdown 文档。
  • 你可以把架构建立在 OpenAI、Anthropic、Google、Microsoft 与 NIST 的近年资料之上。

继续阅读