最新进展¶
这一页是面向读者的简短更新日志,用来展示这本书和参考运行时最近有哪些重要增强。它不是 Git 历史记录(Git history)的替代品,而是让读者快速看到项目是否持续演进。
更新于 2026 年 6 月 4 日。
规范案例更新
2026 年 5 月 15 日的主要更新,是贯穿全书的三个规范案例(canonical cases)路线图。支持分流(Support triage)、内部知识助手(Internal knowledge assistant) 和 事件协调(Incident coordination) 现在已经出现在章节(book chapters)、公共入口(public entry points)、参考页(reference pages)和附录工件(appendix artifacts)中,并且覆盖率守卫(coverage guards)会防止章节与附录页面(appendix pages)丢失这些路线。
安全智能体架构(safe-agent)模式更新
2026 年 5 月 17 日到 2026 年 5 月 19 日的更新,把安全智能体架构(safe-agent architecture)的正文(prose)、附录(appendices)和防护检查(guards)连接了起来:MCP 威胁模型(MCP threat model)与 mcp_server 合约(contract)、A2A 交接信任合约(A2A handoff trust contract)与信任委派工件(trust-delegation artifact)、纵深防御控制图(defense-in-depth control map)、验证者裁决记录(verifier verdict record)、治理动作记录(governance action record)、NIST AI RMF 遥测映射(NIST AI RMF telemetry mapping)、记忆投毒审查字段(memory poisoning review fields)和统一智能体威胁证据(unified agent threat evidence)现在都反映在 跟踪模式(trace schema)、评测模式(eval schema) 与 记忆/检索模式(memory/retrieval schema) 中。
书籍¶
2026 年 5 月 14 日编辑质量检查(QA)¶
第一轮评审修复质量检查(QA)切片已经关闭:第 1 章的判断框架从表格改成了更适合 HTML/PDF 与纯文本抽取的文字块;变化较快的章节、参考来源页和最新进展页也更新了编辑审查日期。 更广泛的印刷与发布质量检查仍在进行中。
为什么这很重要:外部阅读表面现在更少依赖表格渲染细节,也更清楚地说明了快速变化的智能体安全(agent-security)章节何时被复核。
第八部分:智能体系统生命周期¶
现在全书已经包含从软件开发生命周期到智能体开发生命周期(SDLC→ADLC)的迁移、变更管理、保障回路、供应链、退役、错位、行为评测、AI 原生(AI-native)可观测性与清单控制的完整内容。
为什么这很重要:现在这本书覆盖的不只是架构与上线,还覆盖了智能体系统发布后的生命周期管理。
第一到第五部分的生产轮廓更完整了¶
书里现在补上了更多连接架构、检索、执行和评测纪律的桥:
- 第一部分更明确地区分了运行时架构、训练层和产品表面;
- 第二部分加入了更清晰的提示注入(
prompt injection)、越狱(jailbreaking)与动作幻觉(action hallucination)分类法; - 第三部分加强了检索轮廓:语义鸿沟(
semantic gap)、HyDE、RAG 优先(RAG first),以及持续预训练(continued pretraining)与SFT的区别; - 第四部分补上了大型工具目录、语义工具过滤(
semantic tool filtering)和 MCP 主机/客户端/服务器(MCP host/client/server)角色的实践指导; - 第五部分补强了延迟预算(
latency budget)的产品视角,以及更实用的以 LLM 作为评审器(LLM-as-a-judge)表述。
为什么这很重要:这本书现在覆盖的不只是基础平台层,也更贴近日常生产团队在设计评审、评测回路和发布之间反复遇到的问题。
参考层¶
可复用的模式与契约¶
站点现在已经包含以下参考页:
- 追踪与事件目录(traces and event catalog);
- 评测数据集与评分契约(eval datasets and grading contracts);
- 策略包与审批(policy bundles and approvals);
- 变更评审与发布门禁(change review and rollout gates);
- 生命周期工件(lifecycle artifacts);
- 记忆检索契约(memory retrieval contracts)。
为什么这很重要:读者现在可以从解释性章节直接跳到可审阅的模式与契约工件。
运行时¶
可运行的参考运行时¶
仓库中的 agent_runtime_ref 现在支持:
- 审批与委派授权上下文(delegated authorization context);
- 控制机制与生命周期内的运行时控制检查(runtime-control inspection);
- 生命周期工件(lifecycle artifacts);
- 会话导出与回放摘要(replay summaries);
- 评测数据集导出(eval dataset export);
- 带数据遮蔽(redaction)、遮蔽后摘要(redacted summaries)、回放保留(replay preservation)与模式版本控制(schema versioning)的追踪导出(trace export)。
为什么这很重要:这本书现在不只依赖叙述性章节,也有可运行的参考实现作为支撑。
实践附录¶
检查清单与实践工件¶
站点已经包含:
- 术语表(glossary);
- 速查清单(cheat sheets);
- 案例研究(case studies);
- 策略模板(policy templates);
- 研究前沿页面(research frontier page);
- 社区路线图(community roadmap)。
为什么这很重要:读者现在可以不按线性顺序通读全书,也能直接进入检查清单、案例研究、术语表与实践工件。
导航¶
读者入口页更清晰¶
已更新的入口页:
这些页面现在更容易把读者带到下面这些主题:
- 语义工具过滤(
semantic tool filtering); HyDE与 RAG 与训练之间的取舍(RAG vs training);- 延迟预算(
latency budget)与路由管线; - 以 LLM 作为评审器(
LLM-as-a-judge)与评审器校准; - 提示注入(
prompt injection)、越狱(jailbreaking)与动作幻觉(action hallucination)的区别。
为什么这很重要:这些新主题现在不只藏在单个章节里,也已经出现在读者真正会先打开的入口页上。
发布就绪度¶
发布前站点表面更干净¶
面向印刷与发布的质量检查正在进行中,但还没有完全关闭。
已完成的站点工作:
- 草稿与规划页面已从发布站点和站点地图(sitemap)中排除;
- 添加了 OpenGraph/Twitter 元数据和社交预览图(social preview image);
- 检查了搜索索引(search index)、站点地图(sitemap)、robots 文件(robots file)、本地资源(local assets)、锚点(anchors)、图片替代文本(alt text)和外部链接(external links);
- 基础导航和规范备用重定向(canonical fallback redirects)已覆盖人们最容易手动复制的主要入口;
- 公共链接可用性记录(public-link availability record)已在 2026 年 5 月 20 日刷新,公开材料包中的九个链接全部返回 HTTP 200;
- 公开材料包的阻塞项登记表(blocker register)、豁免与决策日志(waiver/decision log)、行长限制(line-length guard)与材料包标签(packet labels)现在都适合打印和导出;
- 第 VIII 部分角色图(role map)现在适合打印和导出;
- 第 1 章现在有读者导向块、稳定的判断框架,以及不依赖网站实时导航也能成立的适合印刷章节结尾;
- 第 13 章现在有技术读者导向,并为评测数据集 -> 验证器契约 -> 发布门禁这条链路补上了适合印刷的章节结尾;
- 三种语言的 README 都加入了面向
main与docs-prod的快速同步发布检查清单(quick sync publish checklist)。
在称为可印刷版本之前,仍然需要完成 EN/ZH 清理(deep EN/ZH cleanup)、独立 HTML/PDF 渲染/导出质量检查(independent rendering/export QA)、独立样章审校(independent sample copy-edit)、样章导出质量检查(sample export QA),以及面向具体提交格式的纸质稿件与在线配套材料包装。
为什么这很重要:发布出来的站点应该持续接近一个打磨过的读者产品,而不是一堆 Markdown 文件的原始构建结果。
这对读者意味着什么¶
- 你可以把这本书当作手册使用。
- 你可以把参考页当作工程起点复用。
- 你可以运行示例运行时,而不仅仅是阅读 Markdown 文档。
- 你可以把架构建立在 OpenAI、Anthropic、Google、Microsoft 与 NIST 的近年资料之上。