第二部分:安全边界¶
如果说第一部分是在搭建基础架构图景,那么这一部分里,同一个支持智能体第一次真正走到高风险地带:接触数据、调用工具、执行带副作用的动作。
这一部分的快速路线
如果你想快速读完关键部分,可以这样走:
这三步已经足够组成一个可工作的生产轮廓,而不只是安全术语表。
这一部分的意义,是避免你产生一个危险错觉,好像智能体的安全可以“以后再补”。对这条贯穿全书的支持场景来说,正是在这里你会清楚看到:如果边界没有先定义好,智能体就会从“帮忙”滑向“制造新风险”。
- 如果信任边界没有提前定义好,智能体很快就会把多余上下文一起拖进来;
- 如果工具没有隔离,一个糟糕的调用就会变成真实事故;
- 如果策略、审批和审计没有嵌进运行时,团队会在最不合适的时候失去控制。
这一部分解决什么问题¶
- 智能体系统关键威胁的地图;
- 一套实用的安全边界模型;
- 一组控制点:入口、提示组装、模型网关、检索、工具、出口;
- 策略即代码和门禁执行示例;
- 一个能和安全团队认真讨论的基础,而不是只停留在抽象口号上。
本部分内容¶
- 第 3 章:安全边界与信任边界
- 第 4 章:工具网关、审批与审计轨迹 这一章继续同一个支持场景,讲的是系统准备把“判断”变成外部动作的那一刻。
- 第一部分:基础
- 参考资料
这一部分之后去哪里¶
这一部分之后,下一步自然就是进入 第三部分:决定智能体到底允许记住什么,retrieval 怎样把上下文带回来,以及怎样不让记忆层变成新的风险来源。
