跳转至

审批请求与决策记录 Schema

这一页描述智能体系统里人工审批的最小契约层:审批请求长什么样,决策记录长什么样,以及高风险动作之后应该在审计轨迹里留下什么。

它也直接连接到书里的 Evidence Spine:从请求到发布判断,因为审批正是让一次受治理运行从请求一直保持可读到发布判断的关键记录之一。

如果 策略包 回答的是“当前到底有哪些规则在生效”,那么审批 Schema 回答的就是“运行时如何把最后一道决定权交给人”。

1. 为什么要单独有审批 Schema

一种非常常见的失败路径是:

  • 策略说某个动作属于高风险;
  • 运行时返回 approval_required
  • 后面的逻辑全都散落在界面或团队口头约定里。

这样会丢掉:

  • 稳定的请求格式;
  • 可审查的决策记录;
  • 可重复的审计轨迹;
  • 审批与具体运行或追踪之间的连接。

所以审批边界最好被建模成机器可读的契约,而不是界面上的一颗按钮。

2. 核心实体

一个最小可用的审批 Schema,通常围绕三个实体:

  • approval_request
  • approval_decision
  • approval_audit_record

这已经足够把策略层、运行时、追踪 Schema 和生命周期工件串起来。

3. 审批请求

approval_request 会在运行时遇到不能自动继续的动作时被创建。

kind: approval_request
approval_id: apr-2026-04-07-001
trace_id: trace-approval-001
session_id: session-approval-001
agent_id: support-triage-agent
tenant_id: tenant-acme
principal_id: user-42
capability: ticket_write
risk_tier: high
requested_action: create_incident_ticket
reason: write_path_requires_human_review
requested_fields:
  summary: "Open a Sev-2 onboarding incident"
  idempotency_key: ticket-req-2026-04-09-001
  target_system: jira
  destination: project://OPS
sandbox_context:
  sandbox_profile_contract: sandbox-profile-v1
  workspace_entries_reviewed: true
  permissions_profile: restricted-shell-network-denied
  network_secrets_posture: network:denied,secrets:none
  snapshot_policy: required_on_completion
required_role: oncall_manager
status: pending

这里最重要的是:

  • trace_idsession_id 把审批绑到运行历史上;
  • capabilityrequested_action 防止审批退化成抽象的是/否;
  • required_role 让“谁都能看一眼”与“真正有权限批准的人”区分开;
  • requested_fields 固定了人类真正批准的载荷;
  • sandbox_context 对由 sandbox 支撑的动作很重要,审批人需要看到 workspace materialization、permissions 与 snapshot/resume policy,而不只是业务载荷。

4. 审批决策

approval_decision 用来表达人到底做了什么决定,以及依据是什么。

kind: approval_decision
approval_id: apr-2026-04-07-001
decision: approved
decided_by: oncall-manager-7
decided_at: 2026-04-07T11:42:00Z
role: oncall_manager
note: "Customer impact confirmed, proceed with ticket creation"
scope: single_request
expires_at: 2026-04-07T12:00:00Z

这里的关键不变量是:

  • 决策必须指向具体的 approval_id
  • decided_byrole 要能进入审计;
  • scope 必须明确;
  • expires_at 对于不能长期复用的审批很重要。

5. 审批审计记录

approval_audit_record 把决策和真实的副作用或拒绝执行联系起来。

kind: approval_audit_record
approval_id: apr-2026-04-07-001
trace_id: trace-approval-001
decision: approved
executed: true
executed_capability: ticket_write
tool_principal: svc-ticket-writer
idempotency_key: ticket-req-2026-04-09-001
result_status: success
linked_events:
  - approval_requested
  - approval_resolved
  - tool_called
  - tool_succeeded

这样它就不再只是“有人点了同意”,而是一条完整的运营记录:

  • 请求被提出;
  • 它被批准或拒绝;
  • 动作被执行或没有执行;
  • 具体由哪个主体产生了副作用也可追踪。

6. 它和追踪 Schema 的关系

审批 Schema 不应该独立存在,而应该和追踪 Schema 通过这些事件接起来:

  • approval_requested
  • approval_resolved
  • tool_called
  • tool_succeeded
  • tool_failed

这也是为什么好的审批流程应该既能从审计记录还原,也能从追踪还原。如果审批出现在失败运行演练或其他退化路径里,这种还原还应该和会话导出对得上,包括 failure_reason 这样的字段,而不是只停留在审批记录本身。

重复工单线索的 approval record

在 support-triage 案例中,approver 按下 approve 之前就应该在 payload 旁看到 idempotency_key。如果之后 create_ticket 超时,audit record 会把同一个 key 保存在 approval_idtrace_idtool_principal 旁边,让 review 能区分一次已审批的写入意图和 blind retry 之后重复发生的副作用。

7. 它和策略包的关系

策略包回答的是:

  • 哪个能力需要审批;
  • 谁可以批准;
  • 有哪些风险等级;
  • 哪些动作没有人类门禁就绝对不能执行。

审批 Schema 回答的是另一层:

  • 请求本身长什么样;
  • 人到底批准了什么;
  • 决策怎么被保存;
  • 这个决策怎么和执行关联。

8. 它和参考包的关系

agent_runtime_ref 已经包含了支撑这套模型的运营基础构件:

inspect-approvals 会返回 trace_idsession_idtenant_idagent_idcountapproval_idspending_approval_idsapproval_capability_namespending_approval_capability_namesapproval_status_countsidempotency_keysapprovals;每条 approval entry 都保留 approval_idtenant_idagent_idcapability_namerequested_byreviewerreasonstatuscapability_session_idcapability_session_statusauthorization_modedelegated_principal_iddelegated_scopeidempotency_keyresolve-approval 会返回 approval_idapproval_idstrace_idsession_idtenant_idagent_idcapability_nameapproval_capability_namespending_approval_idspending_approval_capability_namesrequested_bystatusreviewerresolution_notecapability_session_idcapability_session_statusauthorization_modedelegated_principal_iddelegated_scopeidempotency_keyidempotency_keysapproval_status_counts,因此可运行 demo 在决策前后都会保留可见的 approval lineage、capability-session state、delegated authority、duplicate-write intent 与最终 approval status。

内置的 approvals.yaml 也会明确 approval operating policy,并用 'approvals' must be a mapping 校验 top-level shape:default_reviewerescalation_sla_minutes,以及 delegated_authorization 下的 reviewer_required_for_user_delegationrequire_principal_bindingrequire_scope_visibilityon_scope_revokedsubagent_inheritance,共同说明谁来评审 delegated actions、哪些 evidence 必须保持可见,以及 delegation 是否可以传递给 subagents。Policy loader 也会用 approvals.default_reviewer must be a stringapprovals.default_reviewer is requiredapprovals.escalation_sla_minutes must be an integerapprovals.escalation_sla_minutes must be positiveapprovals.delegated_authorization must be a mappingapprovals.delegated_authorization must be DelegatedAuthorizationPolicydelegated_authorization.require_principal_binding must be a booleandelegated_authorization.require_scope_visibility must be a boolean 保持 reviewer、escalation 与 delegated-authorization evidence 的 type-safety。Approval/session lineage 也会用 Authorization mode is not supported: {authorization_mode} 拒绝不受支持的 delegated-authorization evidence,并用 Approval status is not supported: {status} 拒绝不受支持的 approval 或 capability-session states,而不是把未知 mode 或 status 存进 approvals 或 session exports 旁边。参考策略将 subagent inheritance 设为 explicit_only,因此 delegated authority 不会流入 child agent,除非 approval path 明确点名。

这让审批不只是概念说明,而是真的可以在演示运行时里跑起来。

9. 最小不变量

一个成熟的审批层,至少应该保证:

  • 每个请求都有稳定的 approval_id
  • 审批绑定到 trace_idsession_id
  • 被批准的载荷是明确的;
  • 审批人和角色会进入审计轨迹;
  • 副作用能追溯到具体审批决策;
  • 过期审批不会被静默复用。

10. 最常见的断裂点

这里的典型问题通常很容易识别:

  • 审批请求不包含真实动作载荷;
  • 审批人看到的上下文太少;
  • 决策只存在于界面,没有进入追踪;
  • 运行时不区分“只批准这一次”和“永远都批准”;
  • 由 sandbox 支撑的审批隐藏了 sandbox profile、workspace entries 或 permissions;
  • 副作用执行时用的载荷和批准时不是同一个;
  • 事后没人能还原到底是谁批准了这个高风险动作。

11. 现在就该做什么

先过一遍这份短清单,把所有回答为“否”的地方单独记下来:

  • 审批请求是否有明确的 approval_id
  • 审批是否绑定到 trace_idsession_id
  • 审批人看到的是不是之后真正会执行的载荷?
  • 如果动作由 sandbox 支撑,审批人是否能看到 sandbox profile contract、workspace entries、permissions 与 snapshot/resume policy?
  • decided_byrole 和决策范围是否被保存?
  • 审批能不能与真实的工具执行对上?
  • 批准和拒绝两种路径是否都有便于审计的记录?

如果连续几个答案都是“否”,那说明你虽然已经有人工门禁,但还没有真正完整的审批契约。

下一步做什么