Перейти к содержанию

Часть V. Надежность и observability

К этому моменту у нас уже есть:

  • архитектурный каркас;
  • контур безопасности;
  • память и извлечение контекста;
  • execution layer с контрактами, sandbox и дисциплиной around side effects.

Теперь появляется следующий взрослый вопрос: как вообще понимать, что делает агентная система в реальности?

Если у тебя нет хорошей observability, то даже сильная архитектура очень быстро превращается в набор догадок:

  • почему run стал дороже;
  • где именно сломался workflow;
  • какой policy gate сработал;
  • какой tool дал плохой результат;
  • почему пользователю вернулся именно такой ответ.

В этой части мы разберем, как строить трассировку, SLO и циклы оценки так, чтобы агентную систему можно было не только запускать, но и уверенно поддерживать.

В этой части

Дальше логично переходить к организационной модели и platform operating model.