Архитектура Безопасных AI-Агентов¶

Это книга для тебя, если ты хочешь строить не “магических агентов из презентации”, а спокойные, управляемые и безопасные production-системы.

За отправную точку я беру статью Дмитрия Викулина о надежных AI-агентах, а дальше расширяю ее до платформенного уровня: с управлением, принудительным применением политик, человеческим подтверждением, наблюдаемостью, оценками и эксплуатационными контурами.

Открыть план книги Перейти к первой части Посмотреть источники

Что внутри¶

Архитектурные паттерны: рабочие потоки, маршрутизация, планировщик, подагенты, human-in-the-loop.
Безопасность: IAM, policy-as-code, prompt injection defenses, sandboxing, data boundaries.
Надежность: checkpoints, idempotency, retries, graceful degradation.
Прозрачность: трассы, метрики, оценки и контроль регрессий.
Платформенный подход: шлюзы, общий рантайм, слой знаний, слой инструментов и слой управления.

Главная идея¶

Самая частая ошибка в агентных системах простая: сначала все пытаются добиться автономности, и только потом вспоминают про управляемость. На практике лучше работает другой путь:

Сначала ты строишь предсказуемый workflow.
Потом добавляешь автономность локально и измеримо.
Все опасные действия пропускаешь через политики, подтверждения и трассировку.
Качество держишь не обещаниями модели, а оценками и телеметрией.

С чего обычно лучше начинать¶

Ниже интерактивная карта приоритетов. Это не “истина в последней инстанции”, а удобная шпаргалка: если проект только стартует, сначала почти всегда выгоднее инвестировать в контроль, безопасность и наблюдаемость, а не в максимальную автономность.

Как выглядит хорошая траектория¶

Если коротко, ламповая и рабочая траектория такая:

сначала сделать хороший request path;
затем ввести policy boundary;
после этого подключить tools через gateway;
и только потом расширять память, planner и уровень автономности.

Почему для публикации выбран MkDocs¶

MkDocs + Material for MkDocs в 2026 году все еще выглядит прагматичным выбором: стек активно используется, быстро собирается, хорошо работает с книгами, где основой служит Markdown, и естественно дружит с Python-окружением на uv.¹²³

Если позже захочется больше кастомного UI и MDX-компонентов, хорошим следующим кандидатом будет Astro Starlight. Но для первой версии книги, которую важно быстро публиковать и спокойно поддерживать, Python-first стек проще и надежнее.⁴

Откуда собрана архитектура¶

Исходная рамка по блокам агента: vikulin.ai
Решение "workflow before agents": Anthropic, Building effective agents
Durable execution, memory и HITL: LangGraph docs
Tracing и agent evals: OpenAI docs
Risk management и security controls: NIST AI RMF, OWASP Prompt Injection Cheat Sheet