Архитектура Безопасных AI-Агентов¶
Это книга для тебя, если ты хочешь строить не “магических агентов из презентации”, а спокойные, управляемые и безопасные production-системы.
За отправную точку я беру статью Дмитрия Викулина о надежных AI-агентах, а дальше расширяю ее до платформенного уровня: с управлением, принудительным применением политик, человеческим подтверждением, наблюдаемостью, оценками и эксплуатационными контурами.
Открыть план книги Перейти к первой части Посмотреть источники
Что внутри¶
- Архитектурные паттерны: рабочие потоки, маршрутизация, планировщик, подагенты, human-in-the-loop.
- Безопасность: IAM, policy-as-code, prompt injection defenses, sandboxing, data boundaries.
- Надежность: checkpoints, idempotency, retries, graceful degradation.
- Прозрачность: трассы, метрики, оценки и контроль регрессий.
- Платформенный подход: шлюзы, общий рантайм, слой знаний, слой инструментов и слой управления.
Главная идея¶
Самая частая ошибка в агентных системах простая: сначала все пытаются добиться автономности, и только потом вспоминают про управляемость. На практике лучше работает другой путь:
- Сначала ты строишь предсказуемый workflow.
- Потом добавляешь автономность локально и измеримо.
- Все опасные действия пропускаешь через политики, подтверждения и трассировку.
- Качество держишь не обещаниями модели, а оценками и телеметрией.
С чего обычно лучше начинать¶
Ниже интерактивная карта приоритетов. Это не “истина в последней инстанции”, а удобная шпаргалка: если проект только стартует, сначала почти всегда выгоднее инвестировать в контроль, безопасность и наблюдаемость, а не в максимальную автономность.
Как выглядит хорошая траектория¶
Если коротко, ламповая и рабочая траектория такая:
- сначала сделать хороший request path;
- затем ввести policy boundary;
- после этого подключить tools через gateway;
- и только потом расширять память, planner и уровень автономности.
Почему для публикации выбран MkDocs¶
MkDocs + Material for MkDocs в 2026 году все еще выглядит прагматичным выбором: стек активно используется, быстро собирается, хорошо работает с книгами, где основой служит Markdown, и естественно дружит с Python-окружением на uv.123
Если позже захочется больше кастомного UI и MDX-компонентов, хорошим следующим кандидатом будет Astro Starlight. Но для первой версии книги, которую важно быстро публиковать и спокойно поддерживать, Python-first стек проще и надежнее.4
Откуда собрана архитектура¶
- Исходная рамка по блокам агента: vikulin.ai
- Решение "workflow before agents": Anthropic, Building effective agents
- Durable execution, memory и HITL: LangGraph docs
- Tracing и agent evals: OpenAI docs
- Risk management и security controls: NIST AI RMF, OWASP Prompt Injection Cheat Sheet