Перед запуском AI-агента: проверка на compliance, которую нельзя пропустить
Перед запуском AI-агента: проверка compliance, которую нельзя пропустить
Раньше интеграции были простыми. Один API-ключ. Один триггер. Чёткий поток данных. Всё изменилось.
Современный AI-агент на Claude с Model Context Protocol (MCP) тянет десятки подключений сразу. Salesforce, Stripe, GitHub, Slack, Gmail, payroll, observability, vector database — всё в одном флаконе. Агент действует от твоего имени через каждую связь.
Это даёт силу. Но создаёт compliance-ад. Большинство команд ещё не осознали масштаб.
Пробел в compliance
Факт такой: SOC 2, GDPR, HIPAA, PCI, SOX, EU AI Act писали под людей и старые приложения. Контроль — через ежегодные аудиты, подписи на изменения, опросы вендоров. Путь знакомый: спланировал, задокументировал, одобрили, запустил.
Нет инструмента вроде linter'а, который спросит: "Какой compliance-риск и exposure рождаются от этих подключений?"
Опасность в том, что риски всплывают поздно. Агент в проде месяцами. Аудит стартует. И бац: customer-agent читает личные Slack-сообщения (PHI, attorney-client privilege). Payment-agent рефандит через Stripe (нарушение segregation of duties, расширение PCI-scope).
Guardrails на runtime спасут отчасти. Но агент уже запущен. Ожидания команды — он работает дальше.
Подход pre-flight
А если ловить проблемы на этапе дизайна? Когда фикс дёшев.
Pre-flight compliance меняет timeline. Эскиз агента: "следит за failed payments в Stripe, ищет клиента в Salesforce, постит в Slack". Запускаешь чек. До прод-кода.
Сразу видно:
- Уровни риска по действиям (low, medium, high, critical)
- Регуляторки в зоне (GDPR? HIPAA? PCI? SOX? Всё?)
- Red flags по segregation of duties — то, что compliance-команда заметит через полгода
- Рекомендации: ок так, добавить audit logging, human review на действие, или блок
Опции есть. Убрать инструмент. Сменить write на read-only. Critical action — под approval. Или задокументировать exposure для ревью.
Почему это работает
Не думай про LLM-плагин с риском на лету — бесполезно. Hallucinations и non-determinism не для compliance.
Сила pre-flight в двух принципах:
Детерминизм, без генерации: Риски и теги из curated database, не LLM. Один input — один output. Аудитируемо. Защищаемо на встрече.
Открытые данные: Правила классификации на виду. Видишь, почему slack.read_direct_messages под HIPAA. Не согласен с контекстом? Данные прозрачны. Пишешь issue, предлагаешь правку. Доверие растёт.
Шире взгляд
Мы на повороте. Агенты из "экспериментов" в "критичную инфраструктуру". Подключают customer data, payments, HR, proprietary intel.
Compliance-фреймворки отстают. Аудиты — раз в год. Деплои агентов — еженедельно.
Pre-flight чек — deterministic, auditable, transparent — сужает разрыв. Не заменит ревью. Но спасёт от паники на аудите и разговора с боссами о missed exposure.
Разработчикам и фаундерам агентов: берите модель. Чек compliance рано и часто. До деплоя. Пока изменения лёгкие. Это linting для регуляторных рисков.
Выживут агенты не самые быстрые. А те, где видно, что они делают и с чьим разрешением.