Когда AI-агенты сходят с ума: как распознать атаки indirect prompt injection в коде
Новый вектор атак, о котором все молчат
AI-агенты для кода сейчас везде — как GitHub Copilot или Claude. Они просматривают pull request'ы, предлагают правки и даже коммитят изменения. А если хакеры повернут их против вас?
Недавние инциденты показали: через indirect prompt injection можно заставить AI внедрить вредоносный код. В том числе malware с dead-drop на блокчейне. Без единого подозрительного клика от человека.
Как это работает?
Direct prompt injection — это когда в чат впихивают злой промпт. Indirect — хитрее:
- Хакер прячет инструкции в файле, комментарии или докстринге. Всё выглядит невинно.
- AI-агент сканирует репозиторий — ищет баги, генерит код или проверяет зависимости.
- Агент натыкается на "инструкцию" и выполняет её, не распознав подвох.
- В код уходит malware, который крадёт данные через блокчейн-каналы. Их почти невозможно отследить.
Чем это грозит разработчикам?
Это не фантастика. Если AI под контролем атакующего, ждите беды:
- Уязвимости в цепочке поставок: Заражают ваши библиотеки.
- Угон секретов: API-ключи, пароли от БД, токены.
- Бэкдоры: Постоянный доступ для будущих набегов.
- Рассылка malware: Ваш репо становится рассадником.
Если вы на cloud hosting от NameOcean или управляете доменами у нас, проверьте CI/CD с AI. Это ваш слабый пункт.
Признаки заражения (IOCs)
Подозреваете беду? Ищите:
- Странные коммиты с шаблонными сообщениями ночью.
- Новые зависимости в манифестах без вашего ок.
- Скрытые файлы или ветки от автоматики.
- Связи с чужими доменами в коде (особо RPC блокчейна).
- Запутанный код, не в стиле команды.
- Комменты с ссылками на подозрительные ресурсы.
Блокчейн-вариант выдаёт web3.py, ethers.js в requirements без причины.
Что делать срочно?
Обнаружили следы? Действуйте по шагам:
1. Изолируйте и проверьте
- Отзовите все ключи и токены.
- Просмотрите свежие коммиты.
- Загляните в логи хостинга (у NameOcean они под рукой).
2. Разберите payload
- Используйте историю Git, чтобы вычислить внедрёнку.
- Не запускайте и не деплоите.
- Сохраните образцы в песочнице для анализа.
3. Найдите источник
- Выясните, какой AI или инструмент скомпрометирован.
- Проверьте входные данные.
- Поищите похожие ловушки в коде.
4. Почистите
- Force-push чистых коммитов.
- Поменяйте все credentials.
- Настройте AI на блокировку подозрительных промптов.
- Добавьте фильтры в workflows.
5. Защититесь навсегда
- Блокируйте блокчейн-импорты в code review.
- Настройте DNS-фильтры на nameserver (NameOcean поможет).
- Внедрите signed commits.
- Следите за логами AI.
Как укрепить инфраструктуру
AI никуда не денется. Строим защиту слоями:
Контролируйте доступ AI: Ограничьте репо, используйте OAuth и deployment keys с умом.
Подписывайте код: Каждый коммит — с крипто-подписью. Проверяйте.
Сканьте зависимости: Инструменты на подозрительные либы, особенно блокчейн и сеть.
DNS и сеть: Блокируйте C2-домены через DNS (у NameOcean продвинутый менеджмент). Файрвол режет outbound.
Проверка SSL/TLS: Для шифрованных каналов malware. Но осторожно с приватностью.
Авто-сканеры: SAST в CI/CD на поиск инъекций.
Взгляд шире
Indirect prompt injection — свежий тип supply-chain атаки на доверие к AI. Автоматизация растёт, хакеры адаптируются.
Хорошая новость: это ловится мониторингом, контролями и гигиеной. Относитесь к AI как к человеку с root-доступом.
Что это значит для вашей команды
Работаете с веб-инфраструктурой на NameOcean или другом провайдере? Срочно:
- Проверьте workflows и AI-интеграции.
- Осмотрите коммиты и деплойменты.
- Ужесточите доступ к репо.
- Включите полный мониторинг.
AI + блокчейн + хитрые атаки = новые дыры. Но бдительность и меры вперёд угроз.
Будьте начеку. Безопасность — это база, а не опция.