Неделя проверки на прочность: ИИ в кодинге уперся в стену безопасности
Неделя реальности: AI-кодинг упирается в стену безопасности
Конец апреля 2026 года стал холодным душем для всех, кто работает с AI в разработке. Мы создали мощный инструмент. Но безопасность пока хромает. Пять громких анонсов и исследований показали: скорость инноваций обгоняет защиту.
Шокирующая статистика
Начнём с главного: 20% приложений на AI-коде в продакшене имеют серьёзные уязвимости. Это не теория — данные Wiz Research с Google Cloud Next. Такие дыры уже работают в реальных системах.
Что под "серьёзными" подразумевается? Сломанный контроль доступа. Открытые endpoints с данными. Утечки ключей в коде. Тысячи приложений унаследовали это от AI-помощников.
А теперь худшее: эта цифра в 20% может быть завышенной. Независимые тесты говорят о большем бардаке.
Бенчмарк, который всех добил: 23,8%
SecureVibeBench проверили 105 задач по C/C++ из OSS-Fuzz. Каждая — реальная уязвимость, ставшая CVE. Задача для AI: почини, но не повтори ошибку.
Пять агентов в деле: OpenHands, Claude Sonnet 4.5 и другие. Лучший результат: 23,8% решений, которые и работают, и безопасны.
Остальные 76,2%? Либо код не запускается, либо дыра вернулась. Тесты жёсткие: fuzzing в реальном времени, не просто линтеры. Ловили переполнения, буферы, race conditions.
Почему так происходит
Неделя показала тренд. Wiz встраивает сканеры прямо в IDE. Red Gate разобрал пять ошибок в AI-коде для баз данных — вспомнили, как Replit стёр продакшен. Lovable сам признался: 10% их кода с проблемами.
Компании не игнорируют. Они добавляют барьеры. Но вот загвоздка: большие игроки вроде Wiz, Red Gate, Vercel могут себе позволить. А одиночка на Cursor для сайд-проекта? Или CEO, который "виб-кодит" внутренние инструменты?
(Кстати, The New Stack писал о топ-менеджерах на "LLM-only". Один CEO запустил BBS на 23 МБ RAM — 500 юзеров, ноль инцидентов за год. Круто. Но это выжившие, а не норма.)
Рамка "Крах доверия"
Forrester в отчёте переосмыслил брешь Vercel/Context.ai. Не случайность, а следствие сломанной модели ответственности. Платформы сваливают security на девов — например, метки "sensitive" для env-переменных опциональны.
Суть: периметр SaaS — иллюзия. Когда платформа генерит код, хранит секреты и логи — границы стираются. Доверие к LLM для такого — мина замедленного действия.
Что менять в твоём стеке
Если юзаешь AI для кода, пора перестроиться:
1. Считай AI-код дефектным. Тестируй как от новичка. SAST, динамика, fuzzing — обязательно.
2. Веди учёт AI-инструментов. Идея AI-BOM от Wiz — не паранойя. Фиксируй модели: Claude, Copilot, Cursor, Gemini. У них разный риск.
3. Требуй security по умолчанию. Если платформа просит вручную метить секреты — беги. Скан AI-кода должен быть авто, не опцией.
4. Готовься к 76%. 23,8% успеха — норма. Добавляй ревью, анализ, hardening. AI не единственный страж.
5. Приоритет по рискам. Базы данных, auth, API — здесь AI-ошибки бьют сильнее. Закрывай первыми.
Позитивный вывод
Это не приговор AI-разработке. CEO Codenotary на чистом LLM собрал BBS. OutSystems A/B-тестит платформу с Claude. Качество держится — при правильном подходе.
Ключ: "при правильном подходе".
- Сканеры в IDE до коммита.
- Авто-фиксы через плагины.
- Динамичный список моделей.
- Тесты как для внешних либ.
- Давить на вендоров за implicit security.
Red Agent от Wiz, анализ Red Gate, бенчмарк SecureVibeBench — это не конец света. Это база, которую пора строить. Только теперь, после миллионов AI-девов.
Неделя учит: осознали поздно, фиксим быстро. Сколько аппов с 20% дыр уйдёт в прод?
Разбор событий
Wiz на Google Cloud Next: Трипак — Red Agent для атак, AI-BOM для инвентаря, сканеры в IDE. Ремедиация в Claude Code и Cursor. 20% AI-аппов с дырами.
SecureVibeBench: 105 задач из 41 OSS-Fuzz. Функционал + безопасность. Топ: 23,8%. Остальное — фейлы или CVE-повторы.
Red Gate по базам данных: Пять паттернов фейлов в AI-коде. Replit стёр прод, Lovable — 10% проблем.
CEO на виб-кодинге: Codenotary CEO — BBS на LLM, 500 юзеров, 23 МБ, ноль дыр. OutSystems CEO тестил Claude против своей платформы.
Forrester о крахе доверия: Брешь Vercel/Context.ai — конец SaaS-периметру. Платформы мешают кодинг, секреты и логи, ломая ответственность.
Неделя доказала: AI-кодинг работает и ускоряет. Мы учимся его защищать — порой через боль.