Неделя проверки на прочность: ИИ в кодинге уперся в стену безопасности

Май 01, 2026 ai-assisted development secure coding vibe coding vulnerability research cloud security software supply chain code generation security benchmarks

Неделя реальности: AI-кодинг упирается в стену безопасности

Конец апреля 2026 года стал холодным душем для всех, кто работает с AI в разработке. Мы создали мощный инструмент. Но безопасность пока хромает. Пять громких анонсов и исследований показали: скорость инноваций обгоняет защиту.

Шокирующая статистика

Начнём с главного: 20% приложений на AI-коде в продакшене имеют серьёзные уязвимости. Это не теория — данные Wiz Research с Google Cloud Next. Такие дыры уже работают в реальных системах.

Что под "серьёзными" подразумевается? Сломанный контроль доступа. Открытые endpoints с данными. Утечки ключей в коде. Тысячи приложений унаследовали это от AI-помощников.

А теперь худшее: эта цифра в 20% может быть завышенной. Независимые тесты говорят о большем бардаке.

Бенчмарк, который всех добил: 23,8%

SecureVibeBench проверили 105 задач по C/C++ из OSS-Fuzz. Каждая — реальная уязвимость, ставшая CVE. Задача для AI: почини, но не повтори ошибку.

Пять агентов в деле: OpenHands, Claude Sonnet 4.5 и другие. Лучший результат: 23,8% решений, которые и работают, и безопасны.

Остальные 76,2%? Либо код не запускается, либо дыра вернулась. Тесты жёсткие: fuzzing в реальном времени, не просто линтеры. Ловили переполнения, буферы, race conditions.

Почему так происходит

Неделя показала тренд. Wiz встраивает сканеры прямо в IDE. Red Gate разобрал пять ошибок в AI-коде для баз данных — вспомнили, как Replit стёр продакшен. Lovable сам признался: 10% их кода с проблемами.

Компании не игнорируют. Они добавляют барьеры. Но вот загвоздка: большие игроки вроде Wiz, Red Gate, Vercel могут себе позволить. А одиночка на Cursor для сайд-проекта? Или CEO, который "виб-кодит" внутренние инструменты?

(Кстати, The New Stack писал о топ-менеджерах на "LLM-only". Один CEO запустил BBS на 23 МБ RAM — 500 юзеров, ноль инцидентов за год. Круто. Но это выжившие, а не норма.)

Рамка "Крах доверия"

Forrester в отчёте переосмыслил брешь Vercel/Context.ai. Не случайность, а следствие сломанной модели ответственности. Платформы сваливают security на девов — например, метки "sensitive" для env-переменных опциональны.

Суть: периметр SaaS — иллюзия. Когда платформа генерит код, хранит секреты и логи — границы стираются. Доверие к LLM для такого — мина замедленного действия.

Что менять в твоём стеке

Если юзаешь AI для кода, пора перестроиться:

1. Считай AI-код дефектным. Тестируй как от новичка. SAST, динамика, fuzzing — обязательно.

2. Веди учёт AI-инструментов. Идея AI-BOM от Wiz — не паранойя. Фиксируй модели: Claude, Copilot, Cursor, Gemini. У них разный риск.

3. Требуй security по умолчанию. Если платформа просит вручную метить секреты — беги. Скан AI-кода должен быть авто, не опцией.

4. Готовься к 76%. 23,8% успеха — норма. Добавляй ревью, анализ, hardening. AI не единственный страж.

5. Приоритет по рискам. Базы данных, auth, API — здесь AI-ошибки бьют сильнее. Закрывай первыми.

Позитивный вывод

Это не приговор AI-разработке. CEO Codenotary на чистом LLM собрал BBS. OutSystems A/B-тестит платформу с Claude. Качество держится — при правильном подходе.

Ключ: "при правильном подходе".

Сканеры в IDE до коммита.
Авто-фиксы через плагины.
Динамичный список моделей.
Тесты как для внешних либ.
Давить на вендоров за implicit security.

Red Agent от Wiz, анализ Red Gate, бенчмарк SecureVibeBench — это не конец света. Это база, которую пора строить. Только теперь, после миллионов AI-девов.

Неделя учит: осознали поздно, фиксим быстро. Сколько аппов с 20% дыр уйдёт в прод?

Разбор событий

Wiz на Google Cloud Next: Трипак — Red Agent для атак, AI-BOM для инвентаря, сканеры в IDE. Ремедиация в Claude Code и Cursor. 20% AI-аппов с дырами.

SecureVibeBench: 105 задач из 41 OSS-Fuzz. Функционал + безопасность. Топ: 23,8%. Остальное — фейлы или CVE-повторы.

Red Gate по базам данных: Пять паттернов фейлов в AI-коде. Replit стёр прод, Lovable — 10% проблем.

CEO на виб-кодинге: Codenotary CEO — BBS на LLM, 500 юзеров, 23 МБ, ноль дыр. OutSystems CEO тестил Claude против своей платформы.

Forrester о крахе доверия: Брешь Vercel/Context.ai — конец SaaS-периметру. Платформы мешают кодинг, секреты и логи, ломая ответственность.

Неделя доказала: AI-кодинг работает и ускоряет. Мы учимся его защищать — порой через боль.

Read in other languages:

BG EL CS UZ TR SV FI RO PT PL NB NL HU IT FR ES DE DA ZH-HANS EN