Правда об AI-агентах для кода: что показывают 6000+ сессий реальных разработчиков
Правда об AI-агентах для кодинга: уроки из 6000+ реальных сессий разработчиков
Все твердят: AI-агенты перевернут разработку. Пиши меньше кода. Выкатывай быстрее. Пусть машины берут рутину на себя.
Но никто не проверял, что разработчики на самом деле с ними делают. Пока не появился SWE-chat.
Этот датасет собрал данные по 6000+ сессиям из production. Результаты шокируют, заставляют задуматься и рушат мифы о работе человека с AI в кодинге.
"Vibe-кодинг" на подъеме — и это пугает безопасников
Данные выделили три стиля взаимодействия:
- Только человек (22,7%): AI объясняет, код пишет разработчик
- Совместный (36,5%): Обмен правками, доработка вдвоем
- Vibe-кодинг (40,8%): AI пишет почти всё, человек просто жмет "OK"
Последний растет как на дрожжах. За три месяца его доля удвоилась. Теперь это главный паттерн.
Проблема: коммиты из vibe-кодинга несут в 9 раз больше уязвимостей, чем чисто человеческий код.
Представьте: скорость растет, но и дыр в безопасности — экспоненциально. Каждый стиль добавляет больше багов, чем фиксит. Vibe-кодинг — чемпион по рискам.
Горькая реальность: больше половины AI-кода летит в мусор
Разработчики обожают AI-агентов, но 55,7% их кода так и не попадает в прод.
Факт: 44% взаимодействий прерывает или отвергает пользователь. А агенты почти не уточняют — всего 1,4% таких ходов.
Это как монолог: один болтает, другой не слушает.
Вывод: AI используют для быстрого мозгового штурма и проб. Не как автопилот для кода. Скорее как суперактивная "резиновую уточку" — идеи генерит, а хорошие дорабатывают вручную.
Что на самом деле нужно разработчикам от AI
Удивительно: лидер по промптам — не генерация кода, а разбор существующего. 19% запросов — "объясни это".
AI стал инструментом реверс-инжиниринга, генератором доки, помощником для входа в чужой кодбейс. Быстрее вникаешь.
А маркетологи пушат "пиши меньше". Разрабы же кричат: "помоги разобраться".
Проблема "эксперт-придиралок"
47% vibe-кодеров — "эксперты-придиралки". Они вникают в каждую строчку AI, правят мелочи.
Это неэффективно. Если ковырять всё подряд, зачем vibe? Данные советуют совместный режим: там баланс цены, скорости и безопасности лучше.
Эти придиралки тратят силы зря. Могли бы сами набить код быстрее, без AI-посредника.
Реальные провалы на примерах
Датасет полон фейлов. Пример: фикс тормозных анимаций в iOS-приложении. AI ковырял stagger у карточек, вместо анимации контейнера.
Несколько правок — и сессия в никуда. Без коммитов. AI не понял контекст пространства и приоритеты.
Другой кейс: придиралка микроменеджерит — "не делай функцию", "вставь UUID инлайном", "переименуй константу". Разраб больше ревьювер, чем кодер.
Что брать на вооружение команде
Внедряете AI-агентов? Данные дают четкие советы:
Фокус на понимании, не на письме: AI круче объясняет код, чем генерит. Доки > креатив.
Выбирайте совместный режим: 36,5% сессий — золотая середина по безопасности, скорости и удобству. Vibe звучит круто, но риски зашкаливают.
Запланируйте ревью: Для AI-кода — Semgrep, Snyk и аналоги. 9x рост уязвимостей — не теория, а реальность в проде.
Считайте хиты, а не объем: Как в датасете, 55% идей уйдет в корзину. Это норма. Оценивайте по тому, что дошло до продa.
Главный инсайт
Ценность SWE-chat — в честности. Реальные разрабы, реальные процессы, реальные выборы по AI-коду.
Миф об "автономных машинах" трещит. Это не unsupervised-кодинг. Это интерактивные инструменты для мышления: идеи генерят, но разраб решает, правит, отбрасывает.
AI мощный. Но не волшебный. Победят те, кто видит в нем партнера: скепсис, вовлеченность, контроль.
Данные это подтверждают.
Хотите копнуть глубже? Полный датасет SWE-chat открыт. Если строите на AI-агентах, паттерны взаимодействия — must-have для роадмапа. Знать, как юзают, надежнее любых догадок.