Почему агентам ИИ для кодинга нужны крутые чертежи, а не мощные модели
Парадокс разработки с ИИ
Если вы в 2024–2025 годах кодили с Claude, ChatGPT или другими топовыми моделями, то заметили чудо. Они генерируют рабочий код быстрее человека. Обрабатывают рефакторинг по нескольким файлам. Создают тесты. Следуют инструкциям в чужом коде. Первый PR от ИИ выглядит идеально.
А потом вы сливаете десяток таких.
Вот тут начинается веселье. И не самое приятное.
Код работает. Тесты зелёные. Но что-то меняется. Обработка ошибок упрощается. Имена функций плывут. Появляются дубли абстракций. Каждая правка логична сама по себе. А в сумме кодовая база теряет целостность.
Это не баг моделей. Это про то, как мы их используем.
Настоящая проблема: спецификация, а не мощь ИИ
Недавние исследования это подтверждают: когда модели достигают высокого уровня, качество кода зависит только от полноты спецификации.
Представьте. Даёте ИИ чёткую инструкцию — с обработкой ошибок, именами, архитектурой, состоянием и кейсами. Получаете профессиональный код. Пишете просто "добавь авторизацию" — код работает, тесты проходят, но накапливается техдолг.
Модель не тупеет. Просто вы не сказали всего.
Почему точность теряется
Разрыв между естественным языком и кодом мал, но растёт как снежный ком:
Язык размытый. "Добавь авторизацию" — это сжатие кучи решений. Какая модель идентификации? Что с истёкшими токенами? RBAC или ABAC? Где проверки прав? Что логировать? Какие ошибки показывать? Как вписать в схему БД, API и тесты?
Человек спросит уточнения. ИИ заполнит пробелы из данных обучения. Выборы разумны по отдельности, но встраивают скрытые обязательства в код.
Окружение кода строгое, промпты — нет. Компилятор, типы и тесты не пропустят неоднозначность. Промпт же мягкий. Модель не скажет "недостаточно данных". Она просто сделает выборы без документации.
Получается перевернуто: из строгого кода переходишь в размытый промпт, а вывод — снова строгий код. Размытость не уходит. Она прячется в архитектуре.
Масштаб бьёт консистентность. Даже с идеальной спецификацией ИИ трудно держать верность в десятках файлов и тысячах строк. Контекст ограничен. Модель решает, что помнить. Ошибки накапливаются.
Доказательства: эксперимент Alibaba
Alibaba в SWE-CI протестировали 18 моделей на 100 реальных репозиториях. 233 дня, 71 коммит подряд. Итог: у 75% агентов регресс ускорялся. Каждый коммит проходил тесты. Но поломки старых тестов росли.
Модели не падали. Базы кода деградировали. Локально coherent, глобально — нет.
Что это значит для вашей разработки
Используете ИИ в продакшене? Учитывайте:
ИИ — как джуниор, а не архитектор. Чем детальнее спецификация, тем лучше. Делайте так:
- Пишите документы по архитектуре перед промптами.
- Указывайте стратегии ошибок явно.
- Фиксируйте конвенции имён и паттерны.
- Говорите, какие абстракции переиспользовать.
- Описывайте состояние и edge cases.
- Добавляйте контекст о тестах и покрытии.
ИИ усиливает вашу архитектуру. Чёткие конвенции? ИИ их продолжит. Хаос? Ускорит его.
Ревью обязательно. Человек ловит скрытые допущения до накопления.
Git — история спецификаций. Коммиты должны объяснять архитектурные выборы, а не только изменения.
Шанс вперёд
Хорошая новость: проблема не в моделях. Потолок качества высокий. ИИ пишет отлично при полной спецификации.
Конкурентное преимущество — не топовая модель. А практики: чёткие документы, промпт-инжиниринг, строгие ревью. Это навыки, которые растут со временем.
Ваши агенты не сломаны. Просто недосказаны. Доработайте спецификации — и увидите.
Для пользователей NameOcean
Строите на облаке NameOcean с ИИ? Это критично. При масштабе в distributed systems спецификация спасает. Документируйте domain routing, DNS propagation, SSL management и API-design перед промптами. Чем точнее инфраструктура, тем лучше ИИ-код впишется в deployment pipeline.