AI не должен жрать ваши токены — дайте задачу коду
Парадокс ИИ в разработке
Современные команды тратят уйму ресурсов на странную схему. Они поручают языковым моделям выполнять рутинные, предсказуемые действия: запуск команд, следование инструкциям, проверка кода по чек-листу. При этом тратятся токены, результат получается разным каждый раз, а разработчику приходится постоянно контролировать процесс.
Это всё равно что нанимать эксперта, чтобы он включал и выключал свет. Технически возможно, но совершенно неэффективно.
Почему делегирование не работает
Когда вы просите модель «запустить SonarQube и предложить исправления», вы на самом деле требуете от неё сразу несколько сложных задач:
- Вспомнить особенности вашего стека и правила проекта
- Определить правильный синтаксис команды
- Разобрать вывод утилиты, не предназначенный для чтения человеком
- Принять решение о следующих шагах
- Не придумать несуществующую команду
На каждом этапе модель может ошибиться. Каждая ошибка требует проверки и тратит токены. В итоге система выглядит умной, но работает непредсказуемо.
Возвращение детерминизма
Решение простое — вернуть предсказуемость туда, где ей место: в код.
Вместо того чтобы просить ИИ «провести code review», стоит создать расширение, которое:
- Знает структуру проекта и не гадает наугад
- Выполняется одинаково при каждом запуске
- Даёт предсказуемые затраты без случайных расходов на токены
- Формирует надёжный контекст для модели
ИИ при этом не заменяется — он просто получает точные данные вместо того, чтобы интерпретировать собственные догадки.
Как строить свой процесс
Самая большая ошибка — копировать чужой workflow целиком. У других свои ограничения, стек и особенности, которые могут не подойти вам.
Лучше изучить чужие решения, как изучают dotfiles: посмотреть, какие проблемы они решают, и адаптировать подход под себя. Минималистичные инструменты здесь работают лучше всего — базовый набор с чтением, записью и доступом к shell даёт достаточно гибкости. Всё остальное стоит делать самому.
Три способа сэкономить токены
Кэшируйте агрессивно. Системные промпты и описания инструментов повторяются в каждом сообщении. Инструменты вроде caveman помогают сжимать повторяющийся контекст без потери смысла.
Сокращайте список команд. Если модель видит огромный перечень инструментов, она теряется. Лучше использовать компактные списки — меньше вариантов, меньше ошибок.
Нормализуйте локально. Запускать сжатие промптов через локальные инструменты быстрее и дешевле, чем просить модель «сделать короче».
Главный результат
Один разработчик после перехода на детерминированные расширения ушёл с внутреннего «лидерборда по сжиганию токенов». Не потому что стал меньше работать, а потому что убрал лишние запросы к модели.
Что это значит для вас
Если вы строите собственный процесс разработки или оцениваете инструменты вроде Vibe Hosting AI от NameOcean, задайте себе три вопроса:
- Где я прошу ИИ выполнять предсказуемые действия?
- Можно ли заменить это скриптом или расширением?
- Плачу ли я токенами за проверку того, что можно сделать детерминированно?
Будущее не в количестве агентов, а в том, чтобы модели делали то, в чём они действительно сильны.