Deja que el código haga su trabajo: deja de malgastar tokens con la IA
La paradoja de la IA en el desarrollo
Hay algo extraño en cómo usamos la inteligencia artificial para programar. Los equipos crean flujos complejos donde los modelos deciden sobre tareas que deberían ser automáticas: ejecutar comandos, seguir procesos documentados o revisar resultados. Mientras tanto, se consumen tokens sin control y los desarrolladores terminan supervisando cada paso para evitar errores.
Es como contratar a un experto para que encienda las luces. Puede hacerlo, pero ¿realmente debería?
Delegar sin control
Cuando le pides a un LLM que ejecute SonarQube, analice los resultados y proponga correcciones, le estás exigiendo que:
- Recuerde tu stack y tus convenciones
- Seleccione el comando correcto según tu proyecto
- Interprete salidas pensadas para otros sistemas
- Decida qué hacer después
- No invente herramientas que no existen
Cada una de estas decisiones puede fallar. Y cuando falla, pierdes tokens y tiempo en verificar.
Recuperar la determinación
La solución es más simple de lo que parece: devolver las tareas deterministas al código.
En lugar de pedirle a la IA que gestione revisiones, crea una extensión que:
- Conozca tu estructura de proyecto sin tener que adivinar
- Se ejecute igual siempre sin margen de error
- Tenga un coste predecible en vez de depender de tokens variables
- Genere prompts consistentes para que la IA trabaje con datos fiables
Esto no elimina la IA. La reubica donde realmente aporta valor: en el análisis, la creatividad y las decisiones basadas en información verificada.
Diseña tu propio flujo
Copiar el sistema de otra persona rara vez funciona. Cada equipo tiene limitaciones, herramientas y hábitos distintos.
Piensa en tus dotfiles. Observa cómo otros organizan sus herramientas, pero construye algo que se adapte a tu caso. Lo ideal es empezar con algo mínimo: un framework básico con capacidad de lectura, escritura, edición y acceso a shell. El resto —las extensiones, la lógica específica, los manejadores— debería ser algo que entiendas y hayas creado tú.
Tres formas de ahorrar tokens
Usa caché de forma agresiva. Cada mensaje repite el system prompt, las herramientas y las definiciones. Herramientas como caveman pueden comprimir esa información entre sesiones sin perder contexto.
Reduce el espacio de comandos. Si la IA recibe listas de comandos largas y confusas, es más probable que se equivoque. Mejor usa listas comprimidas y claras. Menos opciones, menos errores.
Comprime localmente. Ejecutar normalizaciones antes de enviar el prompt al modelo es más rápido y barato que pedirle a la IA que resuma. Herramientas como VCC aplican transformaciones estructurales sin llamar a la API.
El verdadero ahorro
Un desarrollador que abandonó flujos de agentes complejos logró bajar del leaderboard interno de consumo de tokens. No porque usara menos IA, sino porque la usaba solo donde realmente aportaba valor.
Esa es la clave. No se trata de usar menos IA, sino de dejar de pedirle que haga lo que un script ya resuelve.
Revisa tu flujo actual
Si estás construyendo tu propio sistema o evaluando herramientas como las capacidades de Vibe Hosting AI de NameOcean, pregúntate:
- ¿Dónde le estoy pidiendo a la IA que haga algo determinista?
- ¿Podría resolverse con un script o una extensión?
- ¿Estoy pagando tokens para verificar algo que podría estar garantizado por código?