Stop verspilling tokens: laat code het zware werk doen
De AI-paradox in development
Moderne AI-tools nemen vaak taken over die juist perfect in gewone code thuishoren. Daardoor verspil je tokens, ontstaan inconsistente resultaten en moet je voortdurend controleren of alles goed gaat. Het voelt alsof je een slimme consultant inschakelt om lampen aan en uit te doen.
Waarom blind delegeren mislukt
Vraag je een LLM om SonarQube te draaien, de output te lezen en fixes voor te stellen? Dan laat je het model meerdere stappen zelf bedenken: welke commando’s gelden in jouw stack, hoe moet het de resultaten interpreteren, en wat is de volgende actie. Elk van die stappen kan misgaan. Het model raadt, verzint commando’s of slaat cruciale checks over. Het resultaat is een workflow die slim lijkt, maar onvoorspelbaar werkt.
Terug naar deterministische code
De oplossing ligt niet in nóg slimmere prompts, maar in het terugplaatsen van deterministische taken in echte code. Bouw een extensie die:
- Je projectstructuur al kent
- Altijd exact hetzelfde uitvoert
- Voorspelbare kosten heeft
- De AI alleen nog van gevalideerde data voorziet
Zo stuur je de LLM naar wat het écht goed kan: analyseren en creatieve keuzes maken op basis van betrouwbare input.
Bouw je eigen flow
Kopieer nooit blindelings iemands AI-workflow. Ieders setup, stack en randvoorwaarden verschillen. Kijk hoe anderen hun tools inrichten, maar bouw daarna iets wat past bij jouw situatie – net zoals je dotfiles aanpast.
Houd de basis minimalistisch: een simpele read/write-tool, edit-mogelijkheden en shell-toegang. Alles daarbuiten bouw je zelf, zodat je precies weet wat er gebeurt als iets breekt of werkt.
Drie concrete manieren om tokens te besparen
- Cache agressief. Herhaalde systeemprompts en tooldefinities kosten onnodig veel tokens. Tools zoals Caveman comprimeren context zonder dat je kwaliteit verliest.
- Verminder commando-keuzes. Een lange lijst tools verwart het model. Werk met compacte commandolijsten zodat de AI zich concentreert op de taak in plaats van op het menu.
- Normaliseer lokaal. Laat niet de LLM je prompts inkorten. Gebruik lokale tools zoals VCC die structuur opschonen zonder extra API-calls.
Wat dit betekent voor je stack
Kijk kritisch naar je eigen flow: welke stappen laat je een AI doen die beter als script of extensie kunnen worden uitgevoerd? Door deterministische handelingen uit de LLM te halen, bespaar je tokens én krijg je betrouwbaardere resultaten. De toekomst ligt niet bij méér agents, maar bij agents die alleen ingezet worden waar menselijk redeneren écht waarde toevoegt.