Waarom AI-codeers beter blauwdrukken nodig hebben (geen betere modellen)
De Paradox van AI in de Code
Stel je voor: je gebruikt Claude of ChatGPT voor development in 2024-2025. Deze tools spuwen werkende code uit, sneller dan de meeste developers. Ze refactoren meerdere bestanden, bouwen test suites en duiken in onbekende codebases. Die eerste AI-PR oogt perfect.
Merge er nog tien.
Dan begint het gedonder.
Code draait nog. Tests slagen. Maar er sluipt iets binnen. Error handling wordt laks. Naamconventies verslappen. Dubbele abstraties verschijnen naast bestaande. Elke wijziging lijkt logisch op zich, maar samen erodeert de eenheid van je codebase.
Dit ligt niet aan de modellen zelf. Het zit in hoe wij ze inzetten.
De Echte Knelpunt: Specificatie, Geen Slimheid
Onderzoek bewijst het zwart op wit: boven een bepaald niveau hangt codekwaliteit af van hoe compleet je specificatie is, niet van de AI-intelligentie.
Zo werkt het. Geef een topmodel een strakke spec – met error handling, naming, patronen, state management en edge cases – en je krijgt pro-code. Zeg simpel 'voeg authenticatie toe', en je krijgt werkende code die tests haalt, maar technische schuld opstapelt.
De AI is niet dommer geworden. Jij hebt de details niet aangeleverd.
Waar het Misgaat met Precisie
Tussen je losse taal en keiharde code gaapt een kloof die snel oploopt:
Natuurlijke taal is vaag. 'Authenticatie toevoegen' vat tientallen keuzes samen. Welk identity model? Hoe met vervallen tokens? RBAC of ABAC? Waar permission checks? Wat log je? Welke errors naar de client? Hoe past het bij je DB-schema, API en tests?
Een menselijke dev vraagt door. AI vult in met aannames uit trainingsdata – prima in isolation, maar ze nestelen zich als onzichtbare verplichtingen.
Je code-omgeving dwingt scherpte af; prompts niet. Compiler, types en tests blokkeren onzin. Maar bij prompts slurpt het medium vaagheid op. AI zegt nooit 'te weinig info'. Het kiest stilzwijgend.
Resultaat: je wisselt strak (code) naar vaag (prompt), maar output moet strak zijn. Die vaagheid zit nu vast in je architectuur.
Schaal sloopt consistentie. Zelfs met top-spec's: coherentie over tientallen bestanden en duizenden regels? Moeilijk. Context windows helpen, maar zijn beperkt. AI kiest wat het onthoudt. Die keuzes hopen op.
Bewijs uit de Praktijk: Alibaba's Experiment
Geen theorie. Alibaba testte 18 AI-modellen op 100 echte codebases, 233 dagen, 71 commits. 75% van de agents verslechterde versneld. Elke commit werkte, tests groen. Maar breaks in oude tests namen toe.
Modellen faalden niet. Codebases wel. Lokaal slim, globaal rommelig.
Impact op Je Workflow
Gebruik je AI in productie? Pas dit toe:
Behandel AI als junior dev, geen architect. Meer details, beter resultaat. Dus:
- Schrijf eerst architectuur-docs
- Specificeer error strategies expliciet
- Leg naming en patronen vast
- Wijs op herbruikbare abstraties
- Beschrijf state en edges vooraf
- Geef teststrategie mee
AI vergroot je architectuur – goed of slecht. Strakke codebase? AI bouwt door. Chaos? Het explodeert sneller.
Review is verplicht. Menselijke ogen vangen aannames op voor het escaleert.
Git wordt je spec-archief. Commit history moet intent tonen, niet alleen diffs. Handig voor later debuggen.
De Kansen
Goed nieuws: dit is oplosbaar. Topmodellen leveren topcode bij top-spec's.
Voordeel zit niet in de duurste AI, maar in betere specs: scherpere docs, slimme prompts, strakke reviews. Leer het je team, en het groeit.
Je agents zijn niet kapot. Onder-spec'd. Fix dat, en zie het verschil.
Voor NameOcean Gebruikers
Bouw je op NameOcean's cloud met AI? Let op. Bij schalende services telt spec-clarity dubbel. Documenteer domain routing, DNS propagation, SSL management en API-design vóór je AI loslaat. Scherpe infra-spec's zorgen voor naadloze integratie in je pipeline.