Waarom AI-code afdwaalt (en Contract-Driven Development het oplost)
De verborgen valkuil van AI-snelheid
Je kent dat gevoel. Die eerste weken met Claude of Cursor voelen als pure magie. Code rolt eruit, structuren ontstaan in no-time, saaie templates verdwijnen. Dan slaat maand twee toe. Alles compileert, tests slagen, deployments lopen gladjes. Maar diep vanbinnen klopt het niet meer met je oorspronkelijke plan.
Geen luiheid. Dit heet drift.
Onderzoek schetst een grauwe werkelijkheid. SlopCodeBench (maart 2026) toont dat 90% van AI-processen langzamerhand omslachtig wordt en inzakt bij complexe taken. CMU-onderzoek met Cursor meldt: de beginwinst van 3-5x snelheid verdwijnt na twee maanden, met 30% meer waarschuwingen en 41% hogere complexiteit. En het ergste? 22,7% van AI-fouten blijft hangen, zelfs in de laatste revisies van tonnen commits.
AI faalt niet. Het besturingsmodel hapert.
Drie sluipende problemen
Betekenisverschuiving
Je spec vraagt om 'licht en intuïtief'. Na drie maanden en vijftig prompts is het technisch nog steeds 'jouw spec' – maar nu 5MB zwaar met drie microservices. Ideeën zijn stilletjes veranderd. Niemand stemde ermee in. Code draait. Pas in productie merk je het.
Onzichtbare beslissingen
Waar komt die architectuurkeuze vandaan? Uit je chatlog. Welke specversie was leidend? Kijk in Slack. Wie koos voor geneste API-objecten in plaats van plat? Waarschijnlijk de engineer die vroeg. Geen spoor van review, geen goedkeuring, geen antwoord op 'wie en wanneer?' – rampzalig bij audits of regelgevers.
Versnipperde context
Je codebase past al drie sprints niet meer in één AI-context. Geen agent ziet het geheel. Eigenaarschap wordt informeel, dan giswerk. Nu heb je tien versies van je architectuur in parallelle branches, allemaal 'goedgekeurd' omdat coherent review onmogelijk is.
De ontwakingsfase
Begin 2026 doopten zes bronnen dit probleem tegelijkertijd:
- Intent debt (Storey, Canada Research Chair)
- Cognitive debt (MIT Media Lab)
- Paradox of supervision (Anthropic)
- Scaffolding fragility (viral op HN)
- Comprehension debt (O'Reilly)
- AI slop (Baltes et al.)
Iedereen zag de zere plek. Niemand leverde een remedie.
Tot contract-driven development opkwam.
Contract boven spec
Spec-driven was een stap vooruit. Schrijf je wens, genereer code, deploy. Het plukte het laaghangend fruit.
Maar specs verouderen onopgemerkt in je wiki. Niemand checkt of code nog matcht – geen doorlopende koppeling.
Contract-driven keert het om.
Code ontstaat en wordt getoetst aan een levend contract – een gelaagd geheel met:
- Intent: Het doel van het systeem (jij beheert en keurt goed)
- Product & UX: Wat de gebruiker ziet (uit intent gegenereerd, jij bepaalt de keuring)
- System: De opbouw (uit intent en product, jij stelt de poort)
Elke laag krijgt een hash. Alles traceerbaar. Bij drift – en die komt – heb je:
- Detectie: Goedgekeurde delen gefingerprint; afwijkingen lichten op
- Herstel: Duidelijk pad, geen gokwerk
- Hertoets: Code tegen contract, niet geïsoleerd
Balans tussen vrijheid en controle
VibeLoom (en andere contract-systemen) schakelen in vijf modi, afgestemd op je projectfase:
Vibe – Prototype-rush. Alleen intent-goedkeuring. Rest auto. Snel leren.
Product-led – Jij stuurt intent en product. Systemen volgen. Ideaal voor design-teams.
Tech-led – Jij over intent en systemen. Product auto. Perfect voor infra-zware klussen.
Design-led – Jij beheert intent en UX. Mockups voeden product. Voor user-focused crews.
Expert – Alles expliciet. Niets auto. Nul vertrouwen. Voor gereguleerde of cruciale systemen.
Begin niet meteen voluit. Start vibe. Bouw op als je code het waard is.
Waarom nú actie?
Donkere fabrieken naderen. Volledige systemen door AI-agents, met minimale mens. De vraag is niet óf je AI inzet voor code – maar of je inzicht en greep houdt.
Spec-driven vangt intent. Contract-driven behoudt het.
Dat verschil groeit exponentieel. Met snellere modellen wint een strak, coherent wordend systeem (contract) met ruime voorsprong van een stil schulden-opbouwend spec-systeem.
Een codebase die zijn doel kent, drift spot, en herstel weet – díe schaalt mét AI.
De kernboodschap
Gebruik je AI-code in productie? Vraag jezelf:
- Kan ik traceren waarom deze keuze viel?
- Merk ik als code afdwaalt van intent?
- Heb ik een plan om het te fixen?
Eén 'nee'? Voeg een contract-laag toe. Vandaag nog.
Benieuwd naar meer? VibeLoom is open-source, draait met Claude Code en Python 3.10+. Geen runtime-afhankelijkheden. MIT-licentie. Klaar voor teams die spec-driven achter zich laten.
AI-snelheid is echt. Het behouden ervan coherent is de nieuwe battleground.