Hvorfor AI-kode driver af sporet – og hvordan Contract-Driven Development retter op på det
Den skæve sandhed om AI-hastighed
Du kender følelsen. Første måned med Claude eller Cursor er ren magi. Features dukker op lynhurtigt, grundstrukturer bygges på en nat, og kedelig standardkode forsvinder. Så kommer måned to. Koden kompilerer, tests går igennem, deployment lykkes. Men noget er galt. Koden matcher ikke længere det, du egentlig ville have.
Det er ikke dovenskab. Det er drift.
Nylige undersøgelser viser det klart. SlopCodeBench-rapporten fra marts 2026 peger på, at 90 procent af AI-agenters langsigtede processer bliver mere ordrette og mister kvalitet. CMU's Cursor-studie viser, at de indledende 3-5 gange hurtigere udviklingsgevinster forsvinder efter to måneder – med 30 procent flere advarsler og 41 procent mere kompleksitet. Og det værste: 22,7 procent af AI-fejlene sidder fast, selv i de nyeste versioner over hundredtusinder af commits.
AI fungerer fint. Det er styringssystemet, der halter.
Tre skjulte fejltilstande
Betydningsglidning
Produktspecen kræver "letvægt og intuitiv". Tre måneder og halvtreds prompts senere er systemet stadig teknisk i specen – men nu vejer det 5 MB og kræver tre microservices. Begreberne er muteret stille og roligt. Ingen har godkendt det. Koden kører. Først i produktion opdages det.
Usynlig styring
Hvor stammer den arkitektoniske beslutning fra? Din chat-log. Hvilken spec-version lå til grund? Tjek Slack. Hvem bestemte, at API'et skulle returnere nested objects i stedet for flade? Sandsynligvis ingeniøren, der spurgte. Der er ingen fast review-proces, ingen godkendelsessti, ingen svar på "hvem besluttede det, og hvornår?" – farligt, når regulatorer banker på.
Kontekst-sprækkelse
Din codebase fyldte AI'ens context window for tre sprints siden. Ingen enkelt agent har hele overblikket længere. Ejerskab blev uformelt. Så gætværk. Nu lever ti forskellige fortolkninger af arkitekturen i parallelle branches – alle "godkendt", fordi ingen kunne reviewe dem samlet.
Navne på problemet
I løbet af fem måneder i begyndelsen af 2026 fik det her navn under seks forskellige flag:
- Intent debt (Storey, Canada Research Chair)
- Cognitive debt (MIT Media Lab)
- Paradox of supervision (Anthropic)
- Scaffolding fragility (viral på HN)
- Comprehension debt (O'Reilly)
- AI slop (Baltes et al.)
Alle så såret. Ingen leverede løsning.
Indtil contract-driven development dukkede op.
Kontrakt slår spec
Spec-driven development var et skridt frem. Skriv, hvad du vil have, systemet genererer, alle shipper. Det fangede de nemme gevinster.
Men specs rådner ubemærket. De ligger i wiki'et, bliver forældede. Ingen ved, om koden stadig matcher – ingen løbende kobling.
Contract-driven vender det om.
Kode genereres og vurderes mod en levende kontrakt – en lagdelt struktur med:
- Intent: Hvad systemet skal (du ejer og godkender)
- Product & UX: Hvad brugeren oplever (genereret fra intent, du sætter godkendelsesgrænsen)
- System: Hvordan det er bygget (genereret fra intent og product, du sætter grænsen)
Hvert lag hashes. Alt er sporbar. Når drift opdages – og det gør det – får du:
- Opdagelse: Alt godkendt er fingerprinted; drift dukker op automatisk
- Rettelse: Klar vej til fix, ikke gætværk
- Gen-vurdering: Kode dømmes mod kontrakten, ikke isoleret
Fleksibilitet med kontroll
VibeLoom (og lignende contract-systemer) kører i fem tilstande, afhængig af dit projekts modenhed:
Vibe – Prototypespeed. Én godkendelse (intent). Resten auto. Ship hurtigt, lær hurtigt.
Product-led – Du styrer intent og product. System auto. Perfekt til design-fokuserede teams.
Tech-led – Du styrer intent og system. Product auto. Til infra-tunge projekter.
Design-led – Du styrer intent og UX. Mockups kører product-spec. Til bruger-centrerede hold.
Expert – Alt eksplicit. Intet auto. Null trust. Til regulerede eller kritiske systemer.
Start ikke med alt. Begynd i vibe. Skaler op, når koden kræver det.
Hvorfor det betyder noget nu
Dark factory-development kommer. Hele systemer skrives af agenter med minimal menneskelig indblanding. Spørgsmålet er ikke, om du bruger AI til kode – det er, om du har oversigt og kontrol, når det sker.
Spec-driven fanger intent. Contract-driven bevarer den.
Forskellen vokser eksponentielt. Med modeller, der accelererer, vinder et system, der bliver strammere over tid (contract-driven) stort over et, der samler gæld stille (spec-driven).
En codebase, der ved, hvad den skal være, spotter drift og har fast rettelsesvej – den skalerer med AI, ikke imod.
Bundlinjen
Shipper du AI-genereret kode i produktion? Spørg dig selv:
- Kan jeg spore, hvorfor denne beslutning faldt?
- Ville jeg vide, hvis koden gled fra intent?
- Har jeg en plan til at fikse det?
Svar "nej" på ét? Du skal have et contract-lag. Ikke i morgen. Nu.
Vil du dykke dybere? VibeLoom er open-source og kører med Claude Code og Python 3.10+. Ingen runtime-afhængigheder. MIT-licens. Koden er klar til teams, der vil videre fra spec-driven.
AI's hastighedsgevinster er ægte. At holde dem kohærente er næste udfordring.