Hvorfor AI-kode glipper – og hvordan kontraktbasert utvikling fikser det
Den skitne sannheten om AI-hastighet
Du kjenner det. Første måned med Claude eller Cursor er ren magi. Funksjoner dukker opp lynraskt. Grunnstrukturen står klar over natta. Boilerplate forsvinner. Så kommer måned to. Koden kompilerer. Tester går greit. Deploy fungerer. Men noe stemmer ikke. Koden matcher ikke lenger det du egentlig ville bygge.
Det handler ikke om latskap. Det er drift.
Nyere studier viser det klart. SlopCodeBench-rapporten fra mars 2026 avslører at nesten 90 prosent av AI-agenters prosesser blir mer ordrike og taper kvalitet på lengre oppgaver. CMU-studien på Cursor viser at de første 3–5 gangene raskere utviklingen forsvinner etter to måneder. Tilbake står du med 30 prosent flere advarsler og 41 prosent økt kompleksitet. Verst: 22,7 prosent av AI-feilene henger igjen selv i siste revisjon – over hundretusener av commits.
AI fungerer. Det er styringssystemet som svikter.
Tre feilmoduser ingen snakker om
Semantisk drift
Produktspesifikasjonen krever "lettvektig og intuitiv". Tre måneder og femti prompts senere er systemet fortsatt teknisk i tråd med spec-en. Men nå veier det 5 MB og trenger tre microservices. Konseptene har glidd ut. Ingen godkjente endringene. Koden kompilerer. Feilen dukker ikke opp før i produksjon.
Usynlig styring
Hvor kom den arkitektoniske beslutningen fra? Chat-historikken din. Hvilken spec-versjon lå til grunn? Sjekk Slack. Hvem bestemte at API-et skulle returnere nested objects i stedet for flat? Sannsynligvis ingeniøren som spurte. Det finnes ingen varig sporbarhet, ingen godkjenningslogg. Helt til regulatorer eller revisorer banker på.
Kontekst-splitting
Codebasen din sprengte kontekstvinduet til én AI for tre sprint siden. Ingen agent har oversikten lenger. Eierskap ble uformelt. Så gjetting. Nå lever ti ulike tolkninger av arkitekturen parallelt i separate brancher. Alle "godkjent" – fordi ingen klarte å reviewe dem samlet.
Oppdagelsesfasen
I starten av 2026 dukket problemet opp under seks navn på fem måneder:
- Intent debt (Storey, Canada Research Chair)
- Cognitive debt (MIT Media Lab)
- Paradox of supervision (Anthropic)
- Scaffolding fragility (viral på HN)
- Comprehension debt (O'Reilly)
- AI slop (Baltes et al.)
Alle så såret. Ingen leverte kur.
Så kom contract-driven development.
Kontrakt slår spec
Spec-driven development var et fremskritt. Skriv hva du vil, la systemet generere, shipp. Det plukket lavthengende frukt.
Men specs forringer stille. De ligger i wikien. Blir utdaterte. Ingen vet om koden matcher – uten kontinuerlig kobling.
Contract-driven snur det. Kode genereres og vurderes mot en levende kontrakt – et lagdelt rammeverk som fanger:
- Intent: Hva systemet skal gjøre (du eier og godkjenner)
- Product & UX: Brukeropplevelsen (genereres fra intent, du setter godkjenningsgrense)
- System: Arkitekturen (genereres fra intent og product, du setter godkjenningsgrense)
Hvert lag hashes. Hvert lag spores. Når drift oppdages – og det vil den – får du:
- Oppdagelse: Alt godkjent fingerprinted; drift flagges automatisk neste runde
- Uthaling: Klar prosess for fiksering, ikke gjetting
- Vurdering: Kode testes mot kontrakten, ikke isolert
Fleksibilitet med kontroll
VibeLoom (og contract-driven systemer) kjører i fem moduser, basert på prosjektets modenhet:
Vibe – Prototype-fart. Én godkjenningsgrense (intent). Resten auto. Ship raskt, lær raskt.
Product-led – Du styrer intent og product. System auto. Passer design-fokuserte team.
Tech-led – Du styrer intent og system. Product auto. Bra for infra-tunge prosjekter.
Design-led – Du styrer intent og UX. Mockups kan styre product. Ideelt for brukerfokuserte.
Expert – Alt eksplisitt. Ingenting auto. Null tillit. For regulerte eller kritiske systemer.
Ikke start med alle. Begynn i vibe. Oppgrader når coden krever det.
Hvorfor det teller nå
Dark factory-utvikling kommer. Hele systemer bygges av agenter med minimal menneskelig innsats. Spørsmålet er ikke om du bruker AI til kode – det er om du har synlighet og kontroll når du gjør det.
Spec-driven fanger intent. Contract-driven bevarer den.
Forskjellen vokser eksponentielt. Med modeller som akselererer, slår et system som blir strammere over tid (contract-driven) et som samler gjeld (spec-driven) med flere størrelsesordener.
En codebase som vet hva den skal være, oppdager drift og har vei tilbake – den skalerer med AI.
Hovedpoenget
Shipper du AI-generert kode i produksjon? Spør deg selv:
- Kan jeg spore hvorfor denne beslutningen ble tatt?
- Ville jeg merket om koden dro fra intent?
- Har jeg prosess for å fikse det?
Svar "ikke helt" på noe? Du trenger contract-lag. Ikke i morgen. Nå.
Vil du teste? VibeLoom er open-source, kompatibelt med Claude Code og Python 3.10+. Null runtime-avhengigheter. MIT-lisens. Koden er klar for team som vil forbi spec-driven.
AI-hastigheten er ekte. Å holde den sammenhengende er neste steg.