Miért sodródik el az AI-generált kód – és hogyan javítja ki a szerződésvezérelt fejlesztés?

Máj 13, 2026 ai coding contract-driven development code drift detection semantic versioning ai governance developer tools ai engineering best practices

Az AI-sebesség sötét oldala

Érezted már? Az első hónap Claude-dal vagy Cursorral tiszta varázslat. Gyorsabban születnek a funkciók, egyik napról a másikra kész a vázlat, eltűnik a felesleges kód. Aztán jön a második hónap. A kód lefordul, a tesztek zöldek, a deploy simán megy. De valahogy mégsem az épül, amit szerettél volna.

Ez nem lustaság. Ez a drift, az elcsúszás.

Friss kutatások keményen megmutatják a valóságot. A SlopCodeBench (2026 március) szerint az AI-ügynökök 90 százalékánál nő a felesleges kódmennyiség hosszú távon. A CMU Cursor-vizsgálat kimutatta: a kezdeti 3-5-szörös gyorsulás két hónap után eltűnik, helyette 30 százalékkal több figyelmeztetés és 41 százalékkal bonyolultabb kód marad. Ráadásul a hibák 22,7 százaléka megmarad a végső verzióban is, százezres commit-mennyiségben nézve.

Az AI nem romlott el. A vezérlési modell a hibás.

Három rejtett csapda, amiről senki sem beszél

Értelmi elcsúszás
A termékleírásod "könnyű és intuitív". Három hónap, ötven prompt után technikailag még mindig azt építi – de már 5 MB-os monstrum, három mikroszolgáltatással. A fogalmak lassan átalakultak. Senki sem hagyta jóvá. A kód fut, észre se veszed, míg élesben nem robban.

Láthatatlan döntéshozatal
Honnan jött ez az architektúra? A chat-történetedből. Melyik spec-verzió alapján? Nézd meg a Slacket. Ki döntötte el, hogy nested objektumok kellenek flat helyett? Valószínűleg az a fejlesztő, aki megkérdezte. Nincs nyomon követhető nyilvántartás, jóváhagyási lánc – pedig audit vagy szabályozás idején ez katasztrófa.

Kontextus-szétforgácsolódás
A kódbázis rég kinőtte egy AI kontextus-ablakát. Senki sem látja az egészet. A felelősség informális lett, aztán találgatás. Most tíz különböző architektúra-értelmezés él párhuzamos ágakon, mind "jóváhagyott", mert senki sem tudta koherensen átnézni.

A felismerés pillanata

2026 elején öt hónap alatt hat név került rá ugyanarra a sebre:

Intent debt (Storey, Canada Research Chair)
Cognitive debt (MIT Media Lab)
Paradox of supervision (Anthropic)
Scaffolding fragility (HN-vírus)
Comprehension debt (O'Reilly)
AI slop (Baltes et al.)

Mindenki látta a problémát. Senki sem hozott megoldást.

Aztán jött a contract-driven development.

Szerződés a spec felett

A spec-driven jó lépés volt. Megírod, mit akarsz, az AI legenerálja, mindenki boldog. De a spec-ek elavulnak a wikin, senki sem tudja, illeszkedik-e még a kód.

A contract-driven megfordítja ezt.
A kódot élő szerződés ellen generálják és mérik – rétegzett szerkezet, ami rögzíti:

Intent: Mire való a rendszer (te birtoklod és jóváhagyod)
Product & UX: Mit él át a felhasználó (intent-ből generálva, te döntesz a kapuról)
System: Hogy épül fel (intent + product alapján, te döntesz a kapuról)

Minden réteg hash-elve, nyomon követhető. Ha elcsúszás jön – és jönni fog –, akkor:

Felismerés: Minden jóváhagyott elem ujjlenyomatolva, az elcsúszás azonnal kiderül
Javítás: Világos út a helyreállításra, nem találgatás
Újramérés: A kód újra a szerződés ellen, nem elszigetelten

Rugalmasság és szigor egyben

A VibeLoom (és hasonló contract-rendszerek) öt módban dolgoznak, a projekted érettségétől függően:

Vibe – Prototípus-sebesség. Egy kapu (intent). Minden más automatikus. Gyorsan iterálj.

Product-led – Te kezeled intentet és productot. System automatikus. Design-fókuszú csapatoknak.

Tech-led – Te intent és system. Product automatikus. Infra-nehéz projektekhez.

Design-led – Te intent és UX. Mockupok hajtják a productot. Felhasználó-központú helyekre.

Expert – Minden réteg explicit. Semmi nem automatizál. Nulla bizalom. Szabályozott vagy kritikus rendszerekhez.

Nem kell mindet az elején. Kezdj vibe-bal, lépj feljebb, ha a kód megéri.

Miért fontos ez most?

A sötét gyárak jönnek: teljes rendszereket AI-ügynökök írnak minimális emberi beavatkozással. Nem arról van szó, használd-e AI-t kódra – hanem hogy lásd és urald-e, amikor igen.

Spec-driven rögzíti az intentet. Contract-driven megőrzi azt.

Ez exponenciálisan térül meg. Modell-görbe felpörög, a contract-driven rendszer egyre feszesebb, míg a spec-driven csendben halmoz adósságot – többszörös különbség.

A kód, ami tudja, mi a célja, észleli az elcsúszást, és tudja, hogyan javítsa – az skáláz AI-val, nem ellene.

A lényeg

Ha AI-generált kódot élesítesz, kérdezd meg magadtól:

Nyomon követem, miért született ez a döntés?
Tudnám, ha a kód eltért az intenttől?
Van-e eljárás a javításra?

Ha bármire "nem igazán", kell neked contract-réteg. Nem holnap. Most.

Kipróbálnád? A VibeLoom open source, Claude Code-dal és Python 3.10+-ral működik. Nincs runtime függőség. MIT licenc. Kész csapatoknak, akik túllépnek a spec-drivenen.

Az AI-sebesség valós. Annak *összefüggő** tartása a következő határeset.

Read in other languages:

RU BG EL CS UZ TR SV FI RO PT PL NB NL IT FR ES DE DA ZH-HANS EN