Miért sodródik el az AI-generált kód – és hogyan javítja ki a szerződésvezérelt fejlesztés?
Az AI-sebesség sötét oldala
Érezted már? Az első hónap Claude-dal vagy Cursorral tiszta varázslat. Gyorsabban születnek a funkciók, egyik napról a másikra kész a vázlat, eltűnik a felesleges kód. Aztán jön a második hónap. A kód lefordul, a tesztek zöldek, a deploy simán megy. De valahogy mégsem az épül, amit szerettél volna.
Ez nem lustaság. Ez a drift, az elcsúszás.
Friss kutatások keményen megmutatják a valóságot. A SlopCodeBench (2026 március) szerint az AI-ügynökök 90 százalékánál nő a felesleges kódmennyiség hosszú távon. A CMU Cursor-vizsgálat kimutatta: a kezdeti 3-5-szörös gyorsulás két hónap után eltűnik, helyette 30 százalékkal több figyelmeztetés és 41 százalékkal bonyolultabb kód marad. Ráadásul a hibák 22,7 százaléka megmarad a végső verzióban is, százezres commit-mennyiségben nézve.
Az AI nem romlott el. A vezérlési modell a hibás.
Három rejtett csapda, amiről senki sem beszél
Értelmi elcsúszás
A termékleírásod "könnyű és intuitív". Három hónap, ötven prompt után technikailag még mindig azt építi – de már 5 MB-os monstrum, három mikroszolgáltatással. A fogalmak lassan átalakultak. Senki sem hagyta jóvá. A kód fut, észre se veszed, míg élesben nem robban.
Láthatatlan döntéshozatal
Honnan jött ez az architektúra? A chat-történetedből. Melyik spec-verzió alapján? Nézd meg a Slacket. Ki döntötte el, hogy nested objektumok kellenek flat helyett? Valószínűleg az a fejlesztő, aki megkérdezte. Nincs nyomon követhető nyilvántartás, jóváhagyási lánc – pedig audit vagy szabályozás idején ez katasztrófa.
Kontextus-szétforgácsolódás
A kódbázis rég kinőtte egy AI kontextus-ablakát. Senki sem látja az egészet. A felelősség informális lett, aztán találgatás. Most tíz különböző architektúra-értelmezés él párhuzamos ágakon, mind "jóváhagyott", mert senki sem tudta koherensen átnézni.
A felismerés pillanata
2026 elején öt hónap alatt hat név került rá ugyanarra a sebre:
- Intent debt (Storey, Canada Research Chair)
- Cognitive debt (MIT Media Lab)
- Paradox of supervision (Anthropic)
- Scaffolding fragility (HN-vírus)
- Comprehension debt (O'Reilly)
- AI slop (Baltes et al.)
Mindenki látta a problémát. Senki sem hozott megoldást.
Aztán jött a contract-driven development.
Szerződés a spec felett
A spec-driven jó lépés volt. Megírod, mit akarsz, az AI legenerálja, mindenki boldog. De a spec-ek elavulnak a wikin, senki sem tudja, illeszkedik-e még a kód.
A contract-driven megfordítja ezt.
A kódot élő szerződés ellen generálják és mérik – rétegzett szerkezet, ami rögzíti:
- Intent: Mire való a rendszer (te birtoklod és jóváhagyod)
- Product & UX: Mit él át a felhasználó (intent-ből generálva, te döntesz a kapuról)
- System: Hogy épül fel (intent + product alapján, te döntesz a kapuról)
Minden réteg hash-elve, nyomon követhető. Ha elcsúszás jön – és jönni fog –, akkor:
- Felismerés: Minden jóváhagyott elem ujjlenyomatolva, az elcsúszás azonnal kiderül
- Javítás: Világos út a helyreállításra, nem találgatás
- Újramérés: A kód újra a szerződés ellen, nem elszigetelten
Rugalmasság és szigor egyben
A VibeLoom (és hasonló contract-rendszerek) öt módban dolgoznak, a projekted érettségétől függően:
Vibe – Prototípus-sebesség. Egy kapu (intent). Minden más automatikus. Gyorsan iterálj.
Product-led – Te kezeled intentet és productot. System automatikus. Design-fókuszú csapatoknak.
Tech-led – Te intent és system. Product automatikus. Infra-nehéz projektekhez.
Design-led – Te intent és UX. Mockupok hajtják a productot. Felhasználó-központú helyekre.
Expert – Minden réteg explicit. Semmi nem automatizál. Nulla bizalom. Szabályozott vagy kritikus rendszerekhez.
Nem kell mindet az elején. Kezdj vibe-bal, lépj feljebb, ha a kód megéri.
Miért fontos ez most?
A sötét gyárak jönnek: teljes rendszereket AI-ügynökök írnak minimális emberi beavatkozással. Nem arról van szó, használd-e AI-t kódra – hanem hogy lásd és urald-e, amikor igen.
Spec-driven rögzíti az intentet. Contract-driven megőrzi azt.
Ez exponenciálisan térül meg. Modell-görbe felpörög, a contract-driven rendszer egyre feszesebb, míg a spec-driven csendben halmoz adósságot – többszörös különbség.
A kód, ami tudja, mi a célja, észleli az elcsúszást, és tudja, hogyan javítsa – az skáláz AI-val, nem ellene.
A lényeg
Ha AI-generált kódot élesítesz, kérdezd meg magadtól:
- Nyomon követem, miért született ez a döntés?
- Tudnám, ha a kód eltért az intenttől?
- Van-e eljárás a javításra?
Ha bármire "nem igazán", kell neked contract-réteg. Nem holnap. Most.
Kipróbálnád? A VibeLoom open source, Claude Code-dal és Python 3.10+-ral működik. Nincs runtime függőség. MIT licenc. Kész csapatoknak, akik túllépnek a spec-drivenen.
Az AI-sebesség valós. Annak *összefüggő** tartása a következő határeset.