Ne hagyd, hogy az AI elpazarolja a tokeneidet – használd a kódot!
Az AI kódolási paradoxon
A modern AI-támogatott fejlesztésben van valami furcsán pazarló. Egyre bonyolultabb rendszereket építünk, ahol nyelvi modellek döntenek determinisztikus feladatokról – konkrét parancsokat futtatnak, dokumentált folyamatokat követnek vagy szabványos ellenőrzéseket hajtanak végre. Közben tokenek égnek el, az eredmények ingadoznak, a fejlesztők pedig minden munkamenetet felügyelnek, nehogy az AI kihagyjon egy fontos lépést vagy rossz eszközt használjon.
Mintha egy zseniális tanácsadót bérelnénk villanykapcsolók kapcsolására. Meg tudná csinálni, de valóban ezt kellene?
A lusta delegálás buktatói
Amikor azt mondod egy LLM-nek, hogy „futtasd le a SonarQube-ot, ellenőrizd az eredményeket és javasolj javításokat”, valójában ezt kéred tőle:
- Emlékezzen a tech stack-edre és a konvencióidra
- Döntse el, melyik parancsszintaxis illik a projektedhez
- Értelmezze olyan kimenetet, ami nem természetes nyelvre készült
- Hozzon ítéletet a következő lépésekről
- Remélje, hogy nem hallucinál nem létező eszközt
Minden lépésnél fennáll a veszélye, hogy a modell letér az útról. Minden eltérés tokenekbe kerül és ellenőrzést igényel. Végül olyan rendszered lesz, ami okosnak tűnik, de kiszámíthatatlanul viselkedik.
A determinizmus forradalma
A megoldás szinte unalmasnak hangzik: tedd vissza a determinizmust oda, ahová való – a valódi kódba.
Ahelyett, hogy az AI-t „kódellenőrzésre” bíznád, építs egy olyan kiegészítőt, ami:
- Ismeri a projektstruktúrádat és nem kell találgatnia
- Mindig ugyanúgy fut nulla kétértelműséggel
- Előre látható számítási költséggel jár, nem token rulettel
- Konzisztens promptokat ad az AI-nak
Ez nem az AI leváltása – hanem átirányítása arra, amiben tényleg jó: elemzésre, kreativitásra és már ellenőrzött információkon alapuló döntésekre.
Képzeld el, hogy a CI/CD pipeline eredményeit közvetlenül, determinisztikus kiegészítőn keresztül adod át az AI kontextusának, ahelyett, hogy az AI-t CI/CD parancsok futtatására kérnéd. Az AI pontos adatokat kap, nem LLM által értelmezett találgatásokat arról, mi történt.
Saját munkafolyamat építése
A legveszélyesebb, ha valaki más AI munkafolyamatát másolod át teljes egészében. Az ő korlátaik, tech stack-jük és sajátosságaik nem feltétlenül illenek a te helyzetedre.
Gondolj rá, mint a dotfiles-okra. Nézd meg, mások hogyan szervezik az eszközeiket. Figyeld meg, milyen problémákat oldottak meg. Aztán építs olyat, ami tényleg illik az igényeidre.
A minimalista eszközök működnek a legjobban itt. Egy egyszerű keretrendszer olvasási, írási, szerkesztési képességgel és shell hozzáféréssel adja az alapot. Minden más – a kiegészítők, a speciális kezelők, a domain logika – olyasmi legyen, amit te értesz és te építettél.
Ha a kiegészítő elromlik, pontosan tudni akarod, miért. Ha működik, pontosan tudni akarod, mit csinál. Ez a tulajdonosi szemlélet.
Három konkrét token-takarékos megoldás
Cache-elj agresszívan. Minden üzenet elküldi a rendszer promptot, az összes képességet és eszközdefiníciót. A prompt caching segít, de csak akkor, ha stratégiailag használod. Az olyan eszközök, mint a caveman (egy kifejezetten tömörítésre tervezett képesség) csökkenthetik az ismétlődő terheket a munkamenetek között anélkül, hogy elveszítenék a kontextust.
Tömörítsd a parancstérképet. Ha az AI csonkolt parancslistákat lát és összezavarodik, hogy milyen eszközök léteznek, már el is vesztetted a csatát. Válts a túlzó eszközlistákról tömörített parancslistákra. Kevesebb választási lehetőség kevesebb hibát jelent, és az AI a munkára koncentrálhat ahelyett, hogy egy túlzó menüt böngészne.
Tömöríts helyben, ne a modellel. Ellentmondásosnak tűnhet, de ha a promptjaidat olyan helyi normalizáló eszközökön futtatod, amelyek nem hívnak LLM-et, az gyorsabb és olcsóbb, mint ha a modellt kérnéd „tömörítsd ezt” feladattal. A VCC ezt strukturális normalizálással végzi – nincs extra API hívás, nincs token pazarlás, a kontextus megmarad.
A valódi nyereség
Egy fejlesztő, aki a bonyolult ágens munkafolyamatokról áttért a determinisztikus kiegészítőkre, leesett egy belső token-pazarlási ranglistáról. Ez talán szerény dicsekvésnek hangzik, de valójában az ellenkezője: többet ért el kevesebb modellhívással, mert megszüntette a pazarlást.
Ez a fordulópont. Nem arról van szó, hogy kevesebbet használjuk az AI-t. Hanem arról, hogy okosabban használjuk – azokon a problémákon, ahol az emberi szintű érvelés tényleg hozzáadott értéket jelent, ahelyett, hogy olyan döntésekre pazarolnánk, amelyeknek if-statement-eknek kellett volna lenniük.
Mit jelent ez a te stack-ed számára
Ha saját kódolási folyamatot építesz vagy olyan eszközöket értékelsz, mint a NameOcean Vibe Hosting AI képességei, tedd fel magadnak ezeket a kérdéseket:
- Hol kérek az AI-tól determinisztikus feladatot?
- Lehetne ezt szkripttel, API hívással vagy kiegészítővel megoldani?
- Tokeneket fizetek konzisztencia-ellenőrzésre, amit be lehetne építeni?
Az AI fejlesztés jövője nem több ágens. Hanem okosabb ágensek, amelyek tudják, miben igazán jók.