Modelltúllépés: Így bizonyítja a ForgeCode, hogy az irányítási réteg a lényeg
Modell Súlycikkek Túl: Miért Dönt a ForgeCode a Rendszerezésben
Az AI-közösség egy éve a hatalmas modelleken pörög. Nagyobb súlyok, okosabb struktúrák – ez a sláger. A ForgeCode most közli: a modell irányítása számít igazán sokat.
A csapat a Gemini 3.1 Pro modellt vette, nem nyúlt hozzá. Nem finomhangolta, nem bővítette, nem tanította újra. Csak átalakította, hogyan kommunikál eszközökkel. Eredmény? A Terminal-Bench 2.0-n 55%-ról 80,2%-ra ugrott. 25 százalékpontnyi plusz, pusztán jobb összekötésekből.
A Kulcs: Okos Sémák Verik a Modell Erőt
Fejlesztőknek, akik valódi kódoló ügynököket építenek, ez aranyat ér.
Ha az LLM eszközhívást akar (fájl olvasás, parancs futtatás, adatbázis lekérdezés), JSON-t gyárt rá. Egyszerűnek tűnik? Pedig a legtöbb keretrendszer bonyolult, mélyen beágyazott sémákat küld, kaotikus mező sorrenddel. A modell becsúszik egy zárójellel, kihagy egy mezőt, vagy elrontja a formátumot. Hívás bukik. Újrapróbálkozás indul.
A ForgeCode laposítja ezeket a sémákat, és egységes sorrendet kényszerít mindenre. Ugyanaz a modell, tisztább kimenet, kevesebb hiba. Az irányítási réteg csendben dolgozik, ami régen csendben buktatta el a hívásokat.
Olyan trükk ez, amit nem publikálnak papírokon, mert túl hétköznapi. De bejön.
Párhuzamos Futtatás: 3–5-szörös Gyorsulás, Amit Elfelejtettek
A legtöbb kódoló ügynök sorban dolgozik. Fájlt kér, megvárja, aztán következőt. Láncreakció a felhőben. A ForgeCode megfordítja: független hívások egyszerre indulnak join_all()-al.
Ha 10 konfigurációs fájlt kell olvasni terv előtt, soros ügynök 10 oda-vissza utat csinál. ForgeCode egyet. Fájlrendszer-feltérképezésnél (ami minden feladatnál első), 3–5-ször gyorsabb.
Nagyságrendben ez összeadódik. CI/CD ügynökök, kódellenőrzők, hibakeresők – mind fájl olvasási szűk keresztmetszetben fulladnak. Párhuzamosság nem luxus, hanem a különbség fejlesztői játék és éles deploy között.
Több Ügynökös Rendszer: Rekurzió Szabályok Nélkül
A ForgeCode három szakosított ügynököt hoz:
- Forge: Végrehajt feladatokat
- Muse: Tervez munkafolyamatokat
- Sage: Kutatás kontextus és függőségek után
Mindegyik külön modell, izolált kontextus, saját eszközök. Nem újdonság. A zseniális a vezérlésük.
Al-ügynökök párhuzamos rétegen keresztül születnek, így egy körben több Forge indulhat részfeladatokra. Al-ügynökök tovább szülhetnek, rekurzívan, amíg kell – nem csak egy szinten, hanem a probléma mélységéig.
Fa struktúra, nem létra.
Komplex gondoknál szépen bontja részekre. Akkor áll meg, ha felesleges tovább bontani, nem mesterséges határon.
Őszinte Gyengeségek
A ForgeCode nem állítja, hogy mindenre kész. A készítők bevallják a hézagokat:
- Nincs kitartó memória: Állapot nélküli sessionök, kontextus elveszik futások között.
- Nincs ellenőrzőpont: Ha közbenszakad, nulláról indulsz, nincs folytatás.
- Kisebb közösség: Cline és OpenCode-nak több támogatás, integráció.
Élesben ezek fájnak. De javíthatók, és becsületesen jelölve vannak. Tudod, mibe vágsz bele.
Mit Jelent Neked az AI Stack-edben
A ForgeCode tanulsága: AI fejlesztőeszközökben a teljesítményt ne modellváltásban keresd, hanem az irányításban.
Startupoknak, ügynöképítőknek: optimalizáld a saját kereteidet, ne várj új modellekre. Tisztább sémák. Párhuzamosság. Rekurzív kiosztás. Ezek gyorsan összeadódnak.
Felhő hostingoknak (mint nekünk): ügynökök hostolása nem csak GPU és késleltetés. A fölötte futó keretrendszerek döntenek, nem a nyers számítási erő.
Részletes benchmarkok terminal-bench.com-on. Kipróbálni Tensorlake's Harness-en keresztül.
A modell él. De az irányítás vette át a főszerepet.
AI ügynököket deployolni skálázható infrastruktúrán? NameOcean felhő platformja és Vibe Hosting AI rétege erre optimalizált. Beszéljünk róla.