Mallipainot riittävätkö? Näin ForgeCode näyttää orkestroinnin voiman
Mallipainot ovat vanhentuneet: ForgeCoden oppi orkestroinnin voimasta
AI-maailma on viime vuodet tuijottanut isoja malleja, parempia painoja ja uusia rakenteita. ForgeCode pamautti kuitenkin totuuden: mallin ohjauskerros ratkaisee enemmän kuin luulet.
Tiimi kääri Gemini 3.1 Pron ForgeCoden rakenteeseen ilman muutoksia itse malliin. Ei hienosäätöä, ei uusia parametreja, ei koulutusta. Vain työkalujen käyttöä uudelleenjärjestetty. Tuloksena Terminal-Bench 2.0:ssa nousu 55 %:sta 80,2 %:iin. 25 prosenttiyksikön loikka pelkän putkiston ansiosta.
Todellinen salaisuus: Skeeman muotoilu voittaa mallivoiman
Koodaajille, jotka rakentavat toimivia agentteja, tässä piilee helmi.
Kun LLM kutsuu ulkoista työkalua – lukee tiedoston, ajaa komennon tai kysyy tietokannasta – se tuottaa JSON-pyynnön. Helppoa? Useimmat frameworkit lähettävät monimutkaisia pesittyjä skeemoita, joissa kenttien järjestys heittelee. Malli tuottaa ylimääräisiä sulkuja, unohtaa kentän tai sotkee JSONin. Kutsu epäonnistuu. Aloitetaan uusiksi.
ForgeCode litistää skeemat ja pakottaa kiinteän kenttäjärjestyksen joka kerta. Sama malli, siistimpi rakenne, vähemmän virheitä. Ohjauskerros hoitaa taustalla duunia, joka ennen hautautui lokitiedostoihin.
Tällaiset temput eivät päädy papereihin, koska ne tuntuvat liian arkipäiväisiltä. Silti ne toimivat.
Rinnakkaisuus: 3–5x nopeus, josta kukaan ei puhu
Useimmat koodaajat etenevät peräkkäin. Lue tiedosto, odota, lue seuraava. Perinteinen vesiputous. ForgeCode muuttaa pelin: riippumattomat kutsut laukeavat yhtä aikaa join_all()-komennolla.
Jos agentti skannaa 10 konfiguraatiotiedostoa ennen suunnitelmaa, peräkkäinen malli tekee 10 kierrosta. ForgeCode hoitaa yhden. Tehtävät, jotka alkavat tiedostohauissa (melkein kaikki), nopeutuvat 3–5-kertaiseksi.
Skaalautuessa ero kasvaa. CI/CD-putket, koodiarvostelubotit ja debuggaustyökalut kompuroivat tiedostoluvuissa. Rinnakkaisuus ei ole ylellisyyttä; se erottaa kehityskäytön tuotannosta.
Moniagenttirakenne: Rekursio ilman rajoja
ForgeCode tuo mukanaan kolme erikoistunutta agenttia:
- Forge: Hoitaa suoritukset
- Muse: Suunnittelee työvaiheet
- Sage: Kaivaa kontekstia ja riippuvuuksia
Jokaisella oma malli, konteksti ja työkalut. Uutta? Ei. Nerokkuus on ohjauksessa.
Ala-agentit syntyvät rinnakkaiskerroksen kautta, joten yksi kierros voi käynnistää useita Forge-instansseja samanaikaisesti. Ja koska ala-agentit voivat synnyttää omia alaisiaan, ketju jatkuu rekursiivisesti tehtävän loppuun – niin syvään kuin tarvitaan.
Ei tikapuita, vaan puu.
Heitä ForgeCodelle mutkikas ongelma, niin se hajottaa sen luonnollisesti. Delegointi loppuu, kun se ei enää kannata, ei mielivaltaisen rajan takia.
Rehelliset heikkoudet
ForgeCode ei väitä olevansa valmis joka paikkaan. Tiimi listaa aukot suoraan:
- Ei pysyvää muistia: Sessiot ovat tilattomia. Konteksti katoaa uusilla kierroksilla.
- Ei tarkistuspisteitä: Jos homma kaatuu kesken, aloitetaan alusta. Ei jatkoa.
- Pieni yhteisö: Cline ja OpenCode tarjoavat enemmän integraatioita ja tukea.
Nämä ovat isoja tuotannossa. Mutta ne ovat korjattavissa ja rehellisiä. Tiedät, mihin ryhdyt.
Mitä tämä tarkoittaa sun AI-pinoon
ForgeCoden tulokset opettavat: etsi tehoja kehitystyökaluista ensin ohjauskerroksesta, älä mallipäivityksistä.
Startupit ja agenttitiimit: viilaa frameworkeja nyt, älä odota seuraavaa mallia. Siistit skeemat. Rinnakkaisuus. Rekursiivinen delegointi. Nämä kertyvät nopeasti.
Pilvihostaaville (kuten meille) viesti on selvä: agenttien pyörittäminen ei ole vain GPU:ita ja viivettä. Frameworkit ratkaisevat enemmän kuin raaka teho.
Tarkemmat benchmarkit löytyvät terminal-bench.com. Kokeile ForgeCodea Tensorlaken Harnessissa.
Malli elää yhä. Mutta ohjauskerros varasti shown.
Haluatko pyörittää AI-agentteja skaalautuvalla infrastruktuurilla? NameOceanin cloud hosting ja Vibe Hosting AI -kerros on tehty juuri tällaisiin kuormiin. Otetaan yhteyttä.