Více než jen váhy modelu: Jak ForgeCode ukazuje sílu vrstvy orchestrace
Více než jen váhy modelu: ForgeCode ukazuje, proč záleží na orchestraci
Celý AI svět se poslední dobu točí kolem obřích modelů, vylepšených vah a nových architektur. ForgeCode ale právě hodil do hry nepříjemnou pravdu: orchestrace modelu je důležitější, než si myslíte.
Tým zabalil Gemini 3.1 Pro do architektury ForgeCode, aniž by model vůbec měnil. Žádné doladění, žádné nové parametry, žádné přetrénování. Jen změnili, jak komunikuje s nástroji. Výsledek? Skok z 55 % na 80,2 % v Terminal-Bench 2.0. Čistých 25 bodů jen díky lepšímu "potrubí".
Pravý klíč: Design schémat překonává sílu modelu
Pro developery, kteří skutečně spouštějí code agenty, je tu zajímavý moment.
Když LLM volá externí nástroj – čte soubor, spouští příkaz nebo dotazuje databázi – vytvoří JSON s popisem požadavku. Jednoduché? Většina frameworků ale posílá složitě vnořené schémata s chaotickým pořadím polí. Model se zasekne, přidá zbytečné závorky, vynechá pole nebo vrátí pokroucený JSON. Volání selže, začne retry smyčka.
ForgeCode to zjednodušuje: schémata zplošťuje a vynucuje pevné pořadí polí. Stejný model, čistší struktura, méně chyb. Orchestrace dělá práci, která se dřív tiše topila v logách.
Taková optimalizace se nedostane do vědeckých prací – je příliš praktická. Ale funguje.
Paralelní provádění: Zrychlení 3–5×, o kterém se nemluví
Většina coding agentů jede po jednom. Požádá o čtení souboru, počká, pak další. Řetězec v cloudu. ForgeCode to otočí: nezávislé volání nástrojů jdou současně přes join_all().
Když agent potřebuje načíst 10 konfiguračních souborů před plánováním, sekvenční agenti udělají 10 kol. ForgeCode jedno. Pro úkoly s průzkumem souborů (což je většina) to znamená 3–5× rychlejší rychlost.
Ve velkém měřítku se to sčítá. Vaši CI/CD agenti, review boti nebo debug nástroje narazí na bottleneck u čtení souborů. Paralelizace není luxus – je to rozdíl mezi dev prostředím a produkcí.
Multi-agent design: Rekurze bez omezení
ForgeCode přichází se třemi specializovanými agenty:
- Forge: Plní úkoly
- Muse: Plánuje sekvence
- Sage: Shání kontext a závislosti
Každý má vlastní instanci modelu, izolovaný kontext a nástroje. Nic nového. Šikovnost je v orchestraci.
Sub-agenti se spouštějí přes paralelní vrstvu, takže jeden orchestrátor může rovnou vytvořit více Forge instancí na podúkoly. A protože sub-agenti spawnují další, delegace jde rekurzivně – ne jen jednu úroveň, ale tak hluboko, jak problém vyžaduje.
Není to žebřík, je to strom.
Tento setup zvládne opravdu složité problémy. Systém deleguje, dokud to má smysl, ne podle umělého limitu.
Čestné limity
ForgeCode se netváří, že je ready na všechno v produkci. Tým otevřeně říká slabiny:
- Žádná trvalá paměť: Sessiony jsou stateless, kontext mezi běhy zmizí.
- Žádné checkpointy: Selže orchestrace uprostřed? Restart od nuly, bez pokračování.
- Menší ekosystém: Cline nebo OpenCode mají víc komunity a integrací.
Pro produkci to nejsou maličkosti. Ale dá se to řešit – a je to upřímné.
Co to znamená pro váš AI stack
ForgeCode ukazuje širší lekci: při honbě za výkonem v AI dev nástrojích se podívejte nejdřív na orchestraci, pak na nové modely.
Pro startupy a týmy s coding agenty to znamená: optimalizujte frameworky, které ovládáte, místo čekání na upgrade modelu. Čistá schémata, paralelizace, rekurzivní delegace – rychle se to sčítá.
Pro cloud hosting (hej, to jsme my) je to připomínka: hosting agentů nejde jen o GPU a latenci inference. Frameworky na vaší infrastruktuře rozhodují víc než surový throughput modelu.
Detaily benchmarku najdete na terminal-bench.com. Chcete vyzkoušet ForgeCode? Instrukce jsou v Tensorlake's Harness.
Model není mrtvý. Ale orchestrace už není v jeho stínu.
Chcete nasadit AI agenty na skalovatelnou infrastrukturu? NameOcean cloud hosting a Vibe Hosting AI vrstva jsou stavěné přesně na tohle. Pojďme si promluvit.