Ponad same wagi modeli: Jak ForgeCode pokazuje siłę warstwy orkiestracji
Po co ważyć modele, skoro liczy się orkiestracja? ForgeCode pokazuje, jak to działa
W świecie AI wszyscy gonią za większymi modelami i lepszymi wagami. ForgeCode wbija szpilę w ten balon. Orkiestracja ma większe znaczenie, niż myślisz.
Zespół wziął Gemini 3.1 Pro i opakował go w swoją architekturę. Bez dotykania modelu. Zero fine-tuningu, nowych parametrów czy retreningu. Zmieniли tylko sposób, w jaki komunikuje się z narzędziami. Efekt? Wynik na Terminal-Bench 2.0 skoczył z 55% do 80,2%. 25 punktów czystego zysku dzięki lepszej organizacji.
Klucz do sukcesu: Proste schematy ponad moc modelu
Dla deweloperów budujących agentów kodujących to złoto.
LLM woła narzędzie – odczyt pliku, komenda, zapytanie do bazy. Generuje JSON z opisem. Proste? Nie zawsze. Standardowe frameworki pakują to w zagnieżdżone struktury z chaotycznym porządkiem pól. Model dodaje zbędne nawiasy, gubi pole albo psuje format. Wywołanie pada. Pętla powtórek rusza.
ForgeCode prostuje te schematy. Narzuca stały porządek pól w każdym żądaniu. Ten sam model, czystszy JSON, mniej błędów. Orkiestracja robi robotę, której wcześniej nie widać w logach.
To praktyczne triki. Nie trafiają do papierów naukowych, ale działają.
Wykonanie równoległe: Przyspieszenie x3–5, o którym mało kto mówi
Większość agentów kodujących działa po kolei. Żądanie odczytu pliku, czekanie, następne. Kaskady w chmurze. ForgeCode odwraca to do góry nogami: niezależne wywołania narzędzi lecą naraz dzięki join_all().
Agent musi odczytać 10 plików konfiguracyjnych przed planem? Sekwencyjne robi 10 rund. ForgeCode – jedną. Dla zadań zaczynających się od rekonesansu plików (a tak jest w większości) to 3–5 razy szybciej.
Na dużą skalę to mnoży się. Agenci w CI/CD, boty do code review, debuggery – wszystkie duszą się na odczytach plików. Równoległość to nie fanaberia. To granica między prototypem a produkcją.
Multi-agent: Rekursja bez limitów
ForgeCode ma trzech specjalistów:
- Forge: Wykonuje zadania
- Muse: Planuje kroki
- Sage: Bada kontekst i zależności
Każdy z własnym modelem, oknem kontekstu i narzędziami. Nic nowego. Sztuka w orkiestracji.
Sub-agenci rodzą się przez warstwę równoległą. Jeden obrót orkiestratora uruchamia wiele Forge na podzadaniach naraz. A sub-agenci rodzą sub-agentów. Delegacja idzie rekursywnie, tak głęboko, jak trzeba.
To drzewo, nie drabina.
Rzucasz skomplikowany problem – system rozkłada go sam. Zatrzymuje delegację, gdy nie ma sensu, nie na siłę.
Szczere wady
ForgeCode nie udaje ideału. Zespół wymienia braki:
- Brak pamięci trwałej: Sesje bez stanu. Kontekst ginie między uruchomieniami.
- Bez checkpointów: Awaria w pół drogi? Start od zera. Zero wznowień.
- Mały ekosystem: Cline czy OpenCode mają więcej integracji i wsparcia społeczności.
Dla produkcji to poważne dziury. Ale da się je załatać. I ekipa jest z tym szczera.
Co to znaczy dla twojego stacku AI
ForgeCode uczy: przed nowym modelem popraw orkiestrację.
Dla startupów z agentami kodującymi to zielone światło. Optymalizuj frameworki, które kontrolujesz. Proste schematy. Równoległość. Rekursja. Zyski rosną lawinowo.
Dla platform hostingowych (hej, to my) przypomnienie: hosting agentów to nie tylko GPU i latencja. Frameworki na twojej infrastrukturze decydują bardziej niż surowa moc.
Szczegóły benchmarków na terminal-bench.com. Chcesz testować ForgeCode? Instrukcje w Tensorlake's Harness.
Model nie umarł. Ale orkiestracja właśnie przejęła główną rolę.
Chcesz hostować AI agentów na solidnej, skalowalnej infrastrukturze? Platforma NameOcean i warstwa Vibe Hosting AI są do tego stworzone. Porozmawiajmy.