По-нататък от моделните тегла: Как ForgeCode доказва силата на orchestration layer
По-далеч от моделите: Защо ForgeCode показва, че orchestration е ключът
В света на AI всички са луди по по-големи модели, по-добри weights и нови архитектури. Но ForgeCode току-що хвърли бомба: orchestration слоят е по-важен, отколкото си мислим.
Екипът взе Gemini 3.1 Pro, уви го в архитектурата на ForgeCode – без да докосва модела. Няма fine-tuning, нови параметри или retraining. Само преорганизираха как взаимодейства с tools. Резултатът? От 55% на 80.2% в Terminal-Bench 2.0. 25 точки напред само от по-добрата "инсталация".
Истинският трик: По-добър schema дизайн над моделната сила
Това е супер полезно за разработчици, които пускат code agents.
Когато LLM иска да извика tool – да прочете файл, да пусне команда или да query база данни – генерира JSON с описанието. Лесно, нали? Но повечето frameworks изпращат сложни, nested schemas с хаотичен ред на полетата. Моделът добавя грешни скоби, пропуска нещо или връща чукан JSON. Tool-ът фейлва, започва retry.
ForgeCode изправя schemas и налага фиксиран ред на полетата. Същият модел, по-чиста структура, по-малко грешки. Orchestration слоят върши мръсната работа, която преди се губеше в лог файловете.
Не е нещо за научни статии – твърде практично. Но работи.
Parallel execution: 3-5 пъти по-бързо, без да го споменават
Повечето code agents работят едно по едно. Искат файл, чакат, после следващия. Класически waterfalls. ForgeCode обръща играта: независими tool calls стартират едновременно с join_all().
Ако agent-ът трябва да прочете 10 config файла преди да планира, обикновените правят 10 обхождания. ForgeCode – едно. За задачи с filesystem проверка (които са повечето) печелиш 3-5 пъти скорост.
На голямо мащаб се натрупва. CI/CD агенти, code review ботове, auto-debug инструменти – всички спъват на четене на файлове. Parallel не е лукс, а разлика между dev toy и production реалност.
Multi-agent дизайн: Рекурсия без лимити
ForgeCode идва с три специализирани агента:
- Forge: Изпълнява задачи
- Muse: Планира стъпките
- Sage: Разбира контекста и dependencies
Всеки има свой модел, изолиран context и tools. Нищо ново. Уникалното е orchestration-ът.
Sub-агентите стартират през същия parallel слой – един orchestrator turn може да пусне няколко Forge на субзадачи едновременно. И тъй като sub-агентите могат да раждат нови, веригата отива рекурсивно дълбоко, колкото трябва.
Не е стълба, а дърво.
Хвърляш сложен проблем и системата го разбива естествено. Спира да делегира, когато не е нужно, без изкуствени капачки.
Честните слабости
ForgeCode не се преструва на идеален за production. Екипът признава:
- Без persistent memory: Сесии са stateless, контекстът се губи между runs.
- Без checkpoints: Ако фейлне по средата, започваш от нулата.
- По-малък екосистема: Cline и OpenCode имат повече community и integrations.
Това са сериозни пропуски за големи deployments. Но са реални и решаеми.
Какво значи за твоя AI стек
ForgeCode ни напомня: за performance в AI dev tools гледай orchestration преди нов модел.
За стартъпи и екипи с code agents – оптимизирай frameworks, дето ги контролираш. По-чисти schemas, parallel, рекурсивно делегиране. Ефектът е бърз.
За cloud hosting платформи (като нашата) – hosting на агенти не е само GPU и latency. Frameworks върху инфраструктурата ти правят разликата.
Детайлите от benchmark-а са на terminal-bench.com. За тестове с ForgeCode – гледай Tensorlake's Harness.
Моделите не са мъртви. Но orchestration слоят току-що стана главният герой.
Искаш да deploy-неш AI агенти на стабилна, scalable инфраструктура? NameOcean cloud hosting и Vibe Hosting AI layer са готови за такива задачи. Пиши ни.