AI agenti, kteří se učí za běhu: proč zpětná vazba mění pravidla hry
Jak real-time zpětná vazba mění AI coding agenty
AI coding asistenty dnes umí hodně, ale pořád potřebují dohled. Napíšou kód, narazí na chybu a pak čekají. Samy si nepamatují, co selhalo, a neví, které soubory se změnily. To není problém modelu samotného, ale způsobu, jakým k němu data proudí zpět.
Observability, která se vrací do rozhodování
Většina frameworků pro agenty bere observability jako nástroj pro vývojáře. Logy se ukládají, abyste je mohli později prozkoumat. Jenže co kdyby se ta data automaticky dostala zpět do dalšího cyklu agenta?
Právě na tom staví nástroje jako TMA1 v2. Místo pasivního sledování se observability stává aktivní součástí rozhodování.
Klasický agent loop vypadá takto: agent se rozhodne, spustí nástroje, dostane výsledek a opakuje. Problém je, že nevidí kontext kolem toho výsledku. Neví, jestli build prošel, kolik tokenů už spálil, nebo jestli se soubor změnil někým jiným.
Co by měl agent vidět automaticky
Nová generace nástrojů proto vkládá kontext přímo do promptu, aniž by agent musel explicitně žádat:
- Stav buildu – prošel nebo selhal, jaké chyby se objevily
- Session awareness – jak dlouho běží, kolik tool callů provedl, jestli se blíží limit kontextu
- Detekce změn souborů – kdo upravil soubor – agent, vy, nebo jiný proces
- Anomálie – opakované selhání stejného přístupu, příliš rychle rostoucí kontext, neočekávané změny zvenčí
Když systém tyto vzorce zachytí, může agenta navést k jiné strategii dřív, než se zacyklí.
Koordinace více agentů bez zbytečného hluku
U větších projektů často potřebujete, aby na kódu pracovalo několik agentů najednou. Klasický group chat ale selhává – přináší příliš mnoho šumu a zbytečně vysoké náklady. Kódování je spíš lineární proces: plán, implementace, ověření, revize, iterace.
Lepší přístup je sdílená observability vrstva. Agent A dokončí úkol, agent B zkontroluje výsledek a vrátí strukturovanou zpětnou vazbu přímo do kontextu agenta A. Bez zbytečného chatování přes API.
To vyžaduje standardizovaný přístup – například přes Model Context Protocol (MCP), kde si agenti mohou vzájemně dotahovat relevantní data.
Co je potřeba implementovat
Aby feedback loop fungoval spolehlivě, potřebujete:
- Hooky na klíčových místech – při startu session, před každým promptem, po tool execution i před compactionem
- Atribuci změn – rychle určit, kdo změnil soubor (obvykle stačí porovnat čas tool callu s fsnotify eventem)
- Strukturované kontextové bloky – ne volné logy, ale čistá data, která agent dokáže snadno zpracovat
- MCP server – jednotný rozhraní pro dotazování na stav projektu, build i sessiony ostatních agentů
Co se změní v praxi
Když agenti vidí, co se právě stalo, chovají se jinak. Rychleji se vzpamatují z chyb, přestanou opakovat nefunkční přístupy, lépe spolupracují s ostatními a efektivněji hospodaří s tokeny.
Nejde o to, že by se modely dramaticky zlepšily. Jde o infrastrukturu kolem nich – o observability, která se vrací zpět do rozhodování.
Pokud dnes s AI agenty pracujete, zkuste se ptát: jaké informace jim teď chybí? Jaký kontext by skutečně ovlivnil jejich další krok? Tam se často skrývá největší prostor pro zlepšení.