Cum feedback-ul în timp real face agenții AI mai buni la cod
Cum construiești agenți AI mai buni pentru programare: feedback-ul în timp real schimbă regulile jocului
Agenții de codare bazați pe inteligență artificială sunt puternici, dar au o problemă comună: uită repede ce s-a întâmplat. Scriu cod, primesc o eroare și apoi se opresc. Nu știu ce fișiere s-au modificat. Nu văd jurnalele de build. Trebuie să le arăți totul de la zero.
Nu e o limitare a modelului. E o limitare a modului în care primește informații.
Observabilitatea care lipsește
Majoritatea sistemelor de agenți tratează observabilitatea ca pe un jurnal pasiv. Scrie ce s-a întâmplat, ca să poți investiga mai târziu. Dar dacă acele date ar intra direct în următoarea decizie a agentului?
Asta face TMA1 v2 – transformă observabilitatea într-o buclă activă de feedback.
Bucla clasică arată așa:
- Agentul decide ce face
- Execută unelte (citește fișiere, rulează comenzi, modifică cod)
- Primește rezultatul
- Repetă
Problema e că nu vede contextul din spatele rezultatului. Nu știe automat dacă build-ul a reușit sau a eșuat. Nu observă dacă altcineva a atins fișierele între timp. Nu știe câte tokeni a consumat.
Context injectat automat
Următoarea generație de unelte rezolvă asta prin injectarea proactivă de informații.
Starea build-ului ajunge direct la agent. Dacă o comandă a eșuat, el vede eroarea imediat, nu în ciclul următor.
Conștientizarea sesiunii îl ajută să știe cât timp rulează, câte apeluri a făcut și când contextul devine prea mare. Atunci poate decide singur să compacteze.
Detectarea schimbărilor de fișiere separă modificările făcute de agent de cele făcute de tine sau de alt agent. Evită confuziile de tipul „nu am văzut că ai modificat fișierul”.
Detectarea anomaliilor semnalează când agentul intră în buclă. De exemplu, când editează același fișier repetat fără ca eroarea să se schimbe sau când contextul depășește 100k tokeni.
Colaborare între agenți fără haos
Când vrei mai mulți agenți să lucreze la același proiect, chat-ul de grup devine ineficient. Prea mult zgomot, prea mult consum de tokeni.
Ceea ce contează e bucla strânsă: planificare → codare → verificare → revizuire → iterație. Agentul A scrie și testează, agentul B revizuiește și trimite problemele înapoi. Agentul A primește informațiile structurate și continuă fără conversații inutile.
Pentru asta e nevoie de un strat comun de observabilitate. Prin API-uri sau servere bazate pe protocol (cum ar fi Model Context Protocol), fiecare agent poate accesa exact ce are nevoie din sesiunea celuilalt.
Cum implementezi bucla de feedback
Trebuie să acoperi câteva puncte esențiale:
Hook-uri la fiecare pas important – la începutul sesiunii, înainte de fiecare prompt, după fiecare execuție de tool și înainte de compactarea contextului.
Atribuire clară a schimbărilor – când un fișier se modifică, sistemul trebuie să știe rapid cine a făcut-o. O fereastră de ±5 secunde în jurul evenimentului de la filesystem, corelată cu tool-urile apelate, rezolvă de obicei problema.
Blocuri de context structurate – nu jurnale libere, ci informații curate și ușor de parsat: metadate de sesiune, statistici de utilizare, fișiere recente, stare build și anomalii detectate.
Integrare cu MCP – un server Model Context Protocol permite agenților să interogheze starea proiectului și sesiunile altor agenți printr-o interfață standardizată.
Ce se schimbă în practică
Când agenții văd ce s-a întâmplat, lucrează diferit. Recuperează mai repede după erori. Evită abordări repetitive. Colaborează mai bine cu oamenii și cu alți agenți. Folosesc mai eficient bugetul de tokeni.
Nu e nevoie ca modelele în sine să se schimbe radical. Schimbarea vine din infrastructura din jurul lor – observabilitatea, buclele de feedback și stratul de coordonare.
Dacă lucrezi cu agenți AI acum, întreabă-te ce observații le lipsesc. Ce context ar schimba cu adevărat următoarea lor decizie? Acolo se ascund cele mai mari câștiguri.