Cum gestionezi sute de agenți AI care codează simultan: povestea din spatele Fleet
Cum gestionezi mai mulți agenți AI de codare simultan
Revoluția AI în programare nu ține doar de modelele puternice. Ține de coordonare. Când cineva a descoperit că poate rula peste 50 de sesiuni Claude Code în paralel, problema imediată a devenit alta: cum organizezi totul fără haos?
Fleet rezolvă această problemă. E un supervisor Python care transformă execuția paralelă a agenților AI într-un proces controlat.
De ce e greu să rulezi mai mulți agenți odată
Când încerci să pornești mai multe instanțe simultan, coordonarea devine rapid problematică. Cine lucrează la ce? Cum eviți suprapunerile? Și cum ții evidența consumului de tokeni când rulezi zeci de sesiuni?
Abordarea simplă — sesiuni separate în directoare diferite — se prăbușește repede. Ai nevoie de un sistem centralizat care înțelege dependențele și prioritățile sarcinilor.
Arhitectura Fleet: centralizare inteligentă
Fleet se bazează pe trei decizii clare de design.
O singură coadă pentru toate sarcinile
Fleet folosește o bază de date centralizată numită beads, stocată în ~/.fleet. Comanda fleet bd create înregistrează atât task-ul, cât și directorul de lucru. Fiecare agent pornește exact unde trebuie, fără conflicte de merge sau duplicate.
Suport flexibil pentru diferiți agenți
Nu ești blocat la un singur model. Fleet acceptă Claude, Agy/Antigravity și Codex. Poți specifica agentul și modelul pentru fiecare task în parte, ceea ce permite să folosești modelele potrivite pentru tipuri diferite de sarcini.
Control automat al concurenței
Implicit, Fleet rulează maximum 3 agenți simultan. Poți crește limita la 10 sau mai mult prin configurare. Sistemul se ocupă de coadă și de limite automat.
fleet config set max_concurrent=10
fleet bd create --title "Refactor modul autentificare"
Comenzi practice de monitorizare
CLI-ul Fleet oferă informații esențiale fără complexitate inutilă:
fleet tasks— vezi ce rulează, ce agent lucrează și consumul de tokenifleet task <id> log— istoricul acțiunilor agentuluifleet task <id> plan— abordarea planificatăfleet task <id> knowledge— contextul disponibil
Tokenii sunt adevărata limită
Indiferent de câte agenți poți rula tehnic, tokenii rămân constrângerea reală. Dezvoltatorii care folosesc Fleet intensiv au observat că rotirea conturilor și optimizarea contextului au impact mai mare decât adăugarea de agenți suplimentari.
De exemplu, auditarea fișierelor CLAUDE.md a scos la iveală duplicate care dublau consumul de tokeni fără niciun beneficiu.
De ce contează acest model
Fleet schimbă perspectiva: agenții AI nu mai sunt unelte izolate, ci membri coordonați ai unei echipe. Spec-urile detaliate pot fi descompuse automat, iar contextul devine o resursă gestionabilă.
Implementarea inițială a fost de fapt un simplu script bash. Versiunea Python adaugă doar structura necesară pentru dependențe, priorități și gestionarea concurenței. Asta sugerează că infrastructura pentru AI paralel nu e blocată de complexitate tehnică, ci de bugetele de tokeni și de modul în care descompui sarcinile.
Dacă un singur agent nu mai e suficient, Fleet merită încercat. Oferă execuție paralelă — restul depinde de cum descompui tu sarcinile și cum gestionezi tokenii.