Cum gestionezi sute de agenți AI care codează simultan: povestea din spatele Fleet

Mai 24, 2026 ai coding agents claude code parallel execution python task queues ai development tools token optimization beads agent orchestration

Cum gestionezi mai mulți agenți AI de codare simultan

Revoluția AI în programare nu ține doar de modelele puternice. Ține de coordonare. Când cineva a descoperit că poate rula peste 50 de sesiuni Claude Code în paralel, problema imediată a devenit alta: cum organizezi totul fără haos?

Fleet rezolvă această problemă. E un supervisor Python care transformă execuția paralelă a agenților AI într-un proces controlat.

De ce e greu să rulezi mai mulți agenți odată

Când încerci să pornești mai multe instanțe simultan, coordonarea devine rapid problematică. Cine lucrează la ce? Cum eviți suprapunerile? Și cum ții evidența consumului de tokeni când rulezi zeci de sesiuni?

Abordarea simplă — sesiuni separate în directoare diferite — se prăbușește repede. Ai nevoie de un sistem centralizat care înțelege dependențele și prioritățile sarcinilor.

Arhitectura Fleet: centralizare inteligentă

Fleet se bazează pe trei decizii clare de design.

O singură coadă pentru toate sarcinile

Fleet folosește o bază de date centralizată numită beads, stocată în ~/.fleet. Comanda fleet bd create înregistrează atât task-ul, cât și directorul de lucru. Fiecare agent pornește exact unde trebuie, fără conflicte de merge sau duplicate.

Suport flexibil pentru diferiți agenți

Nu ești blocat la un singur model. Fleet acceptă Claude, Agy/Antigravity și Codex. Poți specifica agentul și modelul pentru fiecare task în parte, ceea ce permite să folosești modelele potrivite pentru tipuri diferite de sarcini.

Control automat al concurenței

Implicit, Fleet rulează maximum 3 agenți simultan. Poți crește limita la 10 sau mai mult prin configurare. Sistemul se ocupă de coadă și de limite automat.

fleet config set max_concurrent=10
fleet bd create --title "Refactor modul autentificare"

Comenzi practice de monitorizare

CLI-ul Fleet oferă informații esențiale fără complexitate inutilă:

fleet tasks — vezi ce rulează, ce agent lucrează și consumul de tokeni
fleet task <id> log — istoricul acțiunilor agentului
fleet task <id> plan — abordarea planificată
fleet task <id> knowledge — contextul disponibil

Tokenii sunt adevărata limită

Indiferent de câte agenți poți rula tehnic, tokenii rămân constrângerea reală. Dezvoltatorii care folosesc Fleet intensiv au observat că rotirea conturilor și optimizarea contextului au impact mai mare decât adăugarea de agenți suplimentari.

De exemplu, auditarea fișierelor CLAUDE.md a scos la iveală duplicate care dublau consumul de tokeni fără niciun beneficiu.

De ce contează acest model

Fleet schimbă perspectiva: agenții AI nu mai sunt unelte izolate, ci membri coordonați ai unei echipe. Spec-urile detaliate pot fi descompuse automat, iar contextul devine o resursă gestionabilă.

Implementarea inițială a fost de fapt un simplu script bash. Versiunea Python adaugă doar structura necesară pentru dependențe, priorități și gestionarea concurenței. Asta sugerează că infrastructura pentru AI paralel nu e blocată de complexitate tehnică, ci de bugetele de tokeni și de modul în care descompui sarcinile.

Dacă un singur agent nu mai e suficient, Fleet merită încercat. Oferă execuție paralelă — restul depinde de cum descompui tu sarcinile și cum gestionezi tokenii.

Read in other languages:

RU BG EL CS UZ TR SV FI PT PL NB NL HU IT FR ES DE DA ZH-HANS EN