Fleet’s AI-coders: zo schaal je honderden agents tegelijk

Mei 24, 2026 ai coding agents claude code parallel execution python task queues ai development tools token optimization beads agent orchestration

Parallel AI-agents beheren zonder chaos: hoe Fleet werkt

De echte uitdaging bij AI-gestuurd programmeren is niet de kracht van de modellen, maar hoe je ze samen laat werken. Eén ontwikkelaar merkte dat hij met vijftig Claude-sessies tegelijk veel sneller vooruitkwam. De vraag die daarop volgde: hoe voorkom je dat alles in de war loopt?

Fleet is een Python-tool die dat probleem aanpakt. Het fungeert als centrale aanstuurder voor meerdere AI-agents tegelijk.

Waarom losse sessies niet werken

Zodra je meer dan een paar agents tegelijk draait, ontstaan dezelfde problemen telkens weer. Wie doet wat? Hoe voorkom je dat agents elkaar in de weg zitten? En hoe houd je het tokenverbruik nog enigszins in de hand?

Simpelweg aparte Claude-sessies in verschillende mappen starten, werkt al snel niet meer. Je hebt een centraal systeem nodig dat weet welke taken er liggen, waar ze horen en wat de status van het project is.

Drie ontwerpkeuzes die Fleet eenvoudig houden

Fleet lost dit op met een paar gerichte keuzes.

Eén centrale takenlijst
Alle taken komen terecht in een database die in ~/.fleet staat. Deze is gekoppeld aan Git, zodat je altijd een duidelijke historie hebt. Elke taak onthoudt ook in welke map hij thuishoort. Zo weet een agent meteen waar hij moet werken. Meerdere agents kunnen taken oppakken zonder dat ze elkaar dupliceren of bestanden kapotmaken.

Ondersteuning voor verschillende modellen
Fleet is niet gekoppeld aan één provider. Claude werkt het meest stabiel, maar ook Agy en Codex worden ondersteund. Je kunt per taak aangeven welk model moet worden gebruikt. Dat is handig als je bijvoorbeeld Claude wilt inzetten voor architectuur en een ander model voor routinewerk.

Automatische limiet op gelijktijdige agents
Standaard draait Fleet maximaal drie agents tegelijk. Dat aantal kun je verhogen tot tien of meer via de configuratie. Fleet houdt zelf bij welke taken nog moeten wachten. De echte beperking is meestal niet de tool, maar je API-limieten.

Handige commando’s voor dagelijks gebruik

De CLI houdt het overzichtelijk:

fleet tasks toont lopende taken, welke agent eraan werkt en hoeveel tokens er worden verbruikt.
fleet task <id> log laat zien wat een agent precies heeft gedaan.
fleet task <id> plan toont het plan voordat de agent begint.
fleet config set max_concurrent=10 past de limiet direct aan.

Geen ingewikkelde dashboards, alleen de informatie die je nodig hebt.

Tokens zijn de echte bottleneck

Meer agents draaien klinkt aantrekkelijk, maar stuit al snel op tokenlimieten. Ervaren gebruikers draaien daarom met meerdere accounts en letten scherp op wat ze in hun context laden. Dubbele CLAUDE.md-bestanden of overbodige plugins kosten onnodig veel tokens. Opruimen daar heeft vaak meer effect dan simpelweg meer agents toevoegen.

Wat Fleet betekent voor je workflow

Fleet laat zien dat AI-agents geen losse tools hoeven te zijn, maar onderdeel kunnen worden van een gecoördineerd proces. Je schrijft een specificatie, Fleet verdeelt de subtaken en agents werken via een gedeelde wachtrij samen. Context wordt een beheersbare resource in plaats van een rommelige verzameling.

De onderliggende code is verrassend eenvoudig. De eerste versie was zelfs een bash-script. De Python-versie voegt net genoeg structuur toe om afhankelijkheden, prioriteiten en gelijktijdige uitvoering netjes te regelen.

Conclusie

Fleet lost niet alles op, maar maakt het mogelijk om meerdere AI-agents efficiënt in te zetten. De winst zit uiteindelijk in drie dingen: parallelle uitvoering via Fleet, slimme taakverdeling door jou, en zuinig omgaan met tokens. Als één agent niet meer genoeg is, is Fleet een logische volgende stap.

Read in other languages:

RU BG EL CS UZ TR SV FI RO PT PL NB HU IT FR ES DE DA ZH-HANS EN