Fleet: Sådan styrer du AI-agenter i stor skala med parallel execution
Sådan styrer du AI-kodningsagenter i stor skala med Fleet
Det handler ikke kun om at have stærke AI-modeller. Det handler om at få dem til at arbejde sammen uden at træde hinanden over tæerne. En udvikler fandt ud af, at 50+ parallelle Claude Code-sessioner kunne speede et projekt gevaldigt op. Spørgsmålet var bare: hvordan holder man styr på det hele uden kaos?
Svaret hedder Fleet – et Python-baseret supervisionsværktøj, der gør parallel AI-udvikling til noget praktisk.
Koordinationsproblemet
Når man kører flere AI-agenter samtidig, støder man hurtigt ind i det samme problem: Hvem laver hvad? Hvordan undgår man, at de overskriver hinandens arbejde? Og hvordan holder man styr på token-forbruget, når flere sessioner kører på én gang?
Den simple løsning med separate Claude-sessioner i forskellige mapper holder ikke. Man har brug for et centralt system, der forstår afhængigheder, prioriteringer og kodens tilstand på tværs af alle agenter.
Fleet's arkitektur: Tre enkle principper
Fleet løser udfordringen med tre gennemtænkte designvalg.
Ét centralt kø-system
I stedet for at sprede opgaverne ud over flere projekter, bruger Fleet en enkelt beads-database i ~/.fleet. Databasen er Git-baseret og holder styr på både opgaven og den mappe, den hører til. Når en agent starter, ved den præcis, hvor den skal arbejde.
Det betyder, at flere agenter kan tage opgaver, arbejde uafhængigt og aflevere resultater uden merge-konflikter eller dobbeltarbejde.
Fleksibel agent-support
Fleet binder dig ikke til én bestemt model. Den understøtter i dag Claude (bedst testet), Agy/Antigravity og Codex. Det tager kun få minutter at tilføje en ny agent, og du kan vælge forskellige codere og modeller til forskellige opgaver.
Intelligent styring af parallelle sessioner
Som standard kører Fleet med maksimalt tre samtidige agenter, men du kan hæve grænsen til ti eller flere:
fleet config set max_concurrent=10
fleet bd create --title "Refactor authentication module"
Fleet sørger selv for at holde grænsen og sætte opgaver i kø. Den reelle begrænsning er ikke softwaren – det er dine token-kvoter.
De vigtigste kommandoer
Fleet har en simpel CLI, der giver dig det nødvendige overblik:
fleet tasksviser aktive opgaver, hvilken agent der arbejder på dem, og token-forbruget i realtidfleet task <id> logviser, hvad agenten rent faktisk har gjortfleet task <id> planviser agentens tilgang, før den udfører opgavenfleet config show|setlader dig justere indstillingerne løbende
Token-økonomi er den reelle begrænsning
Mange brugere opdager hurtigt, at det ikke er antallet af agenter, der sætter grænsen – det er tokens. Løsningen er ofte at rotere mellem flere Claude-konti og holde konteksten stram.
En ofte overset detalje er, at nogle CLAUDE.md-filer og plugin-mapper blev indlæst flere gange, hvilket fordoblede token-forbruget uden nogen gevinst. At rydde op i det havde større effekt end at tilføje flere agenter.
Hvad Fleet betyder for udviklingsarbejdet
Fleet ændrer måden, vi tænker på AI-assisteret udvikling. I stedet for at se agenter som isolerede værktøjer, bliver de til koordinerede team-medlemmer. Specifikationer kan deles ud som delopgaver, kontekst bliver en styrbar ressource, og du kan teste forskellige modeller mod hinanden på samme opgave.
Enkel implementering, stor effekt
Det interessante ved Fleet er, at det ikke er kompliceret. Den oprindelige version var et bash-script, der overvågede en kø. Python-versionen tilføjer bare nok struktur til at håndtere afhængigheder, prioriteter og samtidige sessioner.
Det tyder på, at flaskehalsen ikke er teknisk kompleksitet – det er token-budgetter og evnen til at bryde opgaver ned på den rigtige måde.
Tre ting der skal spille sammen
De udviklere, der bruger Fleet mest, oplever, at gevinsten kommer fra tre ting på én gang: parallel eksekvering via Fleet, intelligent opgavefordeling fra dig, og aktiv token-optimering. Hvis én agent ikke længere er nok, men du mangler et system til at styre flere, er Fleet et værktøj, der er værd at kigge på.