Fleet: como gerenciar agentes de IA em escala sem perder o controle
Como Gerenciar Agentes de Código em Paralelo com Fleet
O verdadeiro desafio da revolução dos agentes de IA para programação não está nos modelos em si. Está em coordená-los. Quando alguém descobriu que era possível rodar mais de 50 sessões do Claude Code ao mesmo tempo, a pergunta natural surgiu: como organizar tudo sem virar bagunça?
Fleet é uma ferramenta em Python que responde exatamente isso. Ela transforma a ideia de rodar múltiplos agentes em algo prático e controlável.
O problema de executar vários agentes juntos
Quem já tentou rodar mais de um assistente de código ao mesmo tempo sabe o que acontece. As sessões não conversam entre si. Não há controle sobre qual agente está fazendo o quê. E o consumo de tokens vira um problema rápido quando tudo roda sem supervisão.
A abordagem mais simples — abrir várias janelas do Claude em pastas diferentes — não escala. É preciso algo centralizado que entenda dependências, prioridades e o estado do projeto como um todo.
A arquitetura simples do Fleet
Fleet resolve isso com três decisões de design bem diretas.
Uma única fila para todas as tarefas
Em vez de espalhar o controle por vários projetos, Fleet centraliza tudo em um banco de dados chamado beads, guardado em ~/.fleet. Quando você cria uma tarefa com fleet bd create, o sistema registra tanto o que precisa ser feito quanto em qual pasta isso deve acontecer.
Com isso, vários agentes conseguem pegar tarefas diferentes, trabalhar de forma independente e entregar os resultados sem gerar conflitos ou retrabalho.
Suporte a diferentes provedores
Fleet não prende você a um único modelo. Hoje ele funciona com Claude (o mais testado), Agy/Antigravity e Codex. Adicionar um novo provedor é rápido.
Isso importa porque cada modelo tem seus pontos fortes. Um pode ser melhor em arquitetura, outro em gerar código repetitivo. Com Fleet, você escolhe qual agente usar em cada tarefa.
Controle de concorrência
Por padrão, o sistema permite até 3 agentes rodando ao mesmo tempo. Mas é possível aumentar esse limite:
fleet config set max_concurrent=10
Fleet cuida da fila automaticamente. O limite real costuma ser a cota de tokens da sua assinatura, não a ferramenta.
Comandos úteis do dia a dia
A interface de linha de comando é direta:
fleet tasksmostra o que está em andamento e o consumo de tokensfleet task <id> logpermite revisar o que cada agente fezfleet task <id> planrevela o plano antes da execuçãofleet config show|setpermite ajustar configurações rapidamente
Sem dashboards complicados. Só o que você precisa ver.
Tokens são o verdadeiro gargalo
Por mais agentes que você rode, o limite acaba sendo sempre o mesmo: tokens. Usuários avançados do Fleet relatam que rotacionam contas do Claude e mantêm uma higiene rigorosa de contexto para evitar desperdício.
Muitos descobriram que arquivos de instruções estavam sendo carregados duas vezes, dobrando o custo sem necessidade. Limpar isso trouxe mais ganho do que simplesmente adicionar mais agentes.
O que isso muda na prática
Fleet mostra uma forma diferente de trabalhar com agentes de código. Em vez de ferramentas isoladas, eles viram parte de um time coordenado.
Você pode escrever especificações detalhadas, dividir o trabalho entre vários agentes e deixar que eles coordenem via fila compartilhada. Cada um recebe apenas o contexto necessário, e você consegue testar diferentes modelos na mesma tarefa para comparar resultados.
Uma implementação que não complica
O interessante é que Fleet não é uma solução complexa. A versão original era basicamente um loop em bash monitorando uma fila. A versão em Python adiciona estrutura suficiente para lidar com dependências, prioridades e limites de execução paralela.
Isso sugere que o obstáculo para rodar agentes em paralelo não é técnico. É econômico (tokens) e organizacional (como dividir bem as tarefas).
Vale a pena testar?
Se você já sente que um único agente não dá conta, mas não sabe como orquestrar vários, Fleet oferece um caminho claro. A ferramenta resolve a parte da execução paralela. O resto — decomposição de tarefas e otimização de tokens — ainda depende de você.
Para quem está nessa fase, vale experimentar.