Fleet: como gerenciar agentes de IA em escala sem perder o controle

Fleet: como gerenciar agentes de IA em escala sem perder o controle

Mai 24, 2026 ai coding agents claude code parallel execution python task queues ai development tools token optimization beads agent orchestration

Como Gerenciar Agentes de Código em Paralelo com Fleet

O verdadeiro desafio da revolução dos agentes de IA para programação não está nos modelos em si. Está em coordená-los. Quando alguém descobriu que era possível rodar mais de 50 sessões do Claude Code ao mesmo tempo, a pergunta natural surgiu: como organizar tudo sem virar bagunça?

Fleet é uma ferramenta em Python que responde exatamente isso. Ela transforma a ideia de rodar múltiplos agentes em algo prático e controlável.

O problema de executar vários agentes juntos

Quem já tentou rodar mais de um assistente de código ao mesmo tempo sabe o que acontece. As sessões não conversam entre si. Não há controle sobre qual agente está fazendo o quê. E o consumo de tokens vira um problema rápido quando tudo roda sem supervisão.

A abordagem mais simples — abrir várias janelas do Claude em pastas diferentes — não escala. É preciso algo centralizado que entenda dependências, prioridades e o estado do projeto como um todo.

A arquitetura simples do Fleet

Fleet resolve isso com três decisões de design bem diretas.

Uma única fila para todas as tarefas

Em vez de espalhar o controle por vários projetos, Fleet centraliza tudo em um banco de dados chamado beads, guardado em ~/.fleet. Quando você cria uma tarefa com fleet bd create, o sistema registra tanto o que precisa ser feito quanto em qual pasta isso deve acontecer.

Com isso, vários agentes conseguem pegar tarefas diferentes, trabalhar de forma independente e entregar os resultados sem gerar conflitos ou retrabalho.

Suporte a diferentes provedores

Fleet não prende você a um único modelo. Hoje ele funciona com Claude (o mais testado), Agy/Antigravity e Codex. Adicionar um novo provedor é rápido.

Isso importa porque cada modelo tem seus pontos fortes. Um pode ser melhor em arquitetura, outro em gerar código repetitivo. Com Fleet, você escolhe qual agente usar em cada tarefa.

Controle de concorrência

Por padrão, o sistema permite até 3 agentes rodando ao mesmo tempo. Mas é possível aumentar esse limite:

fleet config set max_concurrent=10

Fleet cuida da fila automaticamente. O limite real costuma ser a cota de tokens da sua assinatura, não a ferramenta.

Comandos úteis do dia a dia

A interface de linha de comando é direta:

  • fleet tasks mostra o que está em andamento e o consumo de tokens
  • fleet task <id> log permite revisar o que cada agente fez
  • fleet task <id> plan revela o plano antes da execução
  • fleet config show|set permite ajustar configurações rapidamente

Sem dashboards complicados. Só o que você precisa ver.

Tokens são o verdadeiro gargalo

Por mais agentes que você rode, o limite acaba sendo sempre o mesmo: tokens. Usuários avançados do Fleet relatam que rotacionam contas do Claude e mantêm uma higiene rigorosa de contexto para evitar desperdício.

Muitos descobriram que arquivos de instruções estavam sendo carregados duas vezes, dobrando o custo sem necessidade. Limpar isso trouxe mais ganho do que simplesmente adicionar mais agentes.

O que isso muda na prática

Fleet mostra uma forma diferente de trabalhar com agentes de código. Em vez de ferramentas isoladas, eles viram parte de um time coordenado.

Você pode escrever especificações detalhadas, dividir o trabalho entre vários agentes e deixar que eles coordenem via fila compartilhada. Cada um recebe apenas o contexto necessário, e você consegue testar diferentes modelos na mesma tarefa para comparar resultados.

Uma implementação que não complica

O interessante é que Fleet não é uma solução complexa. A versão original era basicamente um loop em bash monitorando uma fila. A versão em Python adiciona estrutura suficiente para lidar com dependências, prioridades e limites de execução paralela.

Isso sugere que o obstáculo para rodar agentes em paralelo não é técnico. É econômico (tokens) e organizacional (como dividir bem as tarefas).

Vale a pena testar?

Se você já sente que um único agente não dá conta, mas não sabe como orquestrar vários, Fleet oferece um caminho claro. A ferramenta resolve a parte da execução paralela. O resto — decomposição de tarefas e otimização de tokens — ainda depende de você.

Para quem está nessa fase, vale experimentar.

Read in other languages:

RU BG EL CS UZ TR SV FI RO PL NB NL HU IT FR ES DE DA ZH-HANS EN