Cómo coordina Fleet la ejecución paralela de agentes de IA para programar a gran escala

May 24, 2026 ai coding agents claude code parallel execution python task queues ai development tools token optimization beads agent orchestration

Cómo gestionar agentes de IA para programación a gran escala

La revolución de la IA en el desarrollo no depende solo de tener modelos potentes. Lo que realmente marca la diferencia es cómo se coordinan. Un programador descubrió que lanzar más de 50 sesiones de Claude Code al mismo tiempo aceleraba notablemente sus proyectos. La pregunta que surgió fue inevitable: ¿cómo se controla todo eso sin que se convierta en un desastre?

Fleet es la respuesta. Se trata de un supervisor en Python que permite ejecutar varios agentes de IA de forma paralela sin perder el control.

El problema de coordinar varios agentes

Cuando intentas ejecutar varios asistentes de IA al mismo tiempo, el mayor obstáculo no es la potencia de los modelos. Es la coordinación. ¿Qué agente se encarga de cada tarea? ¿Cómo evitas que se pisen entre ellos? ¿Cómo controlas el consumo de tokens cuando varias sesiones están activas a la vez?

La solución más sencilla —abrir sesiones independientes en diferentes carpetas— deja de funcionar rápido. Necesitas un sistema centralizado que entienda las dependencias entre tareas, sus prioridades y el estado del código en todas las sesiones.

La arquitectura de Fleet: centralización inteligente

Fleet resuelve este problema con tres decisiones de diseño muy claras.

Una sola cola para todas las tareas

En lugar de repartir la gestión entre diferentes proyectos, Fleet utiliza una base de datos centralizada llamada beads, respaldada por Git y ubicada en ~/.fleet. Cuando ejecutas fleet bd create, el sistema registra tanto la tarea como la carpeta donde se creó. Cada agente se lanza exactamente en el contexto que necesita.

Esto permite que varios agentes reclamen tareas, trabajen de forma independiente y entreguen resultados sin generar conflictos ni duplicar trabajo.

Soporte para diferentes agentes

Fleet no te obliga a usar un único proveedor. Actualmente funciona con Claude (el más probado), Agy/Antigravity y Codex. Añadir un nuevo agente es cuestión de minutos. Esta flexibilidad es útil porque cada modelo destaca en cosas distintas: unos son mejores en arquitectura y otros en generar código repetitivo.

Control inteligente de la concurrencia

Por defecto, Fleet permite 3 sesiones simultáneas, pero puedes aumentarlo fácilmente:

fleet config set max_concurrent=10

El sistema se encarga de poner en cola las tareas y respetar el límite de concurrencia. El verdadero límite no suele ser Fleet, sino los tokens disponibles en tu suscripción.

Comandos prácticos para el día a día

Fleet ofrece una interfaz de línea de comandos sencilla pero efectiva:

fleet tasks muestra qué está en marcha, qué agente lo está haciendo y cuántos tokens está consumiendo.
fleet task <id> log permite revisar el trabajo realizado.
fleet task <id> plan muestra el enfoque que usará el agente.
fleet config show|set permite ajustar la configuración al vuelo.

Sin paneles complicados. Solo la información que necesitas.

Los tokens son el verdadero límite

La experiencia de quienes usan Fleet de forma intensiva es clara: el cuello de botella no son los agentes, son los tokens. Añadir más agentes solo funciona hasta que se agotan los límites de la suscripción.

Una de las soluciones más efectivas que han encontrado es la rotación de tokens entre varias cuentas de Claude, combinada con una buena higiene de contexto. Muchos descubrieron que sus archivos CLAUDE.md y plugins se cargaban dos veces, duplicando el consumo sin aportar nada. Limpiar estos duplicados tuvo más impacto que aumentar el número de agentes.

Qué significa esto para tu flujo de trabajo

Fleet cambia la forma de pensar en los agentes de IA. En lugar de usarlos como herramientas aisladas, los convierte en miembros de un equipo coordinado.

Esto hace que el desarrollo basado en especificaciones sea más realista: escribes las especificaciones, Fleet reparte las subtareas y los agentes se coordinan a través de la cola compartida. Además, permite experimentar fácilmente comparando diferentes modelos en la misma tarea.

Una implementación sencilla pero efectiva

Lo más interesante de Fleet es que no es complicado. La primera versión era simplemente un bucle en bash que monitorizaba una cola. La versión actual en Python añade lo necesario para manejar flujos reales: dependencias entre tareas, prioridades, límites de concurrencia y gestión del ciclo de vida de los agentes.

Esto demuestra que la infraestructura para ejecutar agentes de IA en paralelo no está limitada por la complejidad técnica, sino por los presupuestos de tokens y por cómo descompones las tareas.

El futuro del desarrollo con múltiples agentes

A medida que los agentes de IA mejoran, la pregunta deja de ser si puedes ejecutar varios a la vez, y pasa a ser si puedes hacerlo de forma eficiente. Fleet responde a ambas.

Los usuarios que más lo aprovechan combinan tres elementos: la ejecución paralela que ofrece Fleet, la descomposición inteligente de tareas (que depende de ti) y la optimización de tokens (que también gestionas tú).

Si ya has superado la etapa de usar un solo agente pero no sabes cómo organizar varios, Fleet es una herramienta que merece la pena probar.

Read in other languages:

RU BG EL CS UZ TR SV FI RO PT PL NB NL HU IT FR DE DA ZH-HANS EN