Как Fleet заставляет сотни AI-агентов кодить одновременно без хаоса
Как управлять десятками AI-агентов без хаоса: разбор Fleet
Мало просто иметь сильную модель. Главное — правильно организовать работу нескольких агентов одновременно. Один разработчик попробовал запустить больше 50 сессий Claude Code параллельно и понял: без системы это быстро превращается в беспорядок.
Так появился Fleet — Python-инструмент, который берёт на себя координацию множества агентов.
Почему просто запустить несколько агентов не работает
При одновременной работе нескольких AI-помощников сразу возникают вопросы. Кто за что отвечает? Как избежать дублирования? Как отслеживать расход токенов, когда сессии жгут контекст независимо друг от друга?
Если просто открыть отдельные окна терминала в разных папках, ничего хорошего не выйдет. Нужен единый механизм, который знает про зависимости между задачами, приоритеты и текущее состояние проекта.
Как устроен Fleet
В основе — три простых решения.
Централизованная очередь задач
Fleet хранит все задачи в базе beads внутри ~/.fleet. Это git-репозиторий, который выступает единым источником правды. При создании задачи через fleet bd create сохраняется не только описание, но и рабочая директория. Каждый агент получает контекст именно там, где нужно работать.
Благодаря этому несколько агентов могут брать задачи, выполнять их и передавать результаты без конфликтов.
Поддержка разных моделей
Fleet не привязан к одному провайдеру. Сейчас работают Claude, Agy и Codex. При создании задачи можно указать, какой агент и какая модель должны её выполнять. Это удобно: для архитектурных решений можно взять Claude, а для шаблонного кода — более быструю модель.
Ограничение параллельности
По умолчанию одновременно работают три агента. При необходимости лимит поднимается:
fleet config set max_concurrent=10
Fleet сам ставит задачи в очередь и запускает их по мере освобождения слотов. Главное ограничение здесь — не количество агентов, а лимиты по токенам в подписке.
Что даёт CLI
Fleet показывает только необходимое:
fleet tasks— список активных задач и расход токеновfleet task <id> log— что именно сделал агентfleet task <id> plan— план работы перед запускомfleet task <id> knowledge— какой контекст был доступен
Никаких тяжёлых интерфейсов. Только нужные команды.
Токены — главный лимит
На практике разработчики быстро упираются не в возможности Fleet, а в расход токенов. Решение — использовать несколько аккаунтов и следить за чистотой контекста. Оказалось, что некоторые CLAUDE.md и плагины загружались дважды, зря тратя токены. Удаление дубликатов дало больший эффект, чем запуск дополнительных агентов.
Что это меняет
Fleet позволяет работать с AI-агентами как с командой:
- Можно разбивать большую задачу на подзадачи и раздавать их разным агентам
- Каждый агент получает только нужный контекст
- Легко сравнивать результаты разных моделей на одной и той же задаче
Простота реализации
Интересно, что изначально Fleet был обычным bash-скриптом, который следил за очередью. Python-версия добавила только необходимое: поддержку зависимостей, приоритетов и управление жизненным циклом агентов.
Это показывает, что сложность здесь не в коде, а в грамотном разбиении задач и контроле расходов на токены.
Итог
Fleet решает задачу запуска множества AI-агентов. Но реальный результат зависит от трёх факторов: самого инструмента, качества декомпозиции задач и оптимизации токенов. Если одного агента уже недостаточно, Fleet — один из способов организовать их совместную работу.