Открытая ИИ-машина уровня enterprise: что Laguna XS.2 от Poolside меняет для разработчиков
Когда enterprise-уровень AI становится open source: разбираем Laguna XS.2 от Poolside
Иногда AI-модель честно говорит, для чего её создавали. Это освежает.
Обычно релизы пестрят таблицами бенчмарков, громкими обещаниями и намёками на AGI. А новая Laguna XS.2 от Poolside AI вышла с чистосердечным рассказом. Команда годами строила системы для правительств и оборонных подрядчиков. Там "быстро и сломано" — это повод для аудита безопасности, а не для запуска продукта.
Теперь всё это знание открыто для всех. Под лицензией Apache 2.0.
Почему происхождение важнее цифр в таблицах
До Laguna XS.2 Poolside работал в тени. Air-gapped развертывания. On-premise железо. Уровни допуска, о которых обычные разработчики не задумываются. Это не было гламурно. Надёжность здесь — не фича, а условие выживания.
Открытие модели кажется побочным эффектом их миссии. И именно это делает её крутой. XS.2 не заточена под лидерборды. Она решает настоящие задачи, где сбой недопустим.
Это иной подход, чем в гонке AI-гигантов.
Что именно вы получаете
Модель имеет 33B параметров, из них 3B активны на токен. Её реально запустить. Не теория — на Mac с 36 ГБ RAM потянет. Через Ollama, vLLM или Transformers это практичный open-source инструмент.
Архитектура отражает реальные ограничения:
Эффективное attention: В 30 из 40 слоёв — sliding window attention с per-head gating. KV cache малый, inference быстрый, качество на длинных контекстах не страдает.
Встроенное мышление: Поддержка interleaved thinking между вызовами инструментов. Включаете по запросу — не для всех задач нужен chain-of-thought, но когда надо, он готов.
128K контекст: Хватит на кодбазы, документацию и цепочки рассуждений без исчерпания токенов.
Философия кодинга на первом месте
Poolside видит разницу с мейнстримом: код — основа всего. Агент, который пишет и выполняет код, сам собирает действия. Создаёт инструменты. Взаимодействует с системами глубже, чем через function-calling.
В Laguna XS.2 это не случайность — это суть. Модель обучена на траекториях с сотнями вызовов инструментов. Не на коротких задачах из бенчмарков.
Идеально для автономных агентов в реальных архитектурах.
Бенчмарки без прикрас
XS.2 не рвёт все чарты. Qwen 3.6-35B лучше на SWE-bench. Claude Haiku 4.5 лидирует на Verified.
Но главное: модель держит планку в многоязычном кодинге и на длинных задачах. Их бенчмарки в agent harness — для коротких траекторий. А сильные стороны XS.2 раскрываются в production — на длинных горизонтах, где стандартные тесты слепы.
Как начать прямо сейчас
Через API: Poolside даёт бесплатный доступ на время. Протестируйте XS.2 (открытую) и M.1 (закрытую, 225B) на своих задачах.
Локально: Ollama берёт из коробки. Transformers и vLLM готовы с первого дня для кастомизации.
Для агентов: Есть pool — лёгкий терминал-агент на Agent Client Protocol. Отличный референс для ваших систем.
Почему это важно именно сейчас
AI-мир разделился. С одной стороны — модели для шоу и лидербордов. С другой — enterprise и government, где надёжность важнее очков.
Laguna XS.2 — голос второй стороны. Не самая умная, но самая стабильная для задач, где ошибка стоит дорого.
Разработчикам production-систем с кодогенерацией, агентами или внешними инструментами — это ваш подход.
Веса на HuggingFace. Код открыт. Доки на уровне. Если ждали enterprise-кодинг-модель для запуска и доработки — берите seriously.