企业级AI开源了！Poolside Laguna XS.2 对开发者意味着啥

四月 29, 2026 ai models open source agent development code generation machine learning model architecture llms software development

企业级AI开源了：Poolside的Laguna XS.2内幕

有些AI模型特别实诚，一上来就告诉你它是为啥生的。

不像大多数发布，总爱甩出一堆benchmark表格、吹嘘性能、许诺AGI指日可待。Poolside AI的Laguna XS.2不一样。它直接分享了团队这些年给政府和军工巨头建AI系统的老底子——那种地方，“快迭代、爱搞砸”只会换来安全审计，而不是产品上线。

现在，他们把经验全开源了。Apache 2.0许可，人人都能用。

Laguna XS.2发布前，Poolside干的都是隐秘活儿。空气隔离部署。本地基础设施。高清访问权限，普通开发者想都不敢想。这活儿不光鲜，但可靠性是命根子，一点马虎不得。

公开XS.2好像只是顺手的事儿。但正因如此，才有看头。这模型不是冲着排行榜设计的。它是为那些零容忍失败的硬骨头问题量身打造。

这跟当下AI军备赛的设计思路，天差地别。

总参数33B，每次token只激活3B。XS.2真能跑起来。不是纸上谈兵——一台36GB RAM的Mac就行。用Ollama、vLLM或Transformers，部署超简单。

架构选择全是实战考虑：

高效attention：40层里有30层用滑动窗口attention，加每个head的门控。KV cache需求低，推理快，长上下文质量不掉链子。

原生推理：支持工具调用间的交错思考。按任务开关，不用时关掉，省资源；需要时，直接来chain-of-thought。

128K上下文：塞下大代码库、文档和推理链，不愁token爆。

Poolside跟主流不一样：他们觉得编程是agent万能钥匙。

会写代码、执行代码的agent，就能自组动作。自建工具。跟系统互动，纯函数调用比不了。这在XS.2里不是巧合，是核心理念。

如果你搞自主问题解决的AI系统，这思路完美贴合。模型训练时用上百工具调用的长序列，不是benchmark常见的短任务。

XS.2没横扫所有榜单。Qwen 3.6-35B在标准SWE-bench上略胜一筹。Claude Haiku 4.5在Verified版领跑。

但关键是：它在多语言编程任务上站稳脚跟，长序列问题也靠谱。Poolside自家agent框架测的还是短任务。这模型的优势不在那儿。

真金白银的考验，是生产环境的长序列agent表现——benchmark套不上的那种。

API试水：Poolside限时免费API。速评XS.2（开源版）和Laguna M.1（225B闭源版），用你自己的活儿测。

本地跑：Ollama开箱即用。Transformers和vLLM当天支持，定制灵活。

Agent工具：他们推了pool，轻量终端agent，基于Agent Client Protocol。建agent系统？这有现成参考。

AI圈子两极分化。一边是冲leaderboard和病毒demo的消费模型。一边是政府企业系，靠谱第一，分数其次。

XS.2就是后者开口说话。它不求最聪明，只求在真金白银任务上最稳。

对搞生产系统的开发者——尤其代码生成、自主agent或外部工具集成——这哲学实用多了。

权重在HuggingFace。代码开源。文档靠谱。如果你等企业级编程模型，能自己跑改，这值得认真瞧瞧。

Read in other languages:

RU BG EL CS UZ TR SV FI RO PT PL NB NL HU IT FR ES DE DA EN