企业级AI开源了!Poolside Laguna XS.2 对开发者意味着啥

企业级AI开源了!Poolside Laguna XS.2 对开发者意味着啥

四月 29, 2026 ai models open source agent development code generation machine learning model architecture llms software development

企业级AI开源了:Poolside的Laguna XS.2内幕

有些AI模型特别实诚,一上来就告诉你它是为啥生的。

不像大多数发布,总爱甩出一堆benchmark表格、吹嘘性能、许诺AGI指日可待。Poolside AI的Laguna XS.2不一样。它直接分享了团队这些年给政府和军工巨头建AI系统的老底子——那种地方,“快迭代、爱搞砸”只会换来安全审计,而不是产品上线。

现在,他们把经验全开源了。Apache 2.0许可,人人都能用。

血统比分数靠谱

Laguna XS.2发布前,Poolside干的都是隐秘活儿。空气隔离部署。本地基础设施。高清访问权限,普通开发者想都不敢想。这活儿不光鲜,但可靠性是命根子,一点马虎不得。

公开XS.2好像只是顺手的事儿。但正因如此,才有看头。这模型不是冲着排行榜设计的。它是为那些零容忍失败的硬骨头问题量身打造。

这跟当下AI军备赛的设计思路,天差地别。

你能拿到啥

总参数33B,每次token只激活3B。XS.2真能跑起来。不是纸上谈兵——一台36GB RAM的Mac就行。用Ollama、vLLM或Transformers,部署超简单。

架构选择全是实战考虑:

高效attention:40层里有30层用滑动窗口attention,加每个head的门控。KV cache需求低,推理快,长上下文质量不掉链子。

原生推理:支持工具调用间的交错思考。按任务开关,不用时关掉,省资源;需要时,直接来chain-of-thought。

128K上下文:塞下大代码库、文档和推理链,不愁token爆。

编程为王的设计

Poolside跟主流不一样:他们觉得编程是agent万能钥匙。

会写代码、执行代码的agent,就能自组动作。自建工具。跟系统互动,纯函数调用比不了。这在XS.2里不是巧合,是核心理念。

如果你搞自主问题解决的AI系统,这思路完美贴合。模型训练时用上百工具调用的长序列,不是benchmark常见的短任务。

基准分数实话实说

XS.2没横扫所有榜单。Qwen 3.6-35B在标准SWE-bench上略胜一筹。Claude Haiku 4.5在Verified版领跑。

但关键是:它在多语言编程任务上站稳脚跟,长序列问题也靠谱。Poolside自家agent框架测的还是短任务。这模型的优势不在那儿。

真金白银的考验,是生产环境的长序列agent表现——benchmark套不上的那种。

马上上手

API试水:Poolside限时免费API。速评XS.2(开源版)和Laguna M.1(225B闭源版),用你自己的活儿测。

本地跑:Ollama开箱即用。Transformers和vLLM当天支持,定制灵活。

Agent工具:他们推了pool,轻量终端agent,基于Agent Client Protocol。建agent系统?这有现成参考。

为什么现在重要

AI圈子两极分化。一边是冲leaderboard和病毒demo的消费模型。一边是政府企业系,靠谱第一,分数其次。

XS.2就是后者开口说话。它不求最聪明,只求在真金白银任务上最稳。

对搞生产系统的开发者——尤其代码生成、自主agent或外部工具集成——这哲学实用多了。

权重在HuggingFace。代码开源。文档靠谱。如果你等企业级编程模型,能自己跑改,这值得认真瞧瞧。

Read in other languages:

RU BG EL CS UZ TR SV FI RO PT PL NB NL HU IT FR ES DE DA EN