Zyphra、Cohere、Poolside领航开源模型生态多元化新趋势

多元化浪潮的来临

近一年，开源大模型的发布者从原先的少数几家中国厂商，扩展到全球范围内的众多新兴公司。Florian Brand 与 Nathan Lambert 在本期 Artifacts 中指出，Zyphra、Cohere、Poolside 等公司正以不同的动机推动模型开放，形成了“纯模型厂商、巨头企业、产品公司”三大类格局。

关键参与者与动机

纯模型厂商：以技术前沿为目标，直接投入大模型研发。代表包括中国的 DeepSeek、智谱（Zhipu）以及西方的 Zyphra、Poolside、Cohere 等。
巨头企业：如阿里巴巴的 Qwen、Google 的 Gemma、NVIDIA 等，开放模型既是品牌宣传，也是为自家硬件、云服务培育生态。NVIDIA 通过开源 Nemotron‑3‑Ultra（550B）并采用 OpenMDW 许可证，意在刺激 GPU 需求。
产品公司：JetBrains、Zed、Krea、Photoroom 等将模型嵌入自家产品，开源小型专用模型可以降低对闭源模型的依赖，提升产品差异化。

典型模型概览

NVIDIA Nemotron‑3‑Ultra‑550B：采用 LatentMoE 架构，速度领先同类模型；数据集主要来源于开源。
Cohere Command‑A+：218B‑MoE，多模态、多语言、具备 Agent 能力，使用 Apache 2.0 许可，显著提升可商用性。
Zyphra ZAYA1‑74B‑preview：在 AMD GPU 上训练的 74B‑MoE，展示了非英伟达硬件的竞争潜力。
Poolside Laguna‑M.1：同样采用 Apache 2.0，明确表态“开放权重为默认”，承诺持续发布更强模型。
GLM‑5.2（中科院）：虽然是中国团队，但在开放社区中下载量已逼近 GLM‑5，证明开源模型已具备日常生产力。

开放背后的商业逻辑

生态驱动：开放模型能够激活下游开发者、工具链和服务商，形成正向循环，提升硬件和云资源的使用率。
品牌与竞争：在激烈的模型竞争中，开放可以快速树立技术声誉，吸引人才和合作伙伴。
风险分摊：通过共享数据、训练方法和算力，企业能够降低研发成本，避免重复投入。

“限制开源模型的举措不仅难以执行，还会将创新力量集中在少数几家手中，”作者在文中如此警示。

对行业格局的影响

长尾模型的崛起：随着更多中小公司推出专用模型，行业将出现大量细分模型，满足特定垂直场景需求。
前沿竞争的弱化：绝对领先的单一模型将不再是唯一焦点，竞争转向生态丰富度与应用落地速度。
监管与政策的双刃剑：近期 Mythos 事件引发监管关注，或促使部分国家扶持“主权模型”，但整体上开放趋势难以逆转。

展望

如果当前的多元化趋势持续，未来五年内我们可能看到：

更多非英伟达算力的崛起，如 AMD 与国产 GPU 将在模型训练中占据更大份额；
跨域模型融合，如将大语言模型与视觉、音频模型统一为多模态平台；
商业化路径细分，从 SaaS、插件市场到边缘部署，各类盈利模式并行发展。

整体而言，开源模型生态正从“少数几家垄断”转向“全球多元协作”。这一转变不仅提升了技术创新速度，也为行业监管提供了更丰富的治理工具。

本文基于 Substack 付费文章《Artifacts 22》整理，旨在为行业从业者提供客观、可操作的洞察。