Zyphra、Cohere、Poolside领航开源模型生态多元化新趋势
•2 阅读•4分钟•视野
NVIDIACohereZyphraPoolside
Florian Brand••2 阅读•4分钟•视野

多元化浪潮的来临
近一年,开源大模型的发布者从原先的少数几家中国厂商,扩展到全球范围内的众多新兴公司。Florian Brand 与 Nathan Lambert 在本期 Artifacts 中指出,Zyphra、Cohere、Poolside 等公司正以不同的动机推动模型开放,形成了“纯模型厂商、巨头企业、产品公司”三大类格局。
关键参与者与动机
- 纯模型厂商:以技术前沿为目标,直接投入大模型研发。代表包括中国的 DeepSeek、智谱(Zhipu)以及西方的 Zyphra、Poolside、Cohere 等。
- 巨头企业:如阿里巴巴的 Qwen、Google 的 Gemma、NVIDIA 等,开放模型既是品牌宣传,也是为自家硬件、云服务培育生态。NVIDIA 通过开源 Nemotron‑3‑Ultra(550B)并采用 OpenMDW 许可证,意在刺激 GPU 需求。
- 产品公司:JetBrains、Zed、Krea、Photoroom 等将模型嵌入自家产品,开源小型专用模型可以降低对闭源模型的依赖,提升产品差异化。
典型模型概览
- NVIDIA Nemotron‑3‑Ultra‑550B:采用 LatentMoE 架构,速度领先同类模型;数据集主要来源于开源。
- Cohere Command‑A+:218B‑MoE,多模态、多语言、具备 Agent 能力,使用 Apache 2.0 许可,显著提升可商用性。
- Zyphra ZAYA1‑74B‑preview:在 AMD GPU 上训练的 74B‑MoE,展示了非英伟达硬件的竞争潜力。
- Poolside Laguna‑M.1:同样采用 Apache 2.0,明确表态“开放权重为默认”,承诺持续发布更强模型。
- GLM‑5.2(中科院):虽然是中国团队,但在开放社区中下载量已逼近 GLM‑5,证明开源模型已具备日常生产力。
开放背后的商业逻辑
- 生态驱动:开放模型能够激活下游开发者、工具链和服务商,形成正向循环,提升硬件和云资源的使用率。
- 品牌与竞争:在激烈的模型竞争中,开放可以快速树立技术声誉,吸引人才和合作伙伴。
- 风险分摊:通过共享数据、训练方法和算力,企业能够降低研发成本,避免重复投入。
“限制开源模型的举措不仅难以执行,还会将创新力量集中在少数几家手中,”作者在文中如此警示。
对行业格局的影响
- 长尾模型的崛起:随着更多中小公司推出专用模型,行业将出现大量细分模型,满足特定垂直场景需求。
- 前沿竞争的弱化:绝对领先的单一模型将不再是唯一焦点,竞争转向生态丰富度与应用落地速度。
- 监管与政策的双刃剑:近期 Mythos 事件引发监管关注,或促使部分国家扶持“主权模型”,但整体上开放趋势难以逆转。
展望
如果当前的多元化趋势持续,未来五年内我们可能看到:
- 更多非英伟达算力的崛起,如 AMD 与国产 GPU 将在模型训练中占据更大份额;
- 跨域模型融合,如将大语言模型与视觉、音频模型统一为多模态平台;
- 商业化路径细分,从 SaaS、插件市场到边缘部署,各类盈利模式并行发展。
整体而言,开源模型生态正从“少数几家垄断”转向“全球多元协作”。这一转变不仅提升了技术创新速度,也为行业监管提供了更丰富的治理工具。
本文基于 Substack 付费文章《Artifacts 22》整理,旨在为行业从业者提供客观、可操作的洞察。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。