OpenAI发布首款定制推理芯片Jalapeño，显著提升算力效率

背景

OpenAI 长期依赖 Nvidia GPU 进行大模型训练与推理。随着模型规模与实时交互需求的提升，算力成本成为公司利润的重要瓶颈。去年十月，OpenAI 与芯片代工巨头 Broadcom 宣布合作研发专用加速器，随后在本月正式发布了代号 Jalapeño 的首款推理芯片。

芯片概览

名称：Jalapeño
制造商：Broadcom（代工）
定位：仅用于模型推理（Inference），不承担预训练任务
设计特点：
- 深度集成 OpenAI 自研的模型调度与内存管理模块
- 专用算子库针对实时编码、代码生成等高频工作负载进行优化
- 低功耗运行模式，针对 24/7 在线服务进行细粒度功耗控制

性能与优势

OpenAI 在内部测试中披露，Jalapeño 在相同功耗下的推理吞吐量比当前最先进的 GPU 加速器提升约 30%，并在每瓦特算力（performance‑per‑watt）上实现双倍增长。具体收益体现在：

实时编码模型（如 Codex）响应时间下降 20% 以上
成本下降：推理成本预计降低 15%‑25%，对大规模 SaaS 业务的利润空间产生直接正向影响
可靠性提升：芯片内部调度与网络堆栈由 OpenAI 端到端设计，减少跨层调度冲突，提升系统整体稳定性

行业影响

Jalapeño 的推出凸显了大模型公司自研硬件的趋势。继 Google、Amazon、Meta 等科技巨头推出自家 AI 加速器后，OpenAI 以“降低对 Nvidia 依赖”为切入点，可能重新塑造 AI 硬件生态链。分析人士认为，若 OpenAI 能在大规模数据中心部署该芯片，将对 GPU 市场形成显著压力，并促使其他模型提供商加速自研或定制化芯片布局。

前景展望

OpenAI 表示，Jalapeño 仍处于测试阶段，近期将在其内部数据中心进行大规模部署。公司计划在未来一年内扩展至面向合作伙伴的商用版本，帮助更多企业降低推理成本。与此同时，OpenAI 也在探索将自研芯片用于更高算力需求的任务，如混合推理‑预训练工作流，但目前仍依赖 Nvidia GPU 进行大模型训练。

“我们不仅在研发前沿模型，也在打造支撑这些模型的底层硬件。”——OpenAI 总裁 Greg Brockman 在公司内部播客中如是说。

Jalapeño 的发布标志着 AI 基础设施进入“软硬协同”新阶段，未来硬件与模型的深度融合将成为提升服务竞争力的关键路径。

OpenAI发布首款定制推理芯片Jalapeño，显著提升算力效率

背景

芯片概览

性能与优势

行业影响

前景展望

标签分类