OpenAI发布首款定制推理芯片Jalapeño,显著提升算力效率
•1 阅读•3分钟•前沿
OpenAIBroadcomJalapeño推理芯片
Russell Brandom••1 阅读•3分钟•前沿

背景
OpenAI 长期依赖 Nvidia GPU 进行大模型训练与推理。随着模型规模与实时交互需求的提升,算力成本成为公司利润的重要瓶颈。去年十月,OpenAI 与芯片代工巨头 Broadcom 宣布合作研发专用加速器,随后在本月正式发布了代号 Jalapeño 的首款推理芯片。
芯片概览
- 名称:Jalapeño
- 制造商:Broadcom(代工)
- 定位:仅用于模型推理(Inference),不承担预训练任务
- 设计特点:
- 深度集成 OpenAI 自研的模型调度与内存管理模块
- 专用算子库针对实时编码、代码生成等高频工作负载进行优化
- 低功耗运行模式,针对 24/7 在线服务进行细粒度功耗控制
性能与优势
OpenAI 在内部测试中披露,Jalapeño 在相同功耗下的推理吞吐量比当前最先进的 GPU 加速器提升约 30%,并在每瓦特算力(performance‑per‑watt)上实现双倍增长。具体收益体现在:
- 实时编码模型(如 Codex)响应时间下降 20% 以上
- 成本下降:推理成本预计降低 15%‑25%,对大规模 SaaS 业务的利润空间产生直接正向影响
- 可靠性提升:芯片内部调度与网络堆栈由 OpenAI 端到端设计,减少跨层调度冲突,提升系统整体稳定性
行业影响
Jalapeño 的推出凸显了大模型公司自研硬件的趋势。继 Google、Amazon、Meta 等科技巨头推出自家 AI 加速器后,OpenAI 以“降低对 Nvidia 依赖”为切入点,可能重新塑造 AI 硬件生态链。分析人士认为,若 OpenAI 能在大规模数据中心部署该芯片,将对 GPU 市场形成显著压力,并促使其他模型提供商加速自研或定制化芯片布局。
前景展望
OpenAI 表示,Jalapeño 仍处于测试阶段,近期将在其内部数据中心进行大规模部署。公司计划在未来一年内扩展至面向合作伙伴的商用版本,帮助更多企业降低推理成本。与此同时,OpenAI 也在探索将自研芯片用于更高算力需求的任务,如混合推理‑预训练工作流,但目前仍依赖 Nvidia GPU 进行大模型训练。
“我们不仅在研发前沿模型,也在打造支撑这些模型的底层硬件。”——OpenAI 总裁 Greg Brockman 在公司内部播客中如是说。
Jalapeño 的发布标志着 AI 基础设施进入“软硬协同”新阶段,未来硬件与模型的深度融合将成为提升服务竞争力的关键路径。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。