Uber扩约使用AWS AI芯片 推动出行平台加速Arm算力布局

45 阅读3分钟视野
Uber扩约使用AWS AI芯片 推动出行平台加速Arm算力布局

合同扩展概览

TechCrunch 2026 年 4 月 7 日报道,Uber 正式扩大与亚马逊 AWS 的合作范围,计划在更多出行业务模块上迁移至 AWS 的 Graviton ARM 服务器,并开启对 Trainium 3 AI 加速卡的试点。该合作不仅是对其 2023 年与 Oracle、Google 的多云布局的调整,也被视为亚马逊利用自研 AI 芯片抢占云端算力市场的关键一步。

背景回顾

  • 2023 年,Uber 为摆脱自建数据中心的高成本,签署了与 Oracle Cloud Infrastructure(OCI)和 Google Cloud Platform 的多年度云服务协议,重点引入了 Ampere 生产的 ARM 处理器。
  • Ampere 由前英特尔高管 Renee James 创建,后被软银收购,Oracle 随后以约 27 亿美元的收益出售持股。该公司在 ARM 服务器市场的成功促成了云厂商对 ARM 架构的兴趣。
  • AWS Graviton 系列是亚马逊自研的低功耗 ARM 服务器 CPU,已在多种高并发业务中证明了成本与性能优势。
  • Trainium 系列则是 AWS 为大模型训练和推理专门打造的 AI 加速卡,定位为 Nvidia 的直接竞争者。

本次合作的关键要点

  • 扩大 Gravitan 使用:Uber 将在实时定价、路径规划等核心服务上迁移至基于 Graviton 的实例,预计可降低约 20% 的计算成本。
  • 试点 Trainium 3:针对需求波动大的机器学习工作负载(如需求预测、动态调度),Uber 将在限定区域部署 Trainium 3,加速模型推理并评估其性价比。
  • 竞争格局:此举向 Google Cloud 与 Oracle Cloud 发出“挑衅”,表明 AWS 正通过芯片差异化抢夺原本已在竞争对手云上的关键业务。

行业影响分析

  1. Arm 算力加速普及 随着 Graviton 与 Trainium 的双线布局,更多传统 x86 为主的企业级工作负载有望迁移至更节能的 ARM 生态,推动整个云计算行业的算力结构重塑。
  2. AI 芯片竞争升级 AWS 宣称 Trainium 已成为“数十亿美元业务”,若 Uber 的试点成功,将为 AWS 在大模型训练市场提供宝贵案例,进一步压缩 Nvidia 的市场份额。
  3. 多云策略重新审视 过去几年,企业倾向于采用多云以规避单一供应商风险。Uber 此次转向 AWS,可能预示着在 AI 芯片成本与性能优势面前,多云策略的商业考量将被重新平衡。

“我们正在评估 Arm 计算对出行业务的整体收益,AWS 的芯片组合为我们提供了前所未有的灵活性。”—— Uber 高层在内部博客的引用。

展望

如果 Uber 的试点验证了 Trainium 3 在高并发推理场景中的优势,预计将有更多互联网企业跟进,将关键 AI 工作负载从传统 GPU 向专用 AI 加速卡迁移。与此同时,AWS 可能进一步加码自研芯片的生态建设,吸引更多对算力成本敏感的行业客户。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。