Uber扩约使用AWS AI芯片 推动出行平台加速Arm算力布局
•45 阅读•3分钟•视野
UberAmazonAWSTrainiumGraviton
Julie Bort••45 阅读•3分钟•视野

合同扩展概览
TechCrunch 2026 年 4 月 7 日报道,Uber 正式扩大与亚马逊 AWS 的合作范围,计划在更多出行业务模块上迁移至 AWS 的 Graviton ARM 服务器,并开启对 Trainium 3 AI 加速卡的试点。该合作不仅是对其 2023 年与 Oracle、Google 的多云布局的调整,也被视为亚马逊利用自研 AI 芯片抢占云端算力市场的关键一步。
背景回顾
- 2023 年,Uber 为摆脱自建数据中心的高成本,签署了与 Oracle Cloud Infrastructure(OCI)和 Google Cloud Platform 的多年度云服务协议,重点引入了 Ampere 生产的 ARM 处理器。
- Ampere 由前英特尔高管 Renee James 创建,后被软银收购,Oracle 随后以约 27 亿美元的收益出售持股。该公司在 ARM 服务器市场的成功促成了云厂商对 ARM 架构的兴趣。
- AWS Graviton 系列是亚马逊自研的低功耗 ARM 服务器 CPU,已在多种高并发业务中证明了成本与性能优势。
- Trainium 系列则是 AWS 为大模型训练和推理专门打造的 AI 加速卡,定位为 Nvidia 的直接竞争者。
本次合作的关键要点
- 扩大 Gravitan 使用:Uber 将在实时定价、路径规划等核心服务上迁移至基于 Graviton 的实例,预计可降低约 20% 的计算成本。
- 试点 Trainium 3:针对需求波动大的机器学习工作负载(如需求预测、动态调度),Uber 将在限定区域部署 Trainium 3,加速模型推理并评估其性价比。
- 竞争格局:此举向 Google Cloud 与 Oracle Cloud 发出“挑衅”,表明 AWS 正通过芯片差异化抢夺原本已在竞争对手云上的关键业务。
行业影响分析
- Arm 算力加速普及 随着 Graviton 与 Trainium 的双线布局,更多传统 x86 为主的企业级工作负载有望迁移至更节能的 ARM 生态,推动整个云计算行业的算力结构重塑。
- AI 芯片竞争升级 AWS 宣称 Trainium 已成为“数十亿美元业务”,若 Uber 的试点成功,将为 AWS 在大模型训练市场提供宝贵案例,进一步压缩 Nvidia 的市场份额。
- 多云策略重新审视 过去几年,企业倾向于采用多云以规避单一供应商风险。Uber 此次转向 AWS,可能预示着在 AI 芯片成本与性能优势面前,多云策略的商业考量将被重新平衡。
“我们正在评估 Arm 计算对出行业务的整体收益,AWS 的芯片组合为我们提供了前所未有的灵活性。”—— Uber 高层在内部博客的引用。
展望
如果 Uber 的试点验证了 Trainium 3 在高并发推理场景中的优势,预计将有更多互联网企业跟进,将关键 AI 工作负载从传统 GPU 向专用 AI 加速卡迁移。与此同时,AWS 可能进一步加码自研芯片的生态建设,吸引更多对算力成本敏感的行业客户。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。