微软宣布已购入 485,000 个英伟达(NVIDIA)的 Hopper 系列 GPU,以加速其在人工智能(AI)领域的基础设施建设,并在全球范围内树立了行业领导地位。
根据市场研究机构 Omdia 发布的报告,此次采购规模不仅达到了竞争对手的两倍以上,还涉及约 310 亿美元的巨大投资,彰显出微软在 AI 市场上的巨大决心与实力。
通过压倒性的采购量拉开与竞争对手的距离
这次大规模采购对英伟达来说意义重大,因为这几乎占到了其年度总收入的 20%,成为了一项战略性合作。相比之下,中国字节跳动(ByteDance)和 Meta(原 Facebook)分别采购了 23 万和 22.4 万个 GPU,显然微软的采购量远超其他企业。
值得注意的是,微软的订单涵盖了 NVIDIA Hopper 系列中的多个型号,包括 H100、H200 以及 H20 等,显示了其对不同应用场景的需求覆盖能力。
大规模投资背后的深层次原因
如此巨额的投资背后,是微软对于 AI 技术发展的深刻洞察与布局。公司此前已向 OpenAI 投入了 13 亿美元,旨在强化 Azure 云平台上的 AI 服务能力,并显著提升自家 AI 助手 Copilot 的处理性能。正如微软 Azure 全球基础设施部门的 Alistair Speirs 所言,“构建高性能的数据中心需要精密规划、复杂工程及大量资本支持,通常需要数年时间来完成。”这表明微软不仅着眼于短期效益,更将其视为长期增长战略的重要组成部分。
在中国市场环境下,由于受到美国出口管制的影响,字节跳动和腾讯选择了特别定制的 H20 型号作为主要采购对象,两家公司各自采购了大约 23 万个 GPU。而在美国市场,Meta、特斯拉/xAI、亚马逊、谷歌等科技巨头的平均采购量约为 20 万个左右,与微软相比仍有较大差距。
这种采购规模上的差异直接反映了各公司在 AI 基础设施建设方面的资源投入与竞争态势。除了单纯的硬件采购外,微软还在推进一个包含适当存储组件、基础设施、软件层、主机管理层以及错误纠正机制在内的综合性系统建设,从而形成了全方位的竞争优势。
行业内加速进行的 AI 芯片开发竞赛
尽管英伟达目前在市场上占据主导地位,但为了减少对其依赖性,各大科技公司正积极研发自主设计的 AI 芯片。例如,谷歌早在十年前就开始了 Tensor Processing Unit (TPU) 的研发工作,该产品专门为机器学习任务优化,在内部服务中实现了高效运行。
Meta 也加快了自研芯片的步伐,推出了 Meta Training and Inference Accelerator (MTIA),专为元宇宙相关应用进行了深度优化。与此同时,亚马逊则面向云计算客户提供了两种专有芯片 - Trainium 用于模型训练,Inferentia 则专注于推理处理。
然而,即便各家公司都在努力推出自己的解决方案,Omdia 云计算及数据中心研究部门总监 Vlad Galabov 指出,“当前服务器投资中有相当比例被英伟达的 GPU 占据,接近峰值水平。”这意味着尽管存在激烈竞争,英伟达的技术优势依然难以撼动。尤其是其 CUDA 开发环境拥有丰富的库和工具集,构成了进入壁垒,使得其他企业在通用性和开发便利性方面仍处于劣势。
此外,下一代 AI 芯片的竞争已经开始。英伟达发布了最新的Blackwell架构,承诺提供更高的性能,而其他公司也在不断加大研发投入。随着技术进步,未来AI芯片的设计将更加注重电力供应和冷却效率等方面的改进,这些因素将在未来的市场竞争中扮演关键角色。
微软此次的大规模采购不仅仅是一次简单的硬件获取行动,它承载着更为深远的战略意图。考虑到微软正在推进总金额达 1000 亿美元级别的 Stargate 项目,并同时开展自研芯片 Maia 的研发工作,本次采购更像是过渡阶段的一个重要步骤。
值得注意的是,在实际操作中能够承担如此巨额资金用于“桥梁”建设的企业实际上只有微软一家,这暗示着 AI 行业的霸权争夺战已经进入了新的阶段。讽刺的是,这个看似临时性的“桥梁”,可能恰恰成为了决定胜负的关键因素之一。
其它相关资源: