摘要:
AI市场现状:
AI价值链中的价值积累主要集中在基础设施层面,尤其是Nv及其相关公司。
云服务商通过模型API或“GPU即服务”获得收入,但大规模应用收入尚未实现。
AI ROI辩论:
目前AI投资的回报率不明确,但超大规模企业在资本支出方面做出了正确的业务决策。
AI基础设施建设与价值创造之间存在不完美的过渡。
AI基础设施投资:
超大规模企业在数据中心“工具包”(如GPU、存储和网络)上的支出占总支出的约50%,这部分支出是需求驱动的。
另外50%的支出用于保护未来15年将继续稀缺的自然资源,如房地产和电力。
AI半导体市场:
Nvidia在AI半导体收入中占据主导地位,其供应链也从中受益。
AMD、Broadcom和Marvell等公司在AI产品领域也有所斩获。
AI数据中心市场:
数据中心建设的直接推动力是超大规模企业的资本支出。
数据中心开发商和服务器制造商是主要受益者。
AI云市场:
微软、谷歌、亚马逊和甲骨文等云服务提供商都在积极布局AI服务。
AI云服务的收入目前相对较低,但预示着AI应用价值的增长潜力。
AI模型与应用收入:
AI应用的收入和市场前景是当前AI市场最重要的问题。
AI应用的价值将由其为客户创造的价值决定。
结 论:文章认为,尽管目前AI基础设施投资巨大,但AI应用的价值创造仍然是一个未知数。AI应用必须继续改进并解决新问题,以证明基础设施投资的合理性。未来AI的价值可能以我们无法预测的方式显现出来。
正文:
Eric 的数据点和分析与我通常检查的信息类型非常不同,这为时事通讯带来了全新的视角(这就是我想首先介绍客座文章的全部原因)。例如,他对数据中心以及它们如何适应长期市场变化的精彩分析是我从未考虑过的角度。 Eric 将 Gen AI 的价值系统地分解为不同组成部分的方法,对于我们在估算潜在项目的 ROI 时来说是一个很好的模板。
1.人工智能投资回报率争论
一年半以来,普遍观点首次转向“超大规模支出太疯狂了”。人工智能是一个泡沫。”现在,我不是一个追随舆论的人,但投资就是寻找被低估的机会;越悲观越好。
我们不应该对人工智能日益增长的悲观情绪感到惊讶。基础设施建设和应用价值之间存在差距是预料之中的。对于每一个大型基础设施建设来说,容量永远无法完全满足需求。没关系。从基础设施建设到价值创造不会有完美的过渡。
最近人工智能悲观情绪的上升在一定程度上来自于最新的超大规模资本支出数据。
过去四个季度,亚马逊、谷歌、微软和 Meta 的资本支出总计为 177B 美元。平均而言,从 2023 年第二季度到 2024 年第二季度,这一数字增长了 59%。这些数字令人瞠目结舌,但有两件事可能是真实的:
目前人工智能投资还没有明确的投资回报率。 超大规模企业正在做出正确的资本支出业务决策。
我们需要区分人工智能投资的投资回报率和超大规模人工智能支出的投资回报率之间的对话。人工智能的投资回报率最终将由最终用户的应用价值驱动。当一家公司决定开发人工智能应用程序时,它是基于收入或成本替代的潜力。
对于大型云服务提供商来说,有一个不同的方程式。
约 50% 的支出用于数据中心“套件”,例如 GPU、存储和网络。到目前为止,这是需求驱动的支出!所有三个超大规模企业都指出,他们的人工智能计算能力受到容量限制。
另外 50% 用于保护未来 15 年将继续稀缺的自然资源:房地产和电力。
他们将自己或通过 QTS、Vantage 或 CyrusOne 等开发人员来完成此操作。他们为数据中心购买靠近计算终端使用、电力可用性和廉价房地产的房地产。他们已经获得了数据中心的大部分黄金地段;现在,他们主要根据电力可用性来购买地点。电力将继续成为计算需求的瓶颈,超大规模企业也知道这一点。
超大规模企业的方程式相对简单:数据中心至少需要 15 年的投资。他们押注 15 年内计算需求将会更高(这不是一个疯狂的假设)。
如果他们不保护这些自然资源,可能会发生三种情况:
他们将把业务输给有能力的竞争对手。 他们必须获得性价比较差的次优土地。 挑战者将购买这些土地和电力容量,并试图蚕食超大规模企业。
如果他们获得了这片土地并且不需要立即提供计算能力,那么他们将等待在数据中心内构建“套件”,直到需求准备就绪。他们可能提前几年花费了数百亿美元,这并不理想。然而,三大云提供商的总收入运行率为2250亿美金。
2. 人工智能市场现状总结
目前,大部分人工智能价值已累积到基础设施层面,特别是英伟达及其相关公司。我们开始看到“人工智能数据中心”的扩建,但我们还处于这一趋势的早期,而能源是这种扩建的真正瓶颈。
云提供商从模型 API 或“GPU 即服务”中获得了一些收入,他们购买 GPU 并通过云出租它们。
我们还没有看到大规模的应用程序收入。人工智能应用程序已经产生了 20B 美元的非常粗略的收入估计,比迄今为止价值创造(成本降低)的收入高出几倍,但这与基础设施成本相比相形见绌。
该行业最终将由人工智能应用价值(收入或成本替代)驱动。该价值将由消费者或企业的最终价值驱动。
因此,我们得出这样的结论:人工智能应用程序可以解决的问题越大,整个价值链就会产生更多的价值。
目前,我们已经看到了大量的基础设施投资和应用程序收入的预期。问题是:人工智能创造的有意义的价值在哪里?
答案是不清楚。现在还早。没关系。
在我们深入探讨之前,我想为我如何看待人工智能投资制定一个理论框架(当然,这是简化的)。
从广义上讲,我们有半导体(及其价值链)、数据中心(和能源)、云平台、模型、数据和应用层。
总结:Nvidia 占据了 AI 半导体收入的最大份额,Nvidia 的供应链在不同程度上受益,HBM 内存和定制 ASIC 紧随这两类。
上个季度,Nvidia 的数据中心收入为 263亿美元,其中 37亿美元来自网络。回到之前的资本支出数据,45% 的收入或118亿美元来自云提供商。
制造英伟达领先芯片的半导体代工厂台积电是英伟达人工智能收入的最直接受益者,他评论道:
台积电2024年平均营收预估为863亿美元;估计其中 12% 来自 AI,我们预计 AI 收入约为 104亿。
随着台积电收入的增长,最终其资本支出也会增长,从而为半导体资本设备提供商创造收入。
在上个季度的财报中,Lisa Su 表示,她预计 MI300X 的收入将超过45亿美元,高于此前预期的40亿。但是,最重要的一点是在之前的财报电话会议上,她发表了评论:
“从全年的角度来看,我们 40 亿美元的数字没有供应上限。”
当你最大的竞争对手正在销售约 200亿美元的 GPU 并且销量不够时,这并不是一个理想的位置。话虽如此,开发芯片线需要时间,从芯片发布到一年内收入40+亿是一个令人印象深刻的成就。
高带宽内存芯片旨在减少AI工作负载的内存瓶颈;SK海力士、三星和美光是这些芯片的三大制造商。
根据 Trendforce,“总体而言,SK 海力士目前占据 HBM 市场约 50% 的份额,在过去几年中与三星基本瓜分了市场。鉴于这一份额,以及 DRAM 行业收入预计在 2024 年增至 841.5亿美元,如果 TrendForce 的预测准确的话,SK 海力士 2024 年 HBM 的收入将高达 84.5亿美元。”
此外,Marvell 和 Broadcom 还提供两种主要的 AI 产品:
用于数据中心大多数网络设备的半导体(为 Arista 和 Cisco 等客户提供)。
协同设计合作伙伴关系帮助公司构建定制人工智能芯片(最好的例子是博通和谷歌合作开发 TPU)。
总结半导体部分,我们看到 Nvidia 的 AI 运行速度为 $844亿,Broadcom 的运行速度为 $124亿,AMD 预计 2024 年 AI 收入为 $45亿,台积电的 AI 收入预计为 $104亿,内存提供商的盈利~ HBM 收入为 160亿 美元(SK 海力士拥有约 46-52% 的市场份额,三星拥有约 40-45% 的市场份额,美光拥有约 4-6% 的市场份额),Marvell 的 AI 收入可能约为 20 亿美元。
人工智能数据中心的叙述很有趣。我们看到收入流向两个地方:GPU/人工智能加速器和数据中心建设。我们还没有看到收入流向 Arista、Pure Storage 或 NetApp 等传统数据中心设备提供商。
数据中心建设最直接的驱动力是超大规模的资本支出。过去四个季度,亚马逊、谷歌、微软和 Meta 在资本支出上总共花费了 1770亿 美元。平均而言,从 2023 年第二季度到 2024 年第二季度增长了 59%。
其中大约 50% 直接用于房地产、租赁和建筑成本。
Synergy Research 指出,仅用了四年时间,所有超大规模数据中心的总容量就增加了一倍,并且该容量将在未来四年内再次增加一倍。
“我们还看到数据中心规模出现了一些分歧。虽然核心数据中心变得越来越大,但也部署了越来越多或相对较小的数据中心,以便使基础设施更接近客户。总而言之但总的来说,所有主要增长趋势线都在急剧向上和向右移动。”
很明显数据中心正在建设中,但谁会从这笔收入中受益呢?
理论上,价值应该流经传统数据中心价值链:
这些数据中有趣的差异是,我们还没有看到传统数据中心网络和存储提供商的收入流向。这意味着迄今为止的收入主要用于机架规模实施和数据中心建设。
Vantage、QTS 和 CyrusOne 等数据中心开发商购买土地和电力,然后将其出租给大型科技公司。然后,开发商将在装满设备之前完成数据中心的建设过程。
到目前为止,其他主要受益者是戴尔和 SMCI 等服务器制造商,他们提供配备 Nvidia GPU 的机架。戴尔上季度销售了价值 3.2B 美元的 AI 服务器,环比增长 23%。SMCI 上季度收入为 5.3B 美元,同比增长 143%。
很明显,能源价值链将会创造价值;我将在以后的文章中发表更多相关内容。需求在增加,问题是要缓解哪些瓶颈才能满足该需求(我现在对这个问题没有很好的答案)。
一则轶事凸显了随之而来的能源需求:
美国最大的电网运营商 PJM Interconnection 在 2024 年 7 月 22 日这一周举行了年度能源拍卖。PJM 为弗吉尼亚北部地区提供服务,该地区是世界上最大的数据中心枢纽。他们的拍卖最终在其大部分地区的售价为 269.93 美元/兆瓦/天,高于上次拍卖的 28.92 美元/兆瓦/天。
从今年到明年,价格大约上涨 10 倍。这凸显了超大规模企业对能源的担忧,以及他们为了确保容量而愿意发挥的创造力。
我在此处的季度云更新中更全面地介绍了这一点。所有三个超大规模企业都希望成为垂直整合的人工智能提供商,允许客户利用他们喜欢的任何服务级别(基础设施、平台、应用程序)。这恰好是他们使用传统云软件成功部署的剧本。
微软无疑迄今为止执行得最好,让我们对云人工智能收入有了一个很好的了解。我们可以做一些简单的计算来估算他们的 Azure AI 收入。在过去 5 个季度中,他们每个季度都披露了 Azure AI 收入增长的贡献。将其与 Azure 新净收入相结合,我们可以了解他们每个季度增加了多少人工智能收入:
上个季度,他们的 Azure AI 运行率达到了大约 50 亿美元。
谷歌和亚马逊都表示,他们的人工智能收入运行率有“数十亿美元”,但没有透露更多细节。
Oracle 已签署了价值 170亿 美元的 AI 计算合同(这是 RPO,因此它将在 3-5 年内得到认可,具体取决于具体合同。如果我们平均超过在 12 个季度中,Oracle 每个季度的人工智能收入约为 13亿 美元,这使其与其他超大规模企业处于同一水平。
让我们加入 GPU 云数据来完善 AI 收入的情况:
Coreweave 预计 2023 年收入为 5 亿美元,合同 2024 年收入为 20 亿美元。Lambda Labs 预计 2023 年收入为 2.5 亿美元。Crusoe 预计 2023 年的收入将超过 3 亿美元。这些公司加起来将为人工智能云市场增加数十亿美元。
上面讨论的一切都是我所说的“人工智能基础设施”,是为了支持人工智能应用价值的最终实现而构建的。如果我能指出半导体、数据中心和云的收入急剧下降的话。这讲述了迄今为止人工智能收入的故事。
半导体今年的人工智能收入将达到 1000-2000 亿美元,超大规模企业在过去四个季度的资本支出上花费了 1750+ 亿美元,云提供商今年的人工智能收入将达到约 200-250 亿美元。
云收入让我们真正了解了人工智能应用程序的投资价值;不用说,这比迄今为止的基础设施投资要少得多。
人工智能应用价值是当前人工智能市场最重要的问题。人工智能应用价值最终将推动整个价值链的投资。如果后端没有创造价值,所有这些基础设施建设都会成为泡沫。
AI应用收入规模将由其为客户创造的价值决定。它解决了哪些问题?这些问题的规模有多大?
坦率地说,我们现在对此还没有很好的答案。蓝宝石估计了其中一些数字如下:
Scale AI(据报道今年收入为 10 亿美元)和 VAST Data(去年 ARR 为 2 亿美元,今年更高)等数据公司显示出对 AI 应用程序的明确需求。然而,它们仍然属于类似基础设施的类别,不直接接触最终用户。
我们对 AI 应用收入的最佳指示来自于模型收入(OpenAI 的 API 收入估计为 1.5B 美元,Anthropic 的估计 2024 年收入为 6 亿美元)。Altimeter 的 Freda Duan 详细分析了 OpenAI 和 Anthropic 的预计财务状况。
问题在于分析该收入的投资回报率。对于基于 LLM 的申请,我们可以假设毛利率为 80%,并且已售出 5B-10B 美元的申请收入。但是,像 Klarna 这样的劳动力替代成本所创造的价值又如何呢?节省了 4000 万美元的客户服务成本?
人工智能应用在一段时间内不会在基础设施建设上产生净正投资回报率。 人工智能应用程序必须不断改进并解决新问题,以证明基础设施建设的合理性。
关于后一点,人工智能的未来似乎确实是代理的(LLM具有记忆、规划和执行任务的工具集成)。这似乎代表了AI应用价值的下一个潜在阶跃函数。事实上,人工智能的价值可能会以我们无法预测的方式体现出来。(你怎么能在 2000 年预测互联网会导致住在别人的房子里,或者乘坐别人的车呢?)
正如 Doug O’Laughlin 指出,我们正处于人工智能的早期阶段:
新技术很难弄清楚,尤其是在短期内。没关系。价值将以不可预见的方式创造。从长远来看,做空技术是一个糟糕的赌注。当然不会是我正在制作的。