AI应用的灵魂跟不上AI芯片的脚步

文摘   2024-06-28 15:50   美国  

6月下旬以来,美股的AI硬件板块持续调整,英伟达、博通等二季度大放异彩的半导体巨头持续回落,而备受市场冷落的软件服务板块于无声处反弹,我在前期的文章也深度过当前的局面已经如何应对,具体参见我前期文章,近期市场的走势也基本上符合判断,在当前,从应用端的放量速度来看,阶段性确实需要谨慎了,如果应用放量的速度偏度,AI的capex可能在接下来遭遇边际的放缓,应该逐步趋于谨慎。

应用放量速度偏慢,会导致AI Capex趋于谨慎吗?这个想法,其实在二季度整个卖方分析师不断上调英伟达、博通和美光的业绩展望时候,就开始不断地得到强化。当时还没有那么明确的数据或者说他人的观点得到佐证,在看到红杉全球Sequoia的合伙人David Cahn的一篇文章《AI’s $600B Question》的时候我的逻辑也得到了验证。先说结论,目前来看AI的Capex投资从理性的角度看或者说从投入产出比的角度来看,狂热的情绪应该得到降温。

AI’s $600B Question,从何而来?

这篇文章是Sequoia的合伙人David Cahn在6月20日发表的,副标题直接点明的是“人工智能泡沫正在达到一个临界点,假如接下来的事情将是必不可少的。”

核心出发点就是按照整个产业链逻辑来看,进行简单的计算,目前的AI Capex投资需要获得的AI回报应该是6000亿美金,而且是最终端应用能够创造的收入,计算很简单:

  • 英伟达数据中心的Annual run rate预计在24年Q4达到1500亿美金

  • 构建AI数据中心,总成本(加上能源、建筑、发电机等等各项费用)大概是GPU成本的2倍

  • GPU的终端用户毛利率为50%,因为CPU Cloud的毛利率也就是50%左右,因为他们也需要赚钱

得到的结果进行简单计算的话就是这些终端用户创造的收入将要达到6000亿美金每年,不然的话目前投入的这些GPU的的折旧摊销对于公司自由现金流的侵蚀就会明显体现。2023财年,对于微软、亚马逊、谷歌、Meta四巨头来说,AI的capex主要从公司降本增效及砍掉的传统数据中心X86服务器支出的现金流中腾挪,总体的capex扩张在2024年并不明显,所以2023财年(截止到2月份的财报季结束),AI应用放量不放量、能带来多少的收入对于四大巨头来说不是那么重要,24财年从3月份开始,但是如果时间推进到2024-2025财年,四大巨头加总的capex就将要接近2000亿美金,来看看最新的数据:海外四家云厂商(微软、谷歌、meta、亚马逊)24Q1整体资本性支出达433亿美元,同比增长32%,环比增长1%。根据彭博一致预期,海外云厂商24年资本开支1893亿美元,同比+35%;25年资本开支2049亿美元,同比+8%。

(1)微软:24Q1资本开支110亿美元,同比+66%,环比+12%。公司指出,下一季度资本开支将环比大幅提升,并且25财年的资本开支仍将高于24财年。

(2)谷歌:24Q1资本开支120亿美元,同比+91%,环比+9%。公司预计,全年的季度资本开支将大致等于或高于一季度水平。

(3)Meta:24Q1资本开支64亿美元,同比-6%,环比-17%。同时,上调全年资本开支指引,以继续加快AI基础设施投资。公司预计24全年资本开支在350亿至400亿美元之间,高于此前的300亿美元至370亿美元。公司预计,明年的资本开支将继续增加。

(4)亚马逊:24Q1资本开支139亿美元,同比+7%,环比-4%。公司预计,24Q1会是全年资本开支的低点,24 年整体资本支出将同比大幅增长,主要用于AI基础设施,以支持AWS和生成式AI。

2000亿美金的capex,23年四大云巨头的经营性现金流是3454亿美金,如果按照24Q1TTM为3927.16亿美金,capex占现金流的比例进一步攀升到接近50%的超高比例,这样高投入,必然伴随高预期,这个时候AI 应用就成了关键,如果应用放量速度偏慢,高额的capex以及伴随而来的折旧摊销,巨头的利润率就会受到较大的影响。我们对于生成式AI应用的前景没有一点怀疑,但阶段性过热以后,似乎应该存留一些谨慎的心态,尤其是对于火热的AI硬件,根据我对于AI行业的长期深入跟踪,AI应用的放量本身就是个系统性工程,时间跨度上可能是个3-5年的周期。

那么接下来,我们看看应用端放量的速度:目前通过AI创造收入最大的公司是OpenAI,根据最新的报道OpenAI的收入从23年底的16亿美元增加到了34亿美元。同时我们也陆续能够看到部分初创公司收入规模小于1亿美元。其他巨头们的AI收入在最新一个季度的电话会里都没有特别明确的说明,只有微软的AI收入贡献了Azure的7%(而且还是以azure的GPU租赁为主,主要用于大模型的预训练),OpenAI依旧占据了人工智能收入的绝大部分份额,但是34亿的ARR跟6000亿相比依旧差距太大。而且从最新IT咨询与业务外包巨头埃森哲的财报纪要可以看到,AI应用对于很多企业来讲,引用CEO的一句话来说:“生成式AI项目主要处于实验阶段,客户大多在试验和小规模实施”,根据我们跟踪的一系列美国的软件服务公司的财报来看,当前AI应用在生产环境中还停留在跑demo的阶段,不但没有带来预期之中的收入增量,反而因为蚕食效应(cannibalization effect),阶段性所有产品线的销售都在放缓,但这也透露一个点,一旦AI大模型更稳定,推理成本下行导致经济效率提升,AI应用放量的速度也值得期待。

同时David Cahn提到了几点担忧当中,我比较认同的是同质化严重导致的缺乏定价能力。他提到的物理基础设施在建设的情况下是存在内在价值的,例如A地到B地铺设铁路,一共就只有那么几条。但是GPU数据中心现在逐渐变成了按照小时计费的商品,成为一个大宗商品后利润率必然就会快速的下降,因为没有差异性。

这一点和CPU云存在比较明显的不同。CPU云厂商他们发展的过程长,速度慢,逐步形成了足够高的资本开支壁垒,目前已经是寡头垄断的状态,全球大云就那么几个,谷歌的GCP、微软的Azure还有亚马逊的AWS占据了市场份额的绝大部分。但是GPU云不一样,大家都才刚刚开始,新进入者不断涌入市场构建AI云,获得GPU与否的权利垄断在英伟达一家的手上。因此这个行业逐步变成了高固定成本+低边际成本。

同时,GPU的更新迭代速度之快,远超摩尔定律,现在叫做老黄定律。摩尔定律为每2年一次,而老黄定律是每年一次。芯片的折旧速度将会大大超出大家的预期。现在密集出货的是H100,假如在B100出来后,大家对A100的价格不会大打折扣吗?A100的租赁价格对应到的单位算力成本,也就是每FLOP的成本将会下降吧,速度会比摩尔定律也就是过去CPU云的下降速度要更快吧。今年早些时候,Nvidia 发布了他们的 B100 芯片,该芯片的性能提高了 2.5 倍,而成本仅增加了 25%。所以并不确定3-4年后H100的保值程度。

这也解释了为什么最近的H100供应短缺问题已经消退。在23年末的时候GPU供应短缺到达了顶峰,但是现如今David Cahn参访的绝大部分人都说现在获得GPU相对容易,并且交货时间合理。一个可能性就是B100的参数出来后,下半年开始供货后,H100堆积的库存开始贬值,客户们多少有部分变成了等等党,囤GPU的心理逐步平息。

我认为,问题的关键就在关键问题,那个关键问题就在目前AI的上游capex扩张的如此之快,但下游应用放量偏慢

24年大幅度上调的Capex,23年底的疯狂囤积芯片,全世界几乎都有一种FOMO的心态在面对如此汹涌的GenAI狂潮。只要我不投入,很可能我就落后了,不仅仅是在大语言模型上会missing out,而且在基础设施上也将会落后于别人。因此大厂们在GPU的投入上已经连续多个季度上调展望,这也带来了不断上调的英伟达等硬件公司的全年业绩展望,从而推动了英伟达3万亿美金的市值,以及高达75%的毛利率。

反观下游,也就是软件部分。消费互联网里收入还不错的是Character.AI,预计24年的ARR为1670万美元。OpenAI的ARR 34亿美金来自于个人用户的订阅以及toB的收入。其他toB公司依旧没有看到非常大体量的公司存在。整个SaaS行业一季度出于小规模跑Use Case的过程,即便小部分公司的RPO也就是在手订单有放量但是从下季度展望来看依旧看不到收入上的AI体现。这也就导致了为何硬件和软件在股价上的剪刀差越来越大。

转折点到来了吗?硬件与软件的喇叭口会不会收窄?

而这也就是造成了前文所提到的泡沫的临界点,这个喇叭口要缩小,否则不合理的投入产出比必然会阶段性陷入泡沫的破裂,甚至可以类比为2000年美股的科网股泡沫,比如.com bubble的思科,那个时候分析师开口就是每个.com要对应多少的路由器和交换机。

在第一年第二年对GPU的投资,我可以理解为主要都是用来做training,用来产生最新最强的大模型,所以这是铺设最基本的算力,没有这些算力在大模型层就已经落后了。但是接下来呢?大模型也需要商业化去变现,而变现端也就是下游需求来看远远没有达到一个合理的看得到希望的回报,OpenAI的34亿ARR和6000亿相比还是太小太小了。

喇叭口收窄的途径就两个,软件收入快速攀升,或者硬件投资增速下滑。前者来看有可能,但是要从目前的可能百亿左右的收入体量快速到达合理的6000亿那几乎是不可能,而且物理基础设施还6000亿的做不到推理需求,因为即便推理需求提高后依旧还有50%的infra用于训练,50%用于推理,对应3000亿收入。所以只能通过第二个途径,趋缓的硬件投资等待软件需求的提升给硬件投资带来足够的支撑:

  • 收入端,推理需求要起来,下游应用服务,B+C的变现收入要提高

  • 成本端,我干嘛不做等等党,B100、R100甚至后面的X100出来后我再投钱,到时候的卡绝对性价比比现在更高。

  • 我目前投入的钱,在满足我能够进行最新模型的训练就好了,需求什么时候起来我再什么时候投钱去搞推理

  • 3000亿缺口在那呢,距离补上还需要时间

应用服务能跟得上吗?只是时间问题,需要灵魂跟上肉体的脚本

在AGI Playground 2024上,创新工场管理合伙人 & Co-CEO汪华说:大家还是太焦虑了,大模型从开始到现在才一年多时间,整个的应用发展,本质上还是要随着模型的成熟和整个应用生态的构建逐渐发展。

AI的投资刚开始从23年的2/3投在模型和Infra上,切换到今年的投资AI应用公司当中。AI应用的爆发确实是需要条件的,正如汪华提到的四点:模型性能、成本、模态和AI-native的产品形态探索。

模型性能上来看,至少目前GPT 4o以及新推出的Claude 3.5是能够满足很大一部分的需求了,同时回顾吴恩达在红杉那分享的Agent的性能提升,可以比较大程度的提高性能和降低幻觉,因此这一块已经具备了应用爆发的前提了。

成本的问题,这也正好契合了前文提到的GPU性能的提升,大模型的工程上的优化,使得单token价格快速下降。成本加性能构成的性价比会是应用层面能否快速爆发的关键,因为AI最重要的不是AGI的实现,而是普惠化,如果做不到普惠化那也就称不上什么生产力大爆发了。

模态这个和最后AI Native的产品形态探索,在我看来其实更像是一个问题,就是多信息源的输入和输出才是日常工作生活当中一个合理的形态,而这才能带来更契合消费者或者说客户使用的需求。多模态基本成了下一代大模型进化的方向,而且目前scaling law仍未失效的情况下,这不是原理问题,而是时间和工程问题,相对来说是更好解决的。

在BVP最新发布的《State of the Cloud 2024》的报告里,我们能够看到机会很大概率会出现在Agent、垂直行业AI以及消费者云中诞生。

关于Agent,最近在听Adept的CEO David Luan在参加20VC的podcast对Agent和RPA的区别进行了一个形象的比喻,他把传统RPA比作流水线上的机械臂,而Agent则更像是一位工人,相比于机械地执行重复性工作,Agent在面对变化和新任务是能够做出相应的调整和反馈。

所以Agent具备了吴恩达提到的4个能力:反射、规划、工具使用和多代理协作。他能够重塑非常多企业内部的工作流,在RPA的基础上进一步替代掉很多重复的日常性的工作。

垂直行业AI的机会,就看一张图就够了。垂直AI可以在商业和专业服务业中获取到一定的市场份额,因为该行业主要就是由重复性语言任务主导的。这个行业占美国GDP比重可是将近软件行业规模的10倍。就例如人工客服、法律咨询、医院的导诊等等,统统可以通过fine tune过后的大模型叠加多模态和agent来满足需求

目前来看,该AI并不与传统saas进行竞争,而是作为他们的重要补充。并且他们获得了对于自身价值相对应的高利润率。BVP了解到这些公司模型成本仅占他们COR的25%,占他们收入的10%。进行简单计算的话,也就是说AIaaS到Vertical AI的放大倍数为10x,基础模型到利润的放大倍数为6x。

虽然 BVP 预计模型层会创造巨大的价值,但这些数据告诉 BVP ,与过去的基础设施创新一样,企业价值的大部分将再次在应用层被捕获。

写在结尾

AI硬件,特别是高性能GPU和相关数据中心的投资热潮,已经成为技术行业的焦点。然而,这种快速的硬件投资增长与AI应用服务的发展速度之间出现了显著的剪刀差。

接下来,AI硬件投资的热度可能会阶段性放缓,市场将进入一个调整期,以等待应用服务的跟进和成熟。这种调整不仅有助于缓解当前的剪刀差现象,也将为AI技术的长期健康发展打下坚实基础。AI硬件与应用服务的发展不平衡是一种阶段性现象。通过技术创新、市场推广和投资策略的调整,AI应用服务终将赶上硬件的步伐,实现产业的整体协调发展。

大家更关注的是应用服务能跟得上吗?我认为只是时间问题,我认为AI一定是一个伟大的时代,不然英伟达的市值也不可能突破3万亿美金,登顶全球股王。只是,现在需要灵魂跟上肉体的步伐,我认为阶段性AI硬件的投资热度可能会放缓,等待应用起量弥合这个剪刀差,那么投资机会,就是见仁见智了。

我个人认为现阶段反而需要更加理性以及逆向思维,随着市场逐渐理性,硬件投资热度将趋于放缓,资本会更加关注实际应用的落地和收益。等待应用起量:在硬件基础设施相对完善的情况下,市场将更多地关注应用服务的发展,等待其规模化增长。

我们的观点,参见我前期的文章:

旧SaaS的诸神黄昏,AI云服务的灿烂黎明

重磅!14个趋势直击美国生成式AI应用的发展现状

【全球 IT支出深度分析】谈谈AI投资的下一个爆点

英伟达大顶,对比移动互联网,谈谈AI投资节奏

珍惜分歧:获利了结英伟达,抄底暴跌软件服务



贝叶斯之美
AI博士,探奇点时刻,抓时代康波,掘伟大公司,AI让我自由