美东时间周一,美股AI领域的龙头企业英伟达股价遭遇重创,单日收盘跌幅高达16.86%,创下美股历史上最大单日个股市值蒸发规模。一夜之间,英伟达市值蒸发5888.62亿美元,折合人民币约4.27万亿元,这一蒸发数额相当于3个AMD或近18个寒武纪的公司市值。
引发此次暴跌的关键因素,是来自中国杭州的国产大模型公司——深度求索(DeepSeek)。上周,深度求索发布了DeepSeekR1模型,该模型在数学、编程和推理等核心领域的表现,可与OpenAI最强推理模型o1相媲美,然而其API调用成本却低了90%-95%。这一巨大的成本优势,让不少华尔街人士开始质疑:此前美股科技巨头们在AI基础设施上投入的巨额资金,是否付诸东流?
在这场美股科技股的风暴中,英伟达成为最大受害者。不过,即便股价暴跌,英伟达在周一发布的回应中,仍对DeepSeekR1模型给予了高度评价,称其为“一项出色的人工智能进步”。
英伟达发言人表示:“DeepSeek是一项卓越的人工智能突破,也是TestTimeScaling(TTS,即在推理阶段通过增加计算量来提升模型推理能力的一种方法)的典型范例。DeepSeek的成果展示了如何利用广泛可用的模型和完全符合出口管制的计算资源,创建新模型。”
英伟达还进一步指出,它认为DeepSeek的突破将为自身带来更多需求。发言人补充道:“推理过程需要大量英伟达GPU和高性能网络。目前,我们有三个规模定律(ScalingLaw):训练前定律和训练后定律仍在持续发挥作用,以及新的TTS(test-timescaling)。”
此外,英伟达特别澄清,DeepSeek所使用的GPU完全符合出口标准。这一说法与AI科技初创公司ScaleAI创始人亚历山大・王(AlexandrWang)上周的言论相悖,后者曾声称DeepSeek使用了中国大陆被禁的英伟达GPU。而DeepSeek方面也表示,其使用的是英伟达针对中国市场的特殊版本GPU。
英伟达的此番评论,也呼应了英伟达首席执行官黄仁勋、OpenAI首席执行官萨姆・阿尔特曼(SamAltman)和微软首席执行官萨蒂亚・纳德拉最近几个月探讨的新主题——TTS。
人工智能的蓬勃发展以及对英伟达GPU的旺盛需求,很大程度上是由“规模定律(scalinglaw)”推动的。这一概念由OpenAI研究人员在2020年提出,其核心观点是,通过大幅增加构建新模型所需的计算量和数据量,能够开发出更优质的人工智能系统,而这必然需要越来越多的芯片支持。
自去年11月起,黄仁勋和阿尔特曼就开始关注规模定律中的一个新问题——“TestTimeScaling”。该概念认为,一个训练有素的人工智能模型在进行预测、生成文本或图像时,若花费更多时间、运用额外的计算机能力进行“推理”,相较于短时间内给出的答案,其结果会更加理想。
随着DeepSeek的强势登场,华尔街分析师们纷纷抛出疑问:微软、谷歌和Meta等公司在基于英伟达的人工智能基础设施上投入的数十亿美元,是否已失去价值?毕竟DeepSeek的成功表明,同样的成果可以通过更低的成本达成。
本月早些时候,微软宣布2025年将在人工智能基础设施上投入800亿美元;而Meta首席执行官马克・扎克伯格上周也表示,Meta计划在2025年投入600亿至650亿美元用于资本支出,作为其人工智能战略的重要部分。
美银证券分析师贾斯汀・波斯特在周一的报告中写道:“如果模型培训成本确实能够大幅降低,预计短期内,使用云人工智能服务的广告、旅游及其他消费应用公司将从中受益,实现成本优化;而从长期来看,与超大规模人工智能相关的收入和成本可能都会下降。”