跻身竞技榜前三，来自中国的大模型持续震撼硅谷，Meta进入恐慌模式？

财富 2025-01-26 13:19 北京

DeepSeek或彻底改变游戏规则。（图/视觉中国）

来源｜每日经济新闻‍‍‍

作者｜每经记者岳楚鹏兰素英

编辑｜王嘉琦

短短一个月内，中国AI初创公司深度求索（DeepSeek）先后发布了DeepSeek-V3和DeepSeek-R1两款大模型，成本价格低廉，性能与OpenAI相当，让硅谷震惊，甚至引发了Meta内部的恐慌，工程师们开始连夜尝试复制DeepSeek的成果。

Scale AI创始人Alexander Wang在1月24日的采访中表示，DeepSeek在他们的测试里是表现最好的，与美国最好的模型相当。

此前，Alexander Wang评价说，DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时，中国（科技界）在工作，以更低的成本、更快的速度和更强的实力赶上。”

此外，中国AI“刷屏”国外各大媒体，它们认为中国大模型的新进展为硅谷敲响了警钟。

在5000亿美元的“星际之门”计划公布之际，DeepSeek以极低的价格建立了一个突破性的AI模型，而且没有使用尖端芯片，让人们质疑，AI行业数千亿美元资本的巨额投入真的是最有效的方法吗？

Meta进入恐慌模式，试图复制DeepSeek

1月24号，一条发布在匿名平台teamblind上的帖子疯传。一名Meta员工称，现在Meta内部因为DeepSeek的模型，已经进入恐慌模式。

这位Meta员工写道：

“一切源于DeepSeek-V3的出现，它在基准测试中已经让Llama 4相形见绌。更让人难堪的是，一家‘仅用550万美元训练预算的中国公司’就做到了这一点。

工程师们正在争分夺秒地分析DeepSeek，试图复制其中的一切可能技术。这绝非夸张。

管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本，而且这样的高管还有数十位，他们该如何向高层交代？

DeepSeek-R1的出现让情况更加严峻。具体细节属于机密，不便透露，不过很快就会公开了。”

去年12月27日，DeepSeek推出开源模型DeepSeek-V3。当时，聊天机器人竞技场（Chatbot Arena）显示，DeepSeek-V3在所有模型中排名第七，在开源模型排第一。而且，DeepSeek-V3是全球前十中性价比最高的模型。

不到一个月之后，今年1月20日，DeepSeek正式开源R1推理模型，允许所有人在遵循MIT License（注：被广泛使用的一种软件许可条款）的情况下，蒸馏R1训练其他模型。

1月24日，DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三，与顶尖推理模型o1并列。

（图源：量子位）

在高难度提示词、代码和数学等技术性极强的领域，DeepSeek-R1拔得头筹，位列第一。

在风格控制方面，DeepSeek-R1与o1并列第一，意味着模型在理解和遵循用户指令，并按照特定风格生成内容方面表现出色。

在高难度提示词与风格控制结合的测试中，DeepSeek-R1与o1也并列第一，进一步证明了其在复杂任务和精细化控制方面的强大能力。

Artificial-Analysis对DeepSeek-R1的初始基准测试结果也显示，DeepSeek-R1在AI分析质量指数中取得第二高分，价格是o1的约三十分之一。

著名投资公司A16z的创始人马克·安德森1月24日发文称，Deepseek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一，而且还是开源的，它是给世界的一份礼物。

1月24日，A16z合伙人、Mistral AI董事会成员Anjney Midha表示：“从斯坦福到麻省理工，DeepSeek-R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。”

对于中国AI为何能有如此快速的进展，诺奖得主、“AI教父”杰弗里·辛顿在1月21日接受博主Curt Jaimungal专访中表示，中国的STEM（科学、技术、工程、数学）教育比美国更好，拥有更多受过良好教育的人才，这将为AI的发展提供坚实的基础。尽管美国试图通过限制（如英伟达芯片）来减缓中国的发展，但这只会促使中国加速发展自己的技术，“他们可能会落后几年，但最终会赶上”。

DeepSeek或彻底改变游戏规则，“大力出奇迹”还有效吗？

斯坦福大学和Epoch AI的研究人员去年年中发表了一项研究表明，到2027年，最大型的模型的训练成本将超过10亿美元。Gartner预测，到2028年Google、Microsoft和AWS等超大规模企业仅在AI服务器上的支出就将高达5000亿美元。

但DeepSeek完全不同，它的训练成本并不昂贵。Noah's Arc资本管理公司表示，DeepSeek-V3模型有可能彻底改变训练和推理领域的游戏规则。

特别是在5000亿美元的“星际之门”计划公布后，DeepSeek更让人怀疑，巨额投入这种“大力出奇迹”的办法真是最有效的方法吗？

美股大V“THE SHORT BEAR”1月24日在X上发文称，DeepSeek给AI巨头们带来了痛苦时刻，投资者必须对此敲响警钟。

他说：“如果击败OpenAI只需要5500万美元，那么这个行业的商业化会比很多人预想的要快很多。”

他还指出：“根据红杉，美国AI公司每年必须产生约6000亿美元收入来支付其AI硬件费用。现在看来，这种冒险行为变得越来越无利可图。”

如果说DeepSeek-V3只是掀起了波澜，那么DeepSeek-R1则是引发了轰动。最近，国外媒体纷纷聚焦DeepSeek，并一致认为中国大模型的新进展为硅谷敲响了警钟。

1月24日，美国媒体CNBC推出了长达40分钟的节目，邀请了Perplexity CEO Aravind Srinivas来分析为何DeepSeek会引发人们对美国在AI领域的全球领先地位是否正在缩小的担忧。

英国《金融时报》1月25日报道称，中国小型AI初创公司DeepSeek震惊硅谷。报道聚焦资源更丰富的美国AI公司能否捍卫自己的技术优势。

报道援引加州大学伯克利分校AI政策研究员Ritwik Gupta称，DeepSeek最近发布的模型表明“AI能力没有护城河”。Gupta补充说，中国的系统工程师人才库比美国大得多，他们懂得如何充分利用计算资源来更便宜地训练和运行模型。

（原文内容有删减，原标题为《“DeepSeek或彻底改变游戏规则”！中国大模型“搅动”硅谷，巨头进入恐慌模式，外媒刷屏，大佬发声：中国AI已追上美国》）

【延伸阅读】

DeepSeek是如何走到现在的？

来源｜量子位‍‍‍‍‍‍‍‍‍‍

作者｜明敏

DeepSeek创始人梁文锋，本硕均就读于浙江大学信息与电子工程学专业。

2008年，梁文锋毕业，开始带领团队使用机器学习等技术探索全自动量化交易。2019年，梁文锋在当年的金牛奖颁奖仪式上，发表主题演讲《一名程序员眼里中国量化投资的未来》，这是他少见的公开演讲。

演讲全文的确充满“程序员视角”：

量化公司是没有基金经理的，基金经理就是一堆服务器。人来做投资决策的时候，它是一种艺术，要凭感觉。程序来决策的时候，它是一种科学，它有最优解。

也是这一年，幻方量化开始大规模布局AI算力，搭建起“萤火一号”集群。2021年，“萤火二号”落成。这样的算力基建，成为如今DeepSeek快速奔跑的底层支撑。

为何DeepSeek能成功？梁文锋在2023年5月2024年7月接受暗涌的两次采访也被外国网友“扒”出来了。

他们最关心的五个方面分别是：

1、创新第一性原则：与其他致力于快速商业化的中国AI公司不同，DeepSeek专注于基础的AGI研究和创新。他们认为，中国必须从全球人工智能发展的“搭便车者”转变为“贡献者”。梁文锋说，创新不完全是商业驱动的，还需要好奇心和创造欲。

2、革命性架构：DeepSeek V2中采用的新型MLA（多头潜在注意力机制）架构，把显存占用降到了过去最常用的MHA架构的5%-13%，实现了成本大幅降低。它的推理成本仅为Llama 370B的1/7、GPT-4 Turbo的1/70。

这并不是为了挑起一场价格战——他们只是在“成本上稍微有点利润”来定价。这种创新架构继续应用于V3和R1模型中。

3、独特的公司文化和人才战略：DeepSeek保持着一个完全自下而上的组织结构，为研究人员提供无限的计算资源，优先看创造热情而不是证书。他们的突破性创新来自年轻的本土人才——中国本土的应届毕业生和年轻技术人才，而非海外招聘。

4、致力于开源：尽管行业开始趋向于闭源模型（OpenAI和Mistral），DeepSeek仍致力于开源，并认为开源对于建立一个强大的技术生态系统至关重要。梁文锋认为，在颠覆性技术面前，闭源形成的护城河是短暂的。

他们的真正价值在于建立一个具备创新能力的组织。

5、底层计算挑战：尽管拥有足够的资金和技术，DeepSeek也面临来自底层计算的挑战和压力。目前公司还没有新的融资计划。梁文锋认为，面临的主要制约因素不是资金，而是高端算力的使用权，这些芯片对于训练先进AI模型至关重要。

除此之外，采访中的诸多细节也被网友认真品味。

原文中，梁文锋被问道：怎么看待做量化同时做大量基础研发，不烧钱吗？

他回答：一件激动人心的事，或许不能单纯用钱衡量。就像家里买钢琴，一来买得起，二来是因为有一群急于在上面弹奏乐曲的人。

2023年，幻方量化将下场做大模型的独立新组织命名为深度求索，并强调将专注于做真正人类级别的人工智能。

目标不是复刻ChatGPT，而是研究和揭秘AGI的更多未知信息。

DeepSeek的故事也就开始于这一刻。

本文不代表《财经》观点，转载已获授权。

今日话题

你怎么评价DeepSeek？

欢迎在评论区分享你的观点。

‍‍

往期文章

责编 | 王小贝监制 | 张亮惠

你点的每个“在看”，我都认真当成喜欢

财经

源于《财经》，广于财经。严谨论述与辛辣点评同台，图文与影音共享。有料也有趣，有态度也有温度，有品质也有性格。《财经》新媒体，您掌控的财经。

最新文章

太火！“全国的山姆都挤爆了”，胖东来一天狂卖1.3亿，有代购日赚6位数

人形机器人厂商上演“生死时速”

“手机国补”遇春节：4天、近800万人、1000万件

腾讯游戏，暂停“赛马”

创新高的90亿人次，今年的春运有何不同？