中国的人工智能DeepSeek,会导致美国科技大崩盘?

文摘   2025-01-26 18:38   西班牙  

中美人工智能竞争很有意思,每次美国公布一个大消息,中国这边也会跟着公布一个大消息。

所以我曾看到一些网友说:怎么美国不公布进展就不知道中国也有AI?

之前ChatGPT公开的时候,中国也冒出来文心一言等一大堆大语言模型;最近美国宣布了“星际之门”,中国这边也立马高调出山了一位“半路程咬金”——DeepSeek。

具体的研究和测评还在进行中,网友们却坐不住了。

我在网上看到大量的言论,是关于DeepSeek会导致美股崩盘的说法。更有甚者,说美国的科技泡沫也会跟着崩盘,甚至美国的国运都会就此走衰。

总之,他们认为DeepSeek这么一个小小初创公司的应用,就能让美国走向国家失败。

DeepSeek真的这么厉害?其实这些人的言论倒也不是完全没有根据,而且,最近美国的诸多大媒体确实集体“炸锅”,陷入了反思和震撼,这从侧面说明DeepSeek确实是有两把刷子的。

国外媒体如此描述:

“本周,中国的一个小型人工智能实验室公布了其尖端模型的技术秘诀,震惊了世界,使其隐居的领导者成为了一位民族英雄,无视了美国阻止中国高科技野心的企图。”

“对冲基金经理梁文锋创立的 DeepSeek 周一发布了其 R1 模型,并在一篇详细的论文中解释了如何在自举预算上构建一个大型语言模型,该模型可以在没有人工监督的情况下自动学习和改进。”

DeepSeek最大的优势是“经济实惠”,仅用了两个月的时间以及不到600万美元就构建完成,使用了英伟达的低性能芯片H800s。

在一系列第三方基准测试中,DeepSeek的表现优于Meta的 Llama 3.1、OpenAI 的 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5 ,在从复杂问题解决到数学和编码的准确度方面均名列前茅。

DeepSeek 周一发布了推理模型 r1,该模型 在许多第三方测试中的表现也优于OpenAI 最新的 o1。

微软首席执行官萨蒂亚·纳德拉周三在瑞士达沃斯世界经济论坛上表示:“DeepSeek 的新模型非常令人印象深刻,他们不仅有效地开发出一种开源模型,实现了推理时间计算,而且计算效率极高。”“我们应该非常认真地对待中国的发展。”

Perplexity 首席执行官 Aravind Srinivas 表示:“需要是发明之母。因为他们必须想出解决办法,所以他们最终打造出了更高效的东西。”

在下图中可以看到,DeepSeek-R1已经跻身大模型综合能力排行榜前三。以便宜20倍的“身价”与ChatGPT-4o(2024.11.20发布)并列。

图片来源:公众号“量子位”

搞出这个“惊天之物”的人——梁文锋,居然不是专业的人工智能从业者,几乎算一个玩票的年轻亿万富翁。他的主业是一家叫“幻方”的量化公司,也就是用量化做股市投资的。一开始,他在禁运令生效之前囤积英伟达芯片的举动,被外人认为只是“业余爱好”。

最近,梁文锋还受邀参加中国政府最高级别的企业家会议。

国外媒体的采访当中,有人如此描述梁文锋:

“我们第一次见到他时,他是个书呆子,发型很糟糕,大谈建立一个 10,000 个芯片的集群来训练自己的模型。我们并没有把他当回事,”梁的一位商业伙伴说。

“他无法表达自己的愿景,只能说:我想打造这个,它将改变游戏规则。我们认为只有字节跳动和阿里巴巴这样的巨头才能做到这一点,”该人士补充道。

2023 年,梁文锋创办了DeepSeek,直接从他的对冲基金聘请顶尖的人工智能工程师。他利用对冲基金High-Flyer的利润,组建了一支不仅了解人工智能,还掌握人工智能背后基础设施的团队。

2024 年,DeepSeek开发出了R1语言模型,业内人士称该模型对美国所有主要 AI 公司都构成了直接挑战。与美国竞争对手不同,DeepSeek 对商业化不感兴趣。它完全专注于研究,梁用自己的钱来资助运营。

DeepSeek与美国的人工智能发展还有一个质的区别:美国的人工智能都是“闭门”操作,但DeepSeek却是开源的。这一点也是让国外网站上充斥着对硅谷的嘲笑,美国网民们在X上纷纷调侃:这些自以为是的大资本集团,试图创造的围墙失效了。

其实,对于DeepSeek的成功我一点也不感到奇怪,因为中国一向以来真的不缺聪明人、能人。别的不说,光美国科技界就有多少华人?NASA的科学家当中,华人一度占比高达三分之一。

一个极度聪明的“技术狂”理工男,同时还有执行力的中国富翁,拿着英伟达的芯片,在国外算法的“巨人肩膀”上,能搞出什么牛X的东西出来,我觉得都不奇怪。

这也是我希望看到的中美竞争方式——美国的“闭门造车”,肯定是会影响其科技发展的。

在这里就不得不说,马斯克在中国接触的事情多了,他其实最懂美国的弱点。OpenAI一直是马斯克内心的隐痛,他拿出5000万美元给奥特曼——OpenAI的老总,让他不要商业化,而是坚持“实验室”模式,但人家就是不,这也惹恼了马斯克,最近他大骂星际之门项目,就有这个原因在里面。

这不,过早商业化的弊端已经浮现——DeepSeek就是坚持不商业化,才搞出来的突破创新。

过早的商业化,会导致研究束手束脚,顾虑太多,很容易背离科研的初心。

DeepSeek的横空出世,对美国科技界的确是一个巨大的震动,同时也是警醒。

为什么DeepSeek能做到如此高效而低成本呢?其实这一直都是中国最擅长的方面,也是中国面对美国科技竞争的比较优势,就是中国擅长在应用端,为了应用而促进技术进步。

这就是我为什么在前面引用了那位国外企业家的评价:“需要是发明之母。因为他们必须想出解决办法,所以他们最终打造出了更高效的东西。”

但与此同时我们也要注意,中国在创新方面也一直存在一个固有的弊病:单个的创新突破总是很容易,但要形成持续性、形成行业突破效应却总是很难。

举个例子,在1960年代中国就能搞出人工合成结晶牛胰岛素这样的超级突破,但中国的化学生物领域并未因此成为世界领先的领域,反而一直还相对比较落后。

在中国很多行业,我们都能看到这种类似的现象,就是“点”的突破很厉害,但“面”的突破很难。

因为中国科研最大的一个问题是不团结,以及受到国内其他因素干扰很严重。一旦有人出现创新,同行拆台、其他力量干预的现象就会很严重。

就像黑悟空,创始人自己也说,他对这个游戏带来中国游戏界的整体工业水平上升,持悲观态度。

另外,DeepSeek依然是脆弱的存在,英伟达自己也正在突破芯片的极限,比如下一代Blackwell芯片升级;同时,美国的人工智能界肯定也会从DeepSeek这里吸取长处,继续改进。

与此同时,马斯克的 xAI 也正在大规模扩展其 Colossus 超级计算机,训练其 Grok AI 模型。大家都知道,马斯克做事总会一鸣惊人,不可小觑。

以及,DeepSeek所取得的一切其实还是“跟在别人的技术后面”走路,是否自己能独立走出创新之路,还是个问号。

不管怎样,我还是希望中美之间的这种良性竞争,最终能给全人类带来造福。这种竞争延续下去,对整个世界是一件好事。

最后我想说的是,在只是实现一个点的突破之后,很多中国网民就陷入了狂欢,甚至开始大喊“美股崩盘、美国科技界就此崩盘”,也实在是有点过度自满了吧?

在美国人工智能发展领先最如火如荼的时候,我在美国媒体、美国网络上看到的大部分依然是对于中国可能超越的警告。

但是在中国这边,但凡做出来一点东西,就会陷入集体的民族主义情绪狂热,就开始盘算美国的崩溃了。这种“一有成就就翘尾巴”的心态,在近一百年,已经无数次伤害到自己。

美国媒体和网民永远最善于自嘲,而中国媒体和网民却总是最善于嘲笑别人。

为什么就不能安心地“戒骄戒躁”、“韬光养晦”?希望中国多一点梁文锋这样踏实做事的人,而不是靠着喊口号、打嘴炮一直“赢下去”的人。

·END·
大家好,我的油管(YouTube)频道上线了,在上面搜索“倪刃的黑噪音”就可以找到。想支持我的朋友,请帮忙点订阅、点赞和转发,因为前期的推流,粉丝的积累非常重要,谢谢大家!
大家请放心关注,不用有额外担心,在那里的发言尺度和在这里差不多,只不过敢说的话题稍微多一些,不再怕被删了(比如关于经济的一些真实问题分析)。

欢迎加入我的讨论社群,现在已经有700位读者在里面与我进行你问我答、股市投资交流(仅投资知识,不分析股票和进行投资建议)、宏观经济动态、独家专栏文章分享、时事动态探讨、好书推荐、往期被禁文章分享等等。

这不是微信群,是“知识星球”app旗下的付费社群,费用88/年。欢迎扫码加入:


防失联或者知识星球加入咨询,都可以加我个人微信:

写作题材敏感,有封禁风险,防失联大家可以关注我的备用号

黑噪音
抵抗洗脑,只谈常识
 最新文章