DeepSeek在硅谷持续引发讨论。
对此,OpenAI最强劲的竞争对手、硅谷创业公司Anthropic的联合创始人、大语言模型的开创性研究者之一Dario Amodei昨日发表了一篇长文,系统阐述对于DeepSeek的看法。他表示,DeepSeek的训练成本远没有人们说的那么低,“600万美元模型”的说法忽略了许多关键背景。更准确的说法应该是,DeepSeek以更低的成本生成出一个接近7个—10个月前美国模型水平的产品。另外,他还强调,美国应加强芯片出口管制,确保自身走在人工智能发展的前沿。
针对Dario Amodei的观点,顶尖硅谷风险投资家、A16Z联合创始人Marc Andreessen今日发表评论称:“闭源、不透明、吹毛求疵、政治操纵与开源和免费相比,并不是美国所需要的胜利地位。”
虽未直接点名,但DeepSeek正是以开源及免费,在全球AI开源社区中受到普遍认可,而Anthropic开发的Claude模型与OpenAI的GPT模型一样,均属于闭源模型,训练过程及技术细节不对外公开。Marc Andreessen的评论也是在暗讽Dario Amodei,作为AI行业的领军人物,却企图利用地缘政治来遏制对手,否认开源工作,与实现通用人工智能目标的初衷已经背道而驰。
DeepSeek让闭源社区“破防”
记者注意到,这并非Marc Andreessen首次针对DeepSeek发声。早在1月24日,Marc Andreessen在社交平台表示:“DeepSeekR1是我见过的最令人惊叹、最令人印象深刻的突破之一,并且是开源的,是给全世界的礼物。”
当天,英伟达股票下跌超3%,华尔街开始注意到DeepSeek这匹AI黑马,发现AI模型或许不需要依靠堆积算力就能取得卓越性能,从而打破了美股这两年来在AI浪潮中形成的“算力为王”的投资逻辑。有美股大V复盘并分析称,Marc Andreessen针对DeepSeek的推文,或许是DeepSeek爆火出圈的其中一个导火索。
不仅Marc Andreessen,AI领域的另外一个标志人物,斯坦福大学计算机科学系客座教授、谷歌大脑(Google Brain)创始人吴恩达(Andrew Ng)也发文力挺DeepSeek。吴恩达认为,中国在生成式AI领域正快速缩小与美国的差距,或将重塑AI供应链格局。同时,开源权重模型推动基础模型层走向大众化,为应用开发开辟新机遇,单纯扩大模型规模并非AI发展的唯一出路,在算力军备竞赛的喧嚣中,算法革新正显著降低训练成本。
事实上,Dario Amodei、吴恩达与Marc Andreessen之间的争论,体现的正是闭源与开源两条路线的分歧。DeepSeek之所以在业界掀起轩然大波,除了在有限算力资源下实现的技术突破,让大模型不再是巨头堆算力的游戏,完全开源则是另外一个核心的原因。“开源+低成本”,让DeepSeek颠覆了行业的传统范式,Meta首席人工智能科学家杨立昆此前曾公开表示,DeepSeek的成功彰显了AI模型开源的重要性,“DeepSeek的胜利并非是中国AI的胜利,而是开源模型的胜利”。
有业内人士表示:“当OpenAI在2019年以安全为由转向闭源时,他们实际上是在建立垄断。而DeepSeek证明了开放可能是更好的战略,它能吸引最好的人才,建立生态系统,并通过降低成本而不是提高价格来获取优势。”英伟达高级研究科学家Jim Fan一周前在读完DeepSeek的技术报告后也表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”
DeepSeek创始人梁文锋在接受媒体采访时曾表示:“在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。”同时,对于DeepSeek开源的做法,梁文锋表示,“开源更像一个文化行为,而非商业行为……我们不会闭源。我们认为先有一个强大的技术生态更重要。”
一般来说,在大模型领域有先发优势及处于技术领先地位的公司,如OpenAI和Anthropic往往倾向于选择闭源,保护自身的技术秘密。有国内大模型从业者告诉记者,DeepSeek作为纯技术驱动的公司,代码和训练方法完全开源,而互联网大厂往往出于商业化等方面的考量不会完全开源。当DeepSeek向市场推出了一款低成本、高性能的模型,并且开源时,无疑对选择闭源路线的公司构成了巨大的冲击。
OpenAI被爆正洽谈新一轮融资
在DeepSeek引发大模型高额投入的效用质疑时,据华尔街日报报道,OpenAI正在洽谈新一轮融资,计划在一轮融资中筹集至多400亿美元,估值将达到3000亿美元,相较此前估值1570亿美元接近翻倍,将成为仅次于埃隆·马斯克旗下SpaceX的全球估值第二高的初创公司。
另外,PitchBook数据显示,这一轮融资将是硅谷历史上最大的一轮融资,并打破OpenAI在2023年创下的融资纪录,当时它从微软融资100亿美元。上述报道还称,在本轮融资中,软银集团将作为领投方投资150亿至250亿美元。若新一轮融资完成,孙正义将更进一步与OpenAI绑定。
值得注意的是,1月22日,美国总统特朗普宣布,OpenAI、软银集团和甲骨文将合资成立一家名为“星际之门”(Stargate)的新公司,计划未来4年在美国投资5000亿美元建设AI基础设施,其中1000亿美元将立即部署。
OpenAI首席执行官山姆·奥特曼此前透露,OpenAI、软银集团、甲骨文和MGX将为该项目总共投入450亿美元,OpenAI和软银集团将各向星际之门注资190亿美元,均持有合资企业40%的股权,而甲骨文和MGX将共同出资70亿美元。据华尔街日报报道,最新一笔融资的资金将部分用于帮助OpenAI履行其对“星际之门”的投资承诺。
DeepSeek发布的AI模型,凭借高性能、便宜、开源等优势,令许多投资者对OpenAI等美国AI开发商的高额AI资本开支策略产生了质疑。奥特曼此前评价DeepSeek时承认,DeepSeek R1让人印象深刻,尤其考虑到成本方面,“但我们无疑将带来更好的模型”。他还表示,“我们相信,要实现我们的使命,更多的计算能力比任何时候都更重要。”
另外,据彭博社报道,知情人士透露,近期OpenAI与微软展开了一项联合调查,针对DeepSeek去年使用OpenAI API接口的账户进行审查,并以涉嫌违反服务条款的模型蒸馏为由,取消了他们的访问权限。此前,OpenAI曾向媒体表示,它发现DeepSeek使用了OpenAI专有模型来训练自己的开源模型的证据,也即DeepSeek涉嫌“蒸馏”其模型,但拒绝进一步透露其证据的细节。
据记者了解,蒸馏是模型训练中常见的一种做法,简单理解就是用预先训练好的复杂模型作为“教师模型”,用其输出的结果作为监督信号,再去训练另外一个“学生模型”,使学生模型能够逐渐接近于教师模型的水平。由于“从零开始”训练一个模型,需要重复耗费大量计算资源,蒸馏也被视为AI普惠的一种途径,无论是在中国还是美国,初创公司和学术机构使用ChatGPT等领先模型输出数据来训练自己的模型,是业内普遍的现象。
值得注意的是,美东时间1月30日,在美国国家公共电台的节目中,OpenAI全球事务副总裁Chris LeHane表示,“o3”将在周五发布。紧急上线新模型表明,DeepSeek的崛起已经让OpenAI感受到了威胁,也将让AI领域的竞争更加激烈。
责编:李丹
校对:赵燕
版权声明
证券时报各平台所有原创内容,未经书面授权,任何单位及个人不得转载。我社保留追究相关行为主体法律责任的权利。
转载与合作可联系证券时报小助理,微信ID:SecuritiesTimes
证券时报各平台所有原创内容,未经书面授权,任何单位及个人不得转载。我社保留追究相关行为主体法律责任的权利。
END
点击关键字可查看
潜望系列深度报道丨股事会专栏丨投资小红书丨e公司调查丨时报会客厅丨十大明星私募访谈丨历史新高!苹果最新发布丨刚刚!A50直线拉升!丨昨夜,中国资产暴涨!丨刚刚!金价,历史新高!丨破10亿元!《哪吒》票房第一!《封神》口碑分化,春节档创纪录!丨售罄、约满、限流!国内外游“双向奔赴”活力绽放丨半导体巨头,暴涨!丨突发!美国一客机与直升机相撞坠河,特朗普已听取简报丨不降息!美联储,凌晨重磅!美股全线收跌丨美联储,重磅来袭!
END
点击关键字可查看
潜望系列深度报道丨股事会专栏丨投资小红书丨e公司调查丨时报会客厅丨十大明星私募访谈丨历史新高!苹果最新发布丨刚刚!A50直线拉升!丨昨夜,中国资产暴涨!丨刚刚!金价,历史新高!丨破10亿元!《哪吒》票房第一!《封神》口碑分化,春节档创纪录!丨售罄、约满、限流!国内外游“双向奔赴”活力绽放丨半导体巨头,暴涨!丨突发!美国一客机与直升机相撞坠河,特朗普已听取简报丨不降息!美联储,凌晨重磅!美股全线收跌丨美联储,重磅来袭!