中国AI大模型公司DeepSeek所带来的技术突破引发了行业震动。周一美国三大股指开盘全线下跌,午盘后道指转涨,截至收盘,道指上涨0.65%,标普500指数下跌1.46%,纳指大跌3.07%。据报道,DeepSeek开发的模型在多项测试中的表现都优于OpenAI,且设计成本不到600万美元。有分析称DeepSeek正在以低成本的方式颠覆目前人工智能市场的格局。据悉,DeepSeek应用程序已反超竞争对手OpenAI的ChatGPT,成为美国苹果应用商店下载量最大的免费应用程序。在国内各大社交媒体上,DeepSeek更是引起了广泛讨论,“中国AI大模型震动华尔街”“全球掀DeepSeek复现狂潮”“DeepSeek登顶美区苹果下载榜”等等话题迅速冲上热门。来自广东湛江的80后创始人梁文锋的相关报道也全网刷屏。
另外,《黑神话:悟空》制作人冯骥、金沙江创投朱啸虎也纷纷下场推荐DeepSeek。DeepSeek搅动纳斯达克
美国芯片巨头英伟达股价大跌17%
据央视新闻,当地时间1月27日,美国股市开盘即大幅下跌,科技板块尤为惨重。市场分析认为,核心原因是中国人工智能初创公司DeepSeek的最新突破,动摇了美国科技行业的“无敌”地位。欧美知名半导体股普遍下跌,美国芯片巨头英伟达大跌16.97%,报每股118.42美元,单日市值蒸发5890亿美元,创下华尔街史上最大的单日市值蒸发纪录。博通公司跌超17%,超威半导体公司(AMD)跌超6%,阿斯麦跌超5%,微软股价下跌2%。分析师指出,DeepSeek“似乎以极低的价格建立了一个突破性的人工智能模型,而无需依赖最先进的芯片,这引发了市场对在芯片和算力方面高额资本支出是否有用的质疑。”此外,人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌21%,Vistra的股价下跌29%。对标OpenAI o1用更少的卡训练出效果差不多的模型 就在1月20日,DeepSeek刚发布了性能对标OpenAI o1 正式版的R1大模型,并同步开源模型权重。据悉,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。值得一提的是,在模型训练费用昂贵的当下,DeepSeek仅仅花费了560万美元训练R1模型,但该模型在很多AI基准测试中已经达到甚至超越OpenAI o1模型。另外,不少开发者尝试复现 DeepSeek-R1。比如,伯克利 AI 研究所在读博士潘家怡(Jiayi Pan)就遵照 DeepSeek R1-Zero的算法复现,结果只用了不到30美元的计算成本,就让其项目中的模型拥有了自我验证和探索的能力。牛津大学博士、百度前高级科学家吴俊德在社交媒体上表示,DeepSeek在海外已被吹上天了,其认为行业贡献而言:GPT>deepseek>gemini>llama及其他。谈及DeepSeek引起关注的原因,吴俊德表示,“很多人的着眼点在于DeepSeek用很少的卡也能训练出效果差不多的模型,但这是结果,更重要的是DeepSeek这次证明了纯粹的outcome reward Rl能够直接把模型提到o1水平,在他出来之前,业内所有人都认为需要prm(process reward model)才能做到这点,这已经是颠覆行业的发现。”吴俊德还提到,这意味着,“用更少的卡训练出效果差不多的模型”可能不仅仅是节约成本这么简单,更是一种新的进化方式,意味着在这种方法往上堆更多的卡有可能把模型能力再往上提升一个数量级,甚至直接达到AGI(通用人工智能)。《黑神话:悟空》制作人:“可能是个国运级别的科技成果”1月26日晚,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥也发了一篇长微博推荐DeepSeek。他表示,DeepSeek V3已经用了一个月,但R1仅仅用了5天,不得不来发这条微博。“先讲一句暴论:DeepSeek可能是个国运级别的科技成果”。冯骥打了个比方说,如果有一个AI大模型做到了以下的任何一条,都是超级了不起的突破。“一是强大到比肩O1的推理能力,暂时没有之一;二是便宜,参数少,训练开销与使用费用小了一个数量级;三是开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型;四是免费,目前提供的服务完全免费,任何人随时随地可用;五是联网,暂时唯一支持联网搜索的推理模型(o1还不支持);六是本土,深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成。” 金沙江创业投资基金主管合伙人朱啸虎也在社交媒体上表示,“DeepSeek登顶美区App Store,是技术理想主义者的胜利,最难的是最简单的。专注于技术和创新,远胜投放买流量和PR;二是行业技术迭代周期远快于资本支出的回报周期,前期的重资本投入还未取得充分回报,就已经过时,需要加速折旧摊销,整个LLM行业都需要重塑估值体系;另外给民营经济生长的缝隙,不需要政府投入,回报远超产业政策的扶持。”公开资料显示,DeepSeek是幻方量化旗下的AI公司,创立于2023年,幻方量化创始人梁文锋在量化投资和高性能计算领域有深厚背景,毕业于浙江大学电子工程系人工智能方向的。DeepSeek一直走开源、性价比路线,一直被冠以“AI界拼多多”的名号,至今还没融过资。去年5月,DeepSeek发布DeepSeek-V2,价格是GPT-4-Turbo的近百分之一,“AI界拼多多”瞬间声名鹊起。去年12月,DeepSeek还发布了大模型DeepSeek-V3,因该模型“2048个GPU、2个月、近600万美元”的极低训练预算受到关注。 来源:南方都市报(转载已获许可)、央视新闻、央视财经
编辑:张雪依
审核:胡菲菲、戎丽娟、徐洁