OpenAI的GPT系列率先打响知名度,GPT-3靠着1750亿个参数在自然语言处理这块“杀疯了”,直接点燃了全球大模型研发的战火。
科技巨头们坐不住了,谷歌、百度纷纷下场,带着BERT、文心一言强势入局,这竞争激烈程度,简直就是“神仙打架”。
就在这混战之中,DeepSeek如同超级新星,横空出世,开始了它的“逆袭”之路 。
不曾想到,这个春节,最火爆的话题,不是旅游与消费,而是DeepSeek与人工智能。
上至美国总统特朗普,中至全球所有AI公司,下至全球数十亿关注AI进展的用户,在最近十余天之内都在讨论、研究和热议DeepSeek。
从1月20日DeepSeek公司(全称杭州深度求索人工智能基础技术研究有限公司)发布DeepSeek-R1算起,十余天内,在全球范围内快速掀起关注热潮,成为AI发展历史上的现象级事件之一。
至1月27日,在苹果App Store中国、美国区免费榜上,DeepSeek均成为第一, 超过了来自OpenAI的ChatGPT。
最值得关注的两则评论,分别来自美国总统特朗普和OpenAI首席执行官萨姆·奥尔特曼。
特朗普认为,中国的DeepSeek公司“提出了一种更快、更便宜的人工智能方法,我认为这是积极的”,“(这)给我们(美国)的行业敲响警钟,我们需要专注于竞争以赢得胜利。”
萨姆·奥尔特曼于1月27日晚在社交媒体上发文,称“DeepSeek-R1是一款令人印象深刻的模型,尤其是考虑到它能够以这个价格提供”,“有这样的新竞争对手确实令人振奋。”
DeepSeek能够从“网红”到“长红”吗?
当DeepSeek已经用低价策略走出一条独特的路后,AI大模型还会继续走昂贵之路吗?
AI大模型到底要走开源还是闭源之路?
以及,如何看待DeepSeek之后的中美AI技术水平差距?换言之,中国真的借DeepSeek之机实现“弯道超车”了吗?
DeepSeek能否从“网红”到“长红”?
近几天的表现反映出,DeepSeek并不是一个网红AI产品这么简单,全球各界已经归纳出其爆火的几个原因。
在开发背景方面,DeepSeek出自中国,而不是AI技术能力更为领先的美国;而且,其开发者也不是中国的互联网大厂,或者是AI“六小虎”等知名企业,而是一家中国初创公司,有西方网友甚至称其为“来自东方的神秘力量”。
性价比方面,DeepSeek能力强、体验感佳,水平堪比OpenAI相关产品,但价格仅仅是后者的百分之几。
在发展路径方面,DeepSeek与OpenAI“反着来”,成本低,所需算力少,一定程度上打破了AI大模型研发的“高价”神话。同时,与全球AI大模型龙头企业主要走闭源路线完全不同,DeepSeek技术路线完全开源,再次挑动了“开闭源之争”话题。
1 月 27 日,现象级国产游戏《黑神话:悟空》的制作人冯骥评价称,DeepSeek“可能是个国运级别的科技成果”。
他点评DeepSeek说,“如果有一个 AI 大模型做到了以下(六条)的任何一条,都是超级了不起的突破。但DeepSeek 全部、同时做到了。”他提到的DeepSeek六大亮点,分别为强大、便宜、开源、免费、联网和本土。
在中国AI业内人士看来,自2023年7月成立起,DeepSeek已有过两次“高光时刻”。这次在全球火出圈,可以称得上是DeepSeek的第三次高光时刻。
之后中国AI全行业在两周内迅速跟进,外界直呼“让大模型降成白菜价”。
可以预见,不用很久,DeepSeek将成为中国AI领域正式的“新贵”,估值有望超过“六小虎”水平。但与此同时,DeepSeek面临的国内外竞争也将更加激烈。
从国外竞争形势看,DeepSeek对美国AI行业的刺激很大,未来技术起点高于中国企业的美国AI行业必然会更加进取。
1月21日,特朗普在上任美国总统后第二天,就在白宫宣布了一项名为“星际之门”(Stargate)的人工智能项目,将由美国甲骨文公司、OpenAI和日本软银集团联合出资5000亿美元打造。
在国内,各互联网大厂与AI“六小虎”、“四小龙”,甚至其他较小型的大模型公司,也必然会如美国企业般调整战略和技术路线,进行新竞争。未来有下一个DeepSeek的出现,也不是没有可能。
AI大模型还会继续走“烧钱”之路吗?
贵、烧钱,是AI大模型效用足够激动人心的另一面。
AI大模型最烧钱的部分是算力,需要海量性能最先进的GPU芯片,其运行还需要巨量的电力能源支持;其技术核心是算法,需要大量顶级的人工智能专家和技术人员参与研发。
但DeepSeek此次对上述模式进行了一次让人震撼的改变——一家小型初创公司,仅100多名研发人员,在算力受限情形下,使用相对“极低”的训练费用,训练出技术水平堪比全球顶极的AI大模型,且实现了“极低”的用户收费。
据央视网报道,DeepSeek公司R1模型训练成本仅为560万美元,远远低于OpenAI 、谷歌等美国科技巨头在人工智能技术上投入的“数亿美元乃至数十亿美元”。
再次,从市场近期反应看,“终止昂贵之路”一说还没得到更进一步支持。
开源,还是闭源
DeepSeek是坚定的开源路线支持者。任何人均可自行下载与部署。
同样坚持开源路线的Meta 的首席人工智能科学家Yann LeCun近期发文表示,DeepSeek 的成功“并不是中国的人工智能超越了美国,而是开源模型正在超越专有模型”。
DeepSeek拉近了中美AI的技术差距吗?
DeepSeek还引发了资本市场的剧烈反应,有西方媒体称其为中国大模型“爆击华尔街”。
1月27日,美国股市开盘后,科技板块整体下跌,其中美国芯片巨头英伟达(NVIDIA)暴跌约17%。随后,美国、欧洲电力供应商的股价也遭受重创(AI大模型预训练、运行等对能源需求巨大)。
英伟达近期股价走势
客观、冷静地看,DeepSeek当然是重要的局部突破,但整体上中国AI领域尤其AI大模型领域与美国还是有着一定差距的。
最后,从市场表现看中美差距依然较大。
至于缩短了多少,或许还需要市场后续发展来给出答案。凤凰周刊
敬请欣赏下面更多的原创作品
4.温馨老子山游
9.探访前童古镇
李少全
努力成为原创作品的合格生产者