沸腾啦,“东方神秘力量”近日爆火!

民生   2025-01-27 15:35   湖北  

近日,国产AI DeepSeek在中国、美国的科技圈受到广泛关注,甚至被认为是大模型行业的最大“黑马”,在外网,DeepSeek被不少人称为“神秘的东方力量”。


登顶苹果中、美地区应用商店

免费APP下载排行榜


1月27日,记者留意到DeepSeek应用已经登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。



苹果美国区应用商店


苹果APP Store中国区免费榜

据了解,开源的DeepSeek-R1于上周发布,并称该模型性能对标OpenAl o1正式版。发布后,该模型的热度持续上涨,直至今日,微博等社交平台上仍有多个词条和热搜。


“80后”创始人来自这里

2025年1月20日,DeepSeek正式发布DeepSeek-R1模型。这款大模型在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

DeepSeek的创始人梁文锋在17岁时考入浙大,读的是电子工程系人工智能方向,毕业后在浙大攻读硕士研究生。

2015年,30岁的梁文锋和朋友一起创办了杭州幻方科技有限公司。2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,几乎所有的量化策略都采用AI模型计算。

2023年5月,38岁的梁文锋宣布做通用人工智能(AGI)。7月,他正式创办杭州深度求索人工智能基础技术研究有限公司,就是DeepSeek公司,专注于AI大模型的研究和开发,公司设在杭州。

从公开的工作经历和职业生涯来看,梁文锋在量化投资和高性能计算领域具有深厚的背景和丰富的经验,创业范畴横跨金融和人工智能领域。

大模型界的“拼多多”

在硅谷,DeepSeek就被称作“来自东方的神秘力量”,也是网上热议的“杭州六小龙”之一。真正让DeepSeek火出圈的是2024年12月26日,这家公司宣布上线并同步开源的 DeepSeek-V3模型,并公布了长达53页的训练和技术细节。它以1/11的算力、仅2000个GPU芯片训练出性能超越GPT-4o的大模型。其总训练成本只有557.6万美元,而GPT-4o的约为1亿美元,使用25000个GPU芯片。双方的成本至少是10倍的差距。在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o。

国外独立测评机构Artificial Analysis测试后,发出了“超越了迄今为止所有开源模型”的惊叹;Meta科学家田渊栋感慨:“这是非常伟大的工作。”“性价比”是商业社会中的制胜法宝之一,DeepSeek也因创新的模型架构和史无前例的性价比被称为“大模型界的拼多多”,引发字节、阿里、百度等大厂的大模型价格大战。在外部看来,降价很像在抢用户,也有人说这家公司是行业的一条鲶鱼,公司创始人梁文锋表示,“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。”“抢用户并不是我们的主要目的,我们降价一方面是因为在探索下一代模型的结构中,成本先降下来了;另一方面也觉得无论API,还是AI,都应该是普惠的、人人可以用得起的东西。”梁文锋说。

冯骥评价DeepSeek:
可能是个国运级别的科技成果

1月26日,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。


冯骥表示:“希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”

蛇年将至
DeepSeek给大家送上新年祝福

记者登录DeepSeek官网后,尝试使用大模型,生成了一段新年祝福。

湖北省人民政府最新通知

准备就绪!春晚再剧透,黄鹤楼作《一起China Fun》背景

今迎小高峰!最新出行提醒→ | 武汉日历


编辑:吴曾
责编:皮瑞奇
编审:杨晓民
部分来源:新闻联播 DeepSeek官方微信 中国新闻社 都市快报
出品:武汉广播电视台

武汉广播电视台
融视界 看武汉
 最新文章