超越ChatGPT,国产应用DeepSeek在美国“登顶”了

时事   2025-01-27 13:10   江西  


1月27日,由国产大模型公司杭州深度求索开发的Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。

苹果美国区应用商店

苹果APP Store中国区免费榜

Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。1月20日,该公司正式发布推理大模型DeepSeek-R1。一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。
作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。
更令市场惊讶的是,据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的不到十分之一。DeepSeek表示,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。此外,DeepSeek不仅将R1训练技术全部公开,还蒸馏了6个小模型向社区开源,允许用户借此训练其他模型。
英伟达高级研究科学家Jim Fan表示,DeepSeek-R1可能是“首个展示了RL(强化学习)飞轮可以发挥作用且能带来持续增长的OSS(开源软件)项目”。其中,“飞轮”用来形容AI系统中自我强化、正向循环的过程。DeepSeek的论文显示,不同于过去AI模型往往依赖于监督微调(SFT,指AI模型通过已标注的数据进行训练),R1完全由强化学习驱动,证明了直接强化学习是可行的。
Jim Fan写道:“我们正处于一个奇特的时间线上,一家非美国公司正在践行OpenAI最初的使命,即实现真正开放的前沿研究并让所有人受益。这种情况简直无法理解。最有娱乐性的结果却是可能性最大的结果。”

来源:澎湃新闻

推荐阅读

全国首根绝缘金丝键合丝诞生

  在芯片封装领域打破西方垄断

“无陪护”病房 探索医疗护理服务新模式

“碎碎鸭”重生之我在景德镇当“网红”

21岁瓷博会整新活 ●MV两万七千多个日夜

双向奔赴的“反差萌”小镇飞行家,起飞!

稻田里的“虫虫特工队”  一根金丝探新质

今天,我们是头条  小编的瓷博会vlog

免费“无陪护”病房 让患者有“医靠”  

290秒!祖国我想对你说“大福”洗车行

跟着荣姐去卖菜 ●是音乐也是良药 

他们,坚守最险处,冲锋最前线!

特警“汪汪队”,出击!龙舟小镇“寻龙记”

有朋自远方来江西的夏天“很好吃”

“江西造”——开山破土跨远洋

双向奔赴的窗帘之约青春正当燃

这个“五一”,我们的“侯爷”都在忙啥

一起奔赴,江西的浪漫之约

用生命诠释使命,送别救人英雄朱如新

青山埋忠骨 丹心护英雄跨越时空的相见

龙气满满!总有一款能让你龙行大运

回家的行囊 跨越万水千山 奔赴人间团圆

2024迎着新年第一缕阳光一起许下最美心愿




“点点赞”再走吧!


江西新闻联播
政经权威解读 把握发展大势
 最新文章