对话DeepSeek

文摘   2025-01-29 08:09   河南  
我们因地制宜培育新质生产力,新产业新业态新模式竞相涌现,新能源汽车年产量首次突破1000万辆,集成电路、人工智能、量子通信等领域取得新成果。
嫦娥六号首次月背采样,梦想号探秘大洋,深中通道踏浪海天,南极秦岭站崛起冰原,展现了中国人逐梦星辰大海的豪情壮志。
——2024年12月31日,习近平总书记二〇二五年新年贺词


自2025年1月20日发布,最新开源模型DeepSeek R1在全球范围内引发持续轰动。早在2024年岁末,DeepSeek-V3大模型发布,就迅速成为全球人工智能(AI)领域的焦点,刷屏科技圈,很多人化身“自来水”,在各大社交媒体、科技论坛上发帖讨论,不吝溢美之词。

在全球范围内的行业基准测试中,DeepSeek-V3达到与Llama 3(开源大模型标杆,由扎克伯格的Meta公司开发)、GPT-4o(OpenAI大模型)相当的水平,闯入了多个AI大模型排行榜单前列。聊天机器人竞技场(Chatbot Arena)最新数据显示,DeepSeek-V3位列开源模型榜第一,在全模型榜单里排名第七,也是中国模型中排名最高的。更令人诧异的是,DeepSeek-V3模型训练所消耗的算力,只有Llama的1/11。

DeepSeek-V3轰动AI圈,背后的中国公司深度求索(DeepSeek)也“浮出水面”。硅谷同行称其为“东方神秘力量”,对DeepSeek团队表现出浓厚的兴趣。而在国内,“雷军千万年薪挖角DeepSeek研究员罗福莉”的话题也上了社交平台热搜。

近日,国产AI DeepSeek在中国、美国的科技圈受到广泛关注,甚至被认为是大模型行业的最大“黑马”,在外网,DeepSeek被不少人称为“神秘的东方力量”。


1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一


苹果美国区应用商店


苹果APP Store中国区免费榜


1月27日
相关微博热搜刷屏


游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果



DeepSeek是一款由国内人工智能公司研发的大型语言模型,拥有强大的自然语言处理能力,能够理解并回答问题,还能辅助写代码、整理资料和解决复杂的数学问题。
与OpenAI开发的ChatGPT相比,DeepSeek不仅率先实现了媲美OpenAI-o1模型的效果,还大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本达到了GPT-o1级别的表现,引发海外AI圈的广泛讨论。
北京邮电大学人工智能学院人机交互与认知工程实验室主任刘伟介绍,DeepSeek最大的优势在于算法的改进和优化,节省了算力和数据量。以前如果说OpenAI是“大力出奇迹”,如今DeepSeek则“小力也可以出奇迹”——小的算力用新的方法也能创造奇迹。
南京大学人工智能学院教授俞扬表示,DeepSeek在算法上进行了相应的优化,使得训练成本大幅降低。
DeepSeek的成功被一些人视为中国技术理想主义的体现,甚至被外国人比喻为神秘的东方力量。

天下有料
为人生加料,做有料之人。
 最新文章