来自中国的“神秘力量”,火爆全球

时事   2025-01-27 13:16   北京  

由国产大模型公司杭州深度求索开发的Deepseek应用27日登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT,中国、美国的科技圈受到广泛关注。


环球时报27日称,Deepseek被认为是大模型行业的最大“黑马”,在外网被不少人称为“神秘的东方力量”。


苹果美国区应用商店


苹果APP Store中国区免费榜


DeepSeek成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。


2024年12月,DeepSeek-V3发布。AI数据服务公司Scale AI创始人Alexander Wang就发帖称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。


今年1月20日,DeepSeek正式开源R1推理模型,“物美价廉”的特性在海外开发者社区中引发了轰动。


目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。


长安街知事(微信ID:Capitalnews)注意到,DeepSeek备受关注的原因主要是性价比、开源及推理能力的提升等方面。


在性价比上,DeepSeek R1成本很低,预训练费用只有557.6万美元,不到OpenAI GPT-4o模型训练成本的十分之一。DeepSeek还公布了API(应用程序编程接口)的定价,收费大约是OpenAI o1运行成本的三十分之一。


同时,DeepSeek与外国大模型巨头闭源的路径不同,采用开源模式。DeepSeek公布了相关论文,整个过程可复现。


网络上已经出现了一波复现热潮,加州大学伯克利分校、香港科技大学、知名人工智能公司HuggingFace等纷纷成功复现,复现成本甚至低至几十美元。


报道称,中国DeepSeek的模型是开源的,是令人兴奋的真正原因,他们将制造这些东西的知识免费提供给全世界,确保没有人能够真正垄断它。


而美国公司和中国公司的做法截然相反。“你能看到OpenAI、Anthropic或谷歌开源任何强大的模型吗?到目前为止,我们从他们那里得到的只是皮毛。”


英伟达高级研究科学家Jim Fan在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。


在推理能力方面,据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。


这种卓越的性能不仅吸引了科技界的广泛关注,也让投资界看到了其巨大的商业潜力。


DeepSeek闲聊的界面截图


据悉,DeepSeek的团队不到140人工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。


《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。




长安街知事
提供靠谱的政事分析,解读注意不到的新闻细节,脑补有趣有料的政治常识。一群接近核心的小编,给你提供走心的时政新闻。
 最新文章