Nature报道 | 国产之光!开源AI模型DeepSeek-R1媲美OpenAI,惊艳科学界!

文摘   2025-01-24 18:30   江苏  

2025年1月23日,Nature杂志发表了一篇文章,引发了全球人工智能领域的轰动:来自中国的人工智能大模型DeepSeek-R1以低成本和开放性赢得了科学家的高度关注,被誉为OpenAI的o1模型的强劲对手。

DeepSeek-R1执行推理任务的级别与OpenAI的o1相同,并对研究人员开放。

1 月 20 日发布的 R1 的初步测试表明,它在化学、数学和编码方面的某些任务上的性能与 OpenAI的o1 相当。

DeepSeek是杭州建立该模型的初创公司,已将其发布为“开放权重”,这意味着研究人员可以在算法上进行研究和构建。该模型根据MIT许可发布,可以自由重复使用,但并未被视为完全开源的,因为尚未提供其培训数据。

DeepSeek 尚未公布训练 R1 的全部成本,但它向用户收取的费用约为 o1 运行成本的三十分之一。该公司还创建了 R1 的迷你“蒸馏”版本,以便计算能力有限的研究人员能够使用该模型。“o1 的实验成本超过 300 英镑,R1 的成本不到 10 美元,”Krenn 说。“这是一个巨大的差异,肯定会对其未来的采用产生影响。”

DeepSeek 引起热议的部分原因在于,尽管美国的出口管制限制了中国公司获得专为人工智能处理设计的最佳计算机芯片,但 DeepSeek 仍成功制造了 R1。华盛顿州西雅图的人工智能研究员 François Chollet 表示:“它来自中国的事实表明,高效利用资源比单纯的计算规模更重要。”

与 o1 一样,R1 使用“思想链”方法来提高LLMs解决更复杂任务的能力,包括有时回溯和评估其方法。DeepSeek 通过使用强化学习“微调”V3 来制作 R1,该模型奖励给出正确答案并以概述其“思维”的方式解决问题的模型。

在伴随模型的技术论文中报道的基准测试中,DeepSeek-R1在OpenAI造成的数学数学问题中得分为97.3%,在CodeForces竞赛中胜过96.3%的人参与者。这些与O1的能力相当。很难确定基准测试是捕获模型推理或概括的真正能力,还是仅通过通过此类测试。但是,由于R1是开放的,因此研究人员可以使用其经过思考链,剑桥大学的计算机科学家Marco Dos Santos说。他说:“这可以更好地解释模型的推理过程。”科学家已经在测试R1的能力。克伦(Krenn)挑战了两个竞争对手模型,以将3,000个研究思想分类,并将结果与人造的排名进行比较。在此措施上,与O1相比,R1的表现略有表现。Krenn说,但是R1在量子光学元件中的某些计算中击败O1。“这令人印象深刻。”

网页版:https://www.deepseek.com/

点击深度思考可转到DeepSeek-R1

天然产物靶点发现
天然产物靶点鉴定及文献解析交流,专注抗衰老相关天然产物
 最新文章