DeepSeek-R1强势来袭
2025年注定是AI大爆发的一年。就在昨天,深度求索发布了全新的推理模型——DeepSeek-R1,全面对标 OpenAI 的 o1 模型。DeepSeek-R1 遵循 MIT License 协议,这意味着用户可以自由使用模型,并通过蒸馏技术利用 R1 训练其他模型。此外,DeepSeek 还上线了 R1 的 API,用户在调用时只需设置model='deepseek-reasoner',即可轻松体验其强大的推理功能。从各个高难度benchmark结果来看,DeepSeek-R1已经比肩OpenAI-o1-1217,妥妥的第一梯队推理模型。同时蒸馏Qwen2.5-32B而来的DeepSeek-R1-32B也取得非常惊艳的效果,和OpenAI-o1-mini旗鼓相当。
训练方法
<think>
标签包裹。蒸馏技术
R1-Distill-Qwen-7B 在 AIME 2024 上的得分达到了 55.5%,远超 QwQ-32B-Preview。 R1-Distill-Qwen-32B 在 AIME 2024 上得分 72.6%,在 MATH-500 上得分 94.3%,在 LiveCodeBench 上得分 57.2%,这些结果显著优于之前的开源模型,并与 o1-mini 相当。
性能评估
推理任务:在 AIME 2024、MATH-500 等任务上,取得了与 OpenAI-o1-1217 相媲美的成绩。 知识密集型任务:在 MMLU、MMLU-Pro 和 GPQA Diamond 等任务上,性能显著超越了 DeepSeek-V3 模型。 长文本理解任务:在 FRAMES 数据集上的准确率达到了 82.5%,优于 DeepSeek-V3 模型。 开放式问答任务:在 AlpacaEval 2.0 和 Arena-Hard 基准测试中,分别取得了 87.6%的 LC-winrate 和 92.3%的 GPT-4-1106 评分。
模型下载
OpenCSG社区:
https://opencsg.com/models/deepseek-ai/DeepSeek-R1-Zero
https://opencsg.com/models/deepseek-ai/DeepSeek-R1
欢迎加入OpenCSG社区
•贡献代码,与我们一同共建更好的OpenCSG
•Github主页
欢迎🌟:https://github.com/OpenCSGs
•Huggingface主页
欢迎下载:https://huggingface.co/opencsg
•加入我们的用户交流群,分享经验
扫描上方二维码添加小助手
“ 关于OpenCSG