首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
DeepSeek开源推理模型 R1,比肩OpenAI o1正式版。
文摘
2025-01-21 11:19
北京
对标 OpenAI o1 正式版的国产大模型来了!
1 月 20 日晚,DeepSeek(深度求索)公司发布推理模型 DeepSeek-R1 正式版,同步开源模型权重,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
网友热评:这,才是真正的OpenAI。
能力相当于一个月 200 美元的 ChatGPT o1 版本,却完全免费。
不止如此,DeepSeek 一同开源的还有「技术报告」,那些训练 R1 时踩过的坑、做过的事通通讲给你听,只为铺平 AGI 的路。
第一时间阅读这份技术报告后,英伟达高级研究科学家 Jim Fan 带来了新鲜解读,值得我们大声齐读:
「我们生活在这样一个时代:由非美国公司保持 OpenAI 最初的使命——做真正开放的前沿研究、为所有人赋能。这似乎讲不通,但戏剧性的往往最有可能发生。
DeepSeek-R1 不仅开源了大量模型,还泄露了所有训练秘密。他们可能是第一个显示 RL(强化学习)飞轮发挥主要作用、持续增长的 OSS 项目。
影响可以通过『内部实现了 ASI』或『草莓计划』等神话名称来实现。也可以通过简单地转储原始算法和 matplotlib 学习曲线来产生影响。」
中国公司 DeepSeek,正在实现赶超 OpenAI 的使命。
01
DeepSeek-R1:
实力派选择「秀肌肉」
「DeepSeek-R1」的发布,摆明了是:有实力所以明晃晃地秀肌肉!
这首先体现在它不整期货那一套,
而是「发布即上线」
,现在,你就可以在 DeepSeek 官网与 App 体验最新的推理模型 DeepSeek-R1,随便体验随便用,免费。
登录 DeepSeek 官网或官方 App,打开「深度思考」模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。|图片来源:DeepSeek
DeepSeek-R1 也同步上线了 API,对用户开放思维链输出,通过设置 model='deepseek-reasoner' 即可调用。
值得注意的是 DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。看下面这这图你会有更直接的体感,输出 API 价格只有 OpenAI o1 的 3%。
低价背后,显然仍是秀肌肉,价格实力展现了技术实力——从AI Infra 层面降本的技术能力。
图中深蓝色柱子代表 DeepSeek-R1,剩下的灰色、浅蓝、青浅灰分别是 OpenAI o1 不同版本的价格。|来源:DeepSeek
第三波「秀肌肉」体现在开源开放。DeepSeek-R1 开源模型权重几乎是选择了最开放的许可证和用户协议,开源 License 统一使用 MIT,产品协议明确可「模型蒸馏」,主打一个让大家多多来基于它做二次开发、集成。DeepSeek 甚至主动给大家示范引导将 R1 作为教师模型来蒸馏出一个更小但仍有实力的模型,「通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果」。
事实上,
模型开源选择不同的 License 背后大有学问,这直接体现不同模型厂商的开放程度,更体现开源背后的目的和策略。
比如像 Llama、Qwen、GPT-2 等模型就不止开放权重,还开放了模型训练的源代码,这可能是为了追求衍生模型的繁荣。而 DeepSeek-R1 选择只开放权重,但换成了标准化、宽松的 MIT License,更多还是为了让更多开发者能用起来,感受 DeepSeek-R1 的能力。
我们再来通过几大主流测试基准来感受一下 DeepSeek-R1 的实力。「性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。」
图片来源:DeepSeek
对于 DeepSeek-R1 带来的直观感受,硅基流动联合创始人杨攀表示,
不止模型能力和性能出色,最近两个模型 (R1 和 V3) 在训练技术和模型底层架构上都做了领先全球的创新,而且其论文开放程度也震惊了业界。
在一并公开的模型技术报告中,DeepSeek 将「DeepSeek-R1」训练技术全部公开,「旨在促进技术社区的充分交流与创新协作」。
根据技术报告,硅基流动创始人&CEO 袁进辉称,DeepSeek-R1 是无人区的探索和发现。|来源:即刻
对于开源模型加技术报告,开源社联合创始人林旅强此前向极客公园表示,开源是最好的「秀技术肌肉」的方式,同时「有的开源模型只开源、不讲他是怎么做的,但是合乎大家期待的开源模型是要搭配技术报告,等于是发 paper 了。开源模型不够的,因为模型是黑盒子,技术报告会说明一些东西。DeepSeek 他们是很透明地把他的技术报告拿来公开,即使一定程度还是会捂着掖着,但是已经是开得比较有态度。今天全球范围的学术派还是会认为,你把一个东西做出来再以开源的方式,是有学术追求的。」
如果 DeepSeek 的目标是真正达到 AGI,就不断需要把踩过的坑、做过的事情开放出来,让大家少走一点弯路,开放才能让整个行业更快达到 AGI,他补充道。
最后,我们来随机看一些用户实测评价(截图来源:X.com):
Twitter 用户盛赞 R1 的实力|图片来源:X
02
DeepSeek,
还有什么
惊喜是我们不知道的?!
尽管昨晚 DeepSeek-R1 的发布引发了「这才是 Open AI 吧」「东方的 OpenAI」等一片称赞。但 DeepSeek 强得非常扎实、全面。
去年在 2024 年 11 月 20 日发布 DeepSeek-R1-Lite 预览版时,美国著名半导体与 AI 咨询机构 Semianalysis 创始人 Dylan Patel 就坐不住了,第一时间下场「提醒」大家:
他们有 5 万张 H100 GPU!请不要以为他们只有 1 万张 A100!
因为众所周知的原因,这大概率不是事实,却能反映 DeepSeek-R1-Lite 的强悍到让行业紧张。
一个月后,DeepSeek 上线并同步开源了媲美 GPT-4o 和 Claude 3.5 Sonnet 的模型「DeepSeek-V3」,并附上了详实的技术报告。这一次,几乎惊动了整个硅谷AI圈。卡神(OpenAI 创始团队、前 Tesla AI 总监 Andrej Karpathy)、Alexandr Wang(Scale.ai 创始人)、田渊栋(Meta AI 科学家)、贾扬清(Lepton AI 创始人)……人均一句「难以置信」。就连 Sam Altman 都忍不住出来酸一把「复刻已经被验证过奏效的东西是容易的」。
DeepSeek-V3 发布后,Sam Altman 疑似喊话 DeepSeek。|截图来源:X.com
随着模型性能逐渐走向全球第一梯队,DeepSeek 也迎来了新的发展契机。
过去一年半,DeepSeek 专注于模型和研究,但从今年开始,DeepSeek 着手做应用了。
2025 年 1 月 15 日,DeepSeek 推出移动端 AI 助手「DeepSeek」App。目前看,DeepSeek App 跟网页版功能一致,主要有两个功能:联网搜索和深度思考,主打一个简洁,聊天记录也会同步显示在手机端和网页端,尚未针对移动端进行特定功能的打磨,也没有市面上 AI 助手类 App 丰富、fancy 的功能,更像是一个能让你在手机上体验 DeepSeek 最新模型的入口。
DeepSeek App 展示图|来源:Apple Store
对此,一位投资人向极客公园解释 DeepSeek 开始做应用背后可能的战略转向:「前期 DeepSeek 靠自己的算力优势积累出了模型技术的领先度。后期要补数据,发 App 是补数据的手段之一。接入用户数据和场景,可以帮助他更好地进行模型能力的迭代和升级。」
同时,有了 DeepSeek-R1 和其他模态、类型越来越好的模型,可以期待未来 DeepSeek 在比如代码模型/应用里有更激进的表现,惊喜才刚刚开始。
官方放出的研究论文链接:
https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
更多阅读
45天100万美金ARR,这家创业公司找到了AI 3D生成的PMF
对话生数科技Vidu产品负责人:100天千万用户之后,2025年视频生成产品会变成怎样?
Gamma创始人自述:从0到4000万用户,我们是怎么做增长的?
Recraft专访:20人,8个月做出了最好的文生图大模型,目标是AI版的Photoshop
5亿估值、2500万用户,Suno CEO专访:Instagram拯救了摄影,我们想用AI拯救音乐
转载原创文章请添加微信:founderparker
Founder Park
来自极客公园,专注与科技创业者聊「真问题」。
最新文章
Ben Thompson聊DeepSeek,硅谷关于DeepSeek最值得看的一篇
硅基流动上线DeepSeek R1&V3推理服务!和华为云合作,全国产服务
为什么说DeepSeek的R1-Zero比R1更值得关注?
应战DeepSeek, OpenAI紧急上线o3-mini!价格打骨折,免费用户也能用
DeepSeek正确使用指南!可以放弃提示词那套了
Anthropic创始人发声:DeepSeek事件前所未有,美国要继续加强出口管制
DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿
创造历史!DeepSeek登顶AppStore,开源竞相复现、Meta 很焦虑
创业第一步:不要模仿你的创业偶像,他们都没说「实话」
CES 上最火的 AI 眼镜,竟然是中国美瞳一哥做的
百川发布推理思考模型M1-preview,行业首个开源医疗增强大模型M1-14B
OpenAI发布智能体Operator!能推理、联网自主执行任务
跟硅谷的核心AI公司聊完后,得到了这 60 条关键洞察
靠口音测试小游戏拿到泼天流量,一款口音矫正app如何月入百万美元?
Anthropic CEO 专访:Claude 2025 新功能全剧透,不会推出单一的推理模型
Kimi官方复盘:k1.5复现o1的思考过程
2024年,出海做得好的AI产品有哪些共识与反共识?
阿里达摩院2025预测:底层架构会统一,Scaling Law进入2.0阶段
Kimi 发布k1.5思考模型:首个达到o1满血水平的多模态模型,还有完整训练技术报告
DeepSeek开源推理模型 R1,比肩OpenAI o1正式版。
对话生数科技Vidu产品负责人:100天千万用户之后,2025年视频生成产品会变成怎样?
对话Mirumi创造者:CES上爆火的陪伴机器人是怎样炼成的?
和当下最酷的 AI 硬件们一起,聊聊 2025 年什么方向值得干?
Transformer继任者「Titans」来了,上下文记忆瓶颈被打破
45天100万美金ARR,这家创业公司找到了AI 3D生成的PMF
周六、CES上最酷的产品们一起聊一聊,AI硬件接下来怎么做?
Gamma创始人自述:从0到4000万用户,我们是怎么做增长的?
AI+宗教火了:爆赚6000万美金,超1000万人对着GPT求神拜佛
周五、Google Ads案例解析:AI出海,如何做精准投放与变现?
Recraft专访:20人,8个月做出了最好的文生图大模型,目标是AI版的Photoshop
CES提前上演百镜大战,AI眼镜这2个方向4大技术最火
5亿估值、2500万用户,Suno CEO专访:Instagram拯救了摄影,我们想用AI拯救音乐
周五、Google Ads案例解析:AI出海,如何做精准投放与变现?
28岁、6个月,打造人类第一个AI程序员、还有20亿估值的AI独角兽
下周五,Google Ads案例解析:AI出海,如何做精准投放与变现?
CES 2025,陪伴宠物、学习机、眼镜,AI硬件真是太多啦!
DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿
Product Hunt本周最佳产品(12.30-1.5),字节AI设计平台登顶
255家大模型企业、34个备案大模型、100余家投资机构,模速空间才是中国的AI「硅谷」
英伟达、谷歌出手超30次,2024年大厂投资AI的三大共识
a16z华裔合伙人Jennifer Li:小模型+端侧AI将定义2025
CES老黄放大招:RTX5090、个人AI计算机Project Digits,还开源了世界模型Cosmos
独立开发者idoubi:2024年,我上线了11款AI产品
已经验证了PMF的AI Coding,在国内的落地会有何不同?
Altman专访:关于解雇风波、OpenAI的发展、与马斯克的冲突,最深入的一次对话
AI 医疗赛道最受关注的独角兽:5000万ARR、25亿估值,AI Scribe场景PMF已验证
Sarah Guo总结2024年AI现状:应用层的价值被低估了
今天不发文章了,聊两句
张鹏对谈汪华、袁进辉、胡修涵:2025 年,匍匐也要前进,活下来最重要
75 封内部邮件,还原最真实的 OpenAI 创业历程
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉