首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
夜袭 OpenAI,DeepSeek 开源最强推理模型 R1,再震欧美同行
创业
2025-01-25 07:31
北京
中国的 OpenAI,出现了。
文|宛辰
编 | 靖宇
文章来源 | 极客公园(ID:geekpark)
对标 OpenAI o1 正式版的国产大模型来了!
1 月 20 日晚,DeepSeek(深度求索)公司发布推理模型 DeepSeek-R1 正式版,同步开源模型权重,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
网友热评:这,才是真正的OpenAI。能力相当于一个月 200 美元的 ChatGPT o1 版本,却完全免费。
不止如此,DeepSeek 一同开源的还有「技术报告」,那些训练 R1 时踩过的坑、做过的事通通讲给你听,只为铺平 AGI 的路。
第一时间阅读这份技术报告后,英伟达高级研究科学家 Jim Fan 带来了新鲜解读,值得我们大声齐读:
「我们生活在这样一个时代:由非美国公司保持 OpenAI 最初的使命——做真正开放的前沿研究、为所有人赋能。这似乎讲不通,但戏剧性的往往最有可能发生。
DeepSeek-R1 不仅开源了大量模型,还泄露了所有训练秘密。他们可能是第一个显示 RL(强化学习)飞轮发挥主要作用、持续增长的 OSS 项目。
影响可以通过『内部实现了 ASI』或『草莓计划』等神话名称来实现。也可以通过简单地转储原始算法和 matplotlib 学习曲线来产生影响。」
中国公司 DeepSeek,正在实现赶超 OpenAI 的使命。
DeepSeek-R1:实力派选择「秀肌肉」
「DeepSeek-R1」的发布,摆明了是:有实力所以明晃晃地秀肌肉!
这首先体现在它不整期货那一套,而是「发布即上线」,现在,你就可以在 DeepSeek 官网与 App 体验最新的推理模型 DeepSeek-R1,随便体验随便用,免费。
登录 DeepSeek 官网或官方 App,打开「深度思考」模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。|图片来源:DeepSeek
DeepSeek-R1 也同步上线了 API,对用户开放思维链输出,通过设置 model='deepseek-reasoner' 即可调用。
值得注意的是 DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。看下面这这图你会有更直接的体感,输出 API 价格只有 OpenAI o1 的 3%。低价背后,显然仍是秀肌肉,价格实力展现了技术实力——从AI Infra 层面降本的技术能力。
图中深蓝色柱子代表 DeepSeek-R1,剩下的灰色、浅蓝、青浅灰分别是 OpenAI o1 不同版本的价格。|来源:DeepSeek
第三波「秀肌肉」体现在开源开放。DeepSeek-R1 开源模型权重几乎是选择了最开放的许可证和用户协议,开源 License 统一使用 MIT,产品协议明确可「模型蒸馏」,主打一个让大家多多来基于它做二次开发、集成。DeepSeek 甚至主动给大家示范引导将 R1 作为教师模型来蒸馏出一个更小但仍有实力的模型,「通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果」。
事实上,模型开源选择不同的 License 背后大有学问,这直接体现不同模型厂商的开放程度,更体现开源背后的目的和策略。比如像 Llama、Qwen、GPT-2 等模型就不止开放权重,还开放了模型训练的源代码,这可能是为了追求衍生模型的繁荣。而 DeepSeek-R1 选择只开放权重,但换成了标准化、宽松的 MIT License,更多还是为了让更多开发者能用起来,感受 DeepSeek-R1 的能力。
我们再来通过几大主流测试基准来感受一下 DeepSeek-R1 的实力。「性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。」
图片来源:DeepSeek
对于 DeepSeek-R1 带来的直观感受,硅基流动联合创始人杨攀表示,不止模型能力和性能出色,最近两个模型 (R1 和 V3) 在训练技术和模型底层架构上都做了领先全球的创新,而且其论文开放程度也震惊了业界。
在一并公开的模型技术报告中,DeepSeek 将「DeepSeek-R1」训练技术全部公开,「旨在促进技术社区的充分交流与创新协作」。
根据技术报告,硅基流动创始人&CEO 袁进辉称,DeepSeek-R1 是无人区的探索和发现。|来源:即刻
对于开源模型加技术报告,开源社联合创始人林旅强此前向极客公园表示,开源是最好的「秀技术肌肉」的方式,同时「有的开源模型只开源、不讲他是怎么做的,但是合乎大家期待的开源模型是要搭配技术报告,等于是发 paper 了。开源模型不够的,因为模型是黑盒子,技术报告会说明一些东西。DeepSeek 他们是很透明地把他的技术报告拿来公开,即使一定程度还是会捂着掖着,但是已经是开得比较有态度。今天全球范围的学术派还是会认为,你把一个东西做出来再以开源的方式,是有学术追求的。」
如果 DeepSeek 的目标是真正达到 AGI,就不断需要把踩过的坑、做过的事情开放出来,让大家少走一点弯路,开放才能让整个行业更快达到 AGI,他补充道。
最后,我们来随机看一些用户实测评价(截图来源:X.com):
Twitter 用户盛赞 R1 的实力|图片来源:X
DeepSeek,还有什么惊喜是我们不知道的?!
尽管昨晚 DeepSeek-R1 的发布引发了「这才是 Open AI 吧」「东方的 OpenAI」等一片称赞。但 DeepSeek 强得非常扎实、全面。
去年在 2024 年 11 月 20 日发布 DeepSeek-R1-Lite 预览版时,美国著名半导体与 AI 咨询机构 Semianalysis 创始人 Dylan Patel 就坐不住了,第一时间下场「提醒」大家:他们有 5 万张 H100 GPU!请不要以为他们只有 1 万张 A100!
因为众所周知的原因,这大概率不是事实,却能反映 DeepSeek-R1-Lite 的强悍到让行业紧张。
一个月后,DeepSeek 上线并同步开源了媲美 GPT-4o 和 Claude 3.5 Sonnet 的模型「DeepSeek-V3」,并附上了详实的技术报告。这一次,几乎惊动了整个硅谷AI圈。卡神(OpenAI 创始团队、前 Tesla AI 总监 Andrej Karpathy)、Alexandr Wang(Scale.ai 创始人)、田渊栋(Meta AI 科学家)、贾扬清(Lepton AI 创始人)……人均一句「难以置信」。就连 Sam Altman 都忍不住出来酸一把「复刻已经被验证过奏效的东西是容易的」。
DeepSeek-V3 发布后,Sam Altman 疑似喊话 DeepSeek。|截图来源:X.com
随着模型性能逐渐走向全球第一梯队,DeepSeek 也迎来了新的发展契机。
过去一年半,DeepSeek 专注于模型和研究,但从今年开始,DeepSeek 着手做应用了。
2025 年 1 月 15 日,DeepSeek 推出移动端 AI 助手「DeepSeek」App。目前看,DeepSeek App 跟网页版功能一致,主要有两个功能:联网搜索和深度思考,主打一个简洁,聊天记录也会同步显示在手机端和网页端,尚未针对移动端进行特定功能的打磨,也没有市面上 AI 助手类 App 丰富、fancy 的功能,更像是一个能让你在手机上体验 DeepSeek 最新模型的入口。
DeepSeek App 展示图|来源:Apple Store
对此,一位投资人向极客公园解释 DeepSeek 开始做应用背后可能的战略转向:「前期 DeepSeek 靠自己的算力优势积累出了模型技术的领先度。后期要补数据,发 App 是补数据的手段之一。接入用户数据和场景,可以帮助他更好地进行模型能力的迭代和升级。」
同时,有了 DeepSeek-R1 和其他模态、类型越来越好的模型,可以期待未来 DeepSeek 在比如代码模型/应用里有更激进的表现,惊喜才刚刚开始。
媒介合作联系微信号|ciweimeijiejun
商务合作联系微信号|yunlugong
如需和我们交流可后台回复“进群”加社群
刺猬公社
互联网内容行业观察与研究
最新文章
《春意红包》“上桌”春晚,拿捏住了谁?
76岁正是打拼的年纪,马斯克妈妈在中国当网红捞金之路
3万一家的“寄生”库迪,陆正耀开不起了
《国色芳华》好六专场创收视新高,剧宣“芳园”拿捏流量密码
大学生寒假第一课:“解救”网瘾老人
2025年,集美们疯狂迷上盘串
年年都喊“史上最强春节档”,今年来真的了?
夜袭 OpenAI,DeepSeek 开源最强推理模型 R1,再震欧美同行
张一鸣王兴老乡,干出一个490亿独角兽要IPO了
AI创作的“开放世界”,来了
泰国出海“生意经”:不卷低价,不碰灰产,不和华人打交道
蜜雪冰城、古茗、沪上阿姨,上市大逃杀
超级主播倒下的时代,MCN如何做长期生意?
小杨哥复出又双叒叕失败
2024年IPO之王:中金资本夺魁,高瓴创投第二,红杉中国第三
2025年,小说去哪里接“泼天流量”?
一件衣服卖3万,一年销售40亿,“中国版MaxMara”拿捏中产贵妇?
AI硬件致命伤:华强北的能力圈内,没有赢家
《大奉打更人》,不止是爆剧
微信2024复盘:百万粉视频号数量翻倍,日产超324篇公众号原创10万+
AI席卷学术圈,高校忍不了了
火了一年的China Travel,究竟旺了谁?
韩国人挤爆上海,带火旅游“三件套”
2024跨境电商转型全记录
我们和5位“TikTok 难民”,聊了聊这场赛博迁徙
8亿中国人吃过的酱油,要去港股IPO了
TikTok「硬刚」之下,转机来了
85后导演上桌吃饭
完成2025开年KPI的关键时刻来了
美国农场主,酷爱中国“三蹦子”
小红书,一夜出海
靠发疯反击大数据杀熟,是爽文还是幻想?
哪种MBTI的人,更适合创业?
旅行社快被东南亚退款潮整疯了
“美”这门通用语言,被它精准拿捏了
慢咖啡的黄昏时刻
学giao的人
谷子经济,何以站上时代风口
捧红钓鱼佬界的“始祖鸟”,年销数十亿元!今冬这门生意爆火
CFO,全面接管中国互联网大厂
智联招聘集团执行副总裁李强:2025,哪些内容行业岗位将被AI替代?
“星星失联”会重创泰国旅游吗?
211女博士卧底秀场:失业女工成主播
逛完这个超市,我后悔没有早点发现它
吸金4600万,演唱会电影能打多久
鹿晗到底损失了多少钱?
谁说这个时代不再需要内容
活力银发研究 | 每年有2000万人退休时,我们该如何把握银发经济的机遇期?
顶级富二代,都在抢着做“网红”
在创业综艺里“神仙打架”,《夺金2025》燃在哪儿?
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉