首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

速递丨成本仅50美元！李飞飞团队复刻媲美DeepSeek R1的AI推理模型

文摘 2025-02-06 17:12 浙江

根据Tech Crunch报道，李飞飞等斯坦福大学和华盛顿大学的AI研究人员的一篇新研究论文表示，他们成功地用不到50美元的费用训练了一个AI推理模型。

这个名为s1的模型，在测量数学和编码能力的测试中，表现与最前沿的推理模型（如OpenAI的o1和DeepSeek的R1）相似。s1模型已经在GitHub上发布，并附带了训练它所用的数据和代码。

s1背后的团队表示，他们从一个现成的基础模型开始，然后通过蒸馏（distillation）对其进行微调，这是一个从另一个AI模型中提取“推理”能力的过程，通过训练其答案来实现。

研究人员表示，s1是通过蒸馏Google的推理模型——Gemini 2.0 Flash Thinking Experimental模型获得的。蒸馏方法与伯克利研究人员上个月以约450美元创建AI推理模型的方式相同。

对于一些人来说，几位没有数百万美元资金支持的研究人员仍能在AI领域进行创新的想法令人兴奋。但s1也引发了关于AI模型商品化的真正问题。

如果有人能够以相对便宜的成本复制一个价值数百万美元的模型，那么AI模型的“护城河”在哪里？

不出所料，大型AI实验室并不高兴。OpenAI指责DeepSeek不当利用其API数据进行模型蒸馏。

s1的研究人员希望找到一种最简单的方法，以实现强大的推理性能和“测试时扩展”（test-time scaling），即让AI模型在回答问题前多思考一会儿。这些都是OpenAI的o1模型中的一些突破，DeepSeek和其他AI实验室已通过各种技术尝试进行复制。

s1论文建议，推理模型可以通过相对较小的数据集和一种叫做监督微调（SFT）的过程进行蒸馏，其中AI模型被明确指导去模仿数据集中的某些行为。

SFT通常比DeepSeek用于训练其与OpenAI o1模型竞争的R1模型的、大规模强化学习方法便宜。

Google通过其Google AI Studio平台提供免费访问Gemini 2.0 Flash Thinking Experimental，尽管每天有使用限制。

然而，Google的条款禁止逆向工程其模型，以开发与该公司自有AI服务竞争的产品。我们已联系Google进行评论。

s1基于阿里巴巴旗下中国AI实验室Qwen的一款小型现成AI模型，该模型可免费下载。为了训练s1，研究人员创建了一个包含1000个精心挑选问题的数据集，并且每个问题都附有答案和Google的Gemini 2.0 Flash Thinking Experimental模型的“思考”过程。

研究人员表示，在使用16台Nvidia H100 GPU进行训练的不到30分钟时间里，s1在某些AI基准测试中表现出色。参与该项目的斯坦福大学研究员Niklas Muennighoff告诉TechCrunch，他今天大约花20美元就能租到所需的计算资源。

研究人员还使用了一个巧妙的技巧，让s1检查自己的工作并延长“思考”时间：他们告诉它等待。在s1的推理过程中加入“wait”一词帮助该模型得出略微更准确的答案，论文中提到。

2025年，Meta、Google和Microsoft计划在AI基础设施上投资数千亿美元，这些资金将部分用于训练下一代AI模型。

这种规模的投资可能仍然是推动AI创新的必要条件。蒸馏已被证明是以低成本重新创建AI模型能力的有效方法，但它并不能创造出远超现有模型的新AI。

参考资料

[1] https://techcrunch.com/2025/02/05/researchers-created-an-open-rival-to-openais-o1-reasoning-model-for-under-50/

欢迎扫码加群参与讨论

---------END--------

我们相信认知能够跨越阶层，

致力于为年轻人提供高质量的科技和财经内容。

投稿邮箱：zfinance2023@126.com

稿件经采用可获邀进入Z Finance内部社群，优秀者将成为签约作者，00后更有机会成为Z Finance的早期共创成员。

🚀 我们正在招募新一期的实习生

我们相信认知能够跨越阶层，致力于为年轻人提供高质量的科技和财经内容。

最新文章

速递丨Fomo压倒对DeepSeek的担忧，美国科技巨头今年AI投入或超3200亿美元，2年时间翻倍

速递丨清北毕业生正挤破头想加入DeepSeek，北大已占到核心团队的半壁江山

速递丨成本仅50美元！李飞飞团队复刻媲美DeepSeek R1的AI推理模型

深度丨特朗普终结“最小免税”将影响14亿包裹，对中小商家伤害或远大于大型商家

ZAuto丨2025年1月汽车销量盘点：小鹏登顶，比亚迪高端略显疲态，长城全线下滑

速递丨前OpenAI联创舒尔曼再次出走Anthropic，仅在职半年

速递丨Meta投资智能眼镜将突破千亿美元，去年已售出100万副Ray-Ban眼镜

速递｜前谷歌中国员工涉嫌窃取AI机密或面临15年监禁，美国技术管制或进一步升级

速递｜TikTok高管再度生变，全球诉讼主管现已离职

速递｜阿里再迎AI大牛，新加坡管理大学许主洪正式加盟，职级为P10或P11

速递｜微软重磅挖角DeepMind核心AI团队，重点发力新一代Copilot和Agent产品

Z Waves｜罗福莉，北大毕业的DeepSeek天才美少女，从小镇青年成长为雷军亲自挖的AI大牛

速递｜特朗普将设立美国主权基金，或将成为收购TikTok的主体

速递｜OpenAI的最新模型o3-mini推理过程竟是中文，疑似复制Deepseek源代码后仓促上线

速递｜DeepSeek已在全球140个市场的应用商店排名第一，下载量接近ChatGPT同期2倍，印度贡献了所有下载量的15%

速递｜虽然站在历史错误的一边，去年ChatGPT付费用户3倍增长，年化收入或已接近40亿美元

深度｜SemiAnalysis万字长文：DeepSeek是当今最好的开源实验室，但GPU和训练成本可能被低估了

速递｜苹果CEO库克称DeepSeek是推动效率的重要创新，但DeepSeek或成为在华苹果销售的救命稻草

深度｜Anthropic CEO万字长文：DeepSeek不是我们的对手，锁死芯片出口才能保证美国领导下的单极世界

速递｜TikTok获批在泰国投资38亿美元数据中心，算力国际化布局再下一城

速递｜微信用户反映卡顿和延迟，目前尚未修复

速递｜白宫开始“评估”DeepSeek对美国国家安全影响，实体清单或只是时间问题

速递｜OpenAI称DeepSeek“盗窃”知识产权，或蒸馏了其模型来训练R1模型

Z Waves｜梁文锋，DeepSeek缔造者，幻方对冲基金亿万富豪，一夜震惊硅谷的浙大天才

速递｜DeepSeek让英伟达一夜跌去2个字节，美股AI投资者正挤兑式清仓

速递｜DeepSeek遭遇海外黑客攻击停服，已限制海外用户注册账号

速递｜见证历史！DeepSeek中美两区应用商店双双夺冠，ChatGPT第一次被中国应用超过了

速递｜小红书美区应用商店排名显著下滑，TikTok难民或只是昙花一现

速递｜因为无法下载TikTok，美国人正在疯抢3千美元的二手iPhone

速递｜Meta着急了，今年计划在AI上投资650亿美元，到年底将拥有130万张GPU

深度｜解密「星际之门」：OpenAI与马斯克明争暗斗的神之一手，既能赢取特朗普支持，又能突破微软资源限制

速递｜LeCun最新分享：LLM范式的生命周期只有三年，新的AI革命马上就会到来，机器人技术是核心

速递｜OpenAI和软银将分别投资「星际之门」190亿美元，OpenAI将占股40%

速递｜字节启动AGI长期研究计划，代号Seed Edge，探索更长周期、具有不确定性和大胆的AGI研究课题

速递｜字节大股东对TikTok达成协议充满信心，中美会找到双方都满意的解决方案

速递｜OpenAI的贾维斯本周发布，新功能将接管浏览器自动化处理复杂任务

速递｜谷歌再投Anthropic超10亿美元，估值仅600亿美元已翻3倍

速递｜字节跳动计划今年狂砸近1千亿元采购AI芯片，豆包月活已超7000万接近ChatGPT的1/4

速递｜小红书正抓紧合作美国网红推广应用，同步正招募英语内容审核员

速递｜特朗普联手OpenAI和软银，狂砸5000亿美元开启AI星际之门

速递｜字节硬刚赢得重大转机，特朗普不排除TikTok继续由中方所有

速递｜特朗普誓言带来美国的“黄金时代”，将在火星插上美国国旗，终结乌克兰战争，取消性别多元政策

速递｜Instagram瞄准字节CapCut下架空窗期，推出视频剪辑工具Edits

速递｜字节旗下TikTok、Lemon8已恢复美区服务，特朗普希望TikTok成为中美合资公司

速递｜苹果CFO否认苹果商店利润率约75%，正面临15亿英镑反垄断赔偿

速递｜字节硬刚到最后一刻，TikTok、Lemon8和Capcut已集体停运并下架美区商店

速递｜美国最高法院正式裁定TikTok禁令符合宪法，言论自由需让位于国家安全

深度｜终极反转，特朗普渴望成为TikTok“救世主”承诺延长禁令，TikTok或将获得喘息机会

ZPedia｜字节商业化第二曲线？广告主福音！素材不必再亲自编写拍摄剪辑，用AI即刻创造

速递｜腾讯因派拉蒙影业合并案遭美国审查，仅持股不到5%

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉