国产之光DeepSeek杀疯了

文摘   2025-01-28 19:27   浙江  

 

欢迎点击下方👇🏻关注记得星标哟~
文末有惊喜~

大家好,我是汤师爷~

杀疯了,国产之光DeepSeek杀疯了。

这个来自东方的神秘力量,这两天还是持续发酵,它居然超过了ChatGPT登上了苹果应用商店的免费版榜首,对整个西方科技界的冲击非常大。

它用区区2000张GPU就训练出了比肩OpenAI的O1水平的大模型。那些花了几百亿美金买了GPU的微软、甲骨文等科技巨头都要哭晕在厕所。

百万人在推特上刷屏

短短几天,百万人在推特上刷屏,这真是国产AI首次能在全球迎来这样的局面,这次deepseek的发布绝对超出了所有人的预期,不仅推出了全新的开源大模型,还同步发布了R1 zero和小模型,每一个都在科技圈掀起巨大轰动。

许多业内人士甚至喊出了"DeepSeek将接班OpenAI"的口号。

比如,前Meta AI工作人员、知名AI论文推特作者Elvis就强调,DeepSeek-R1的论文堪称瑰宝,因为它不仅探索了多种提升大语言模型推理能力的方法,还发现了更明确的涌现特性。

最让人惊喜的是,R1不再依赖传统监督学习,凭借GRPO的模式强化学习不断自我进化,让AI自己突然学会了怎么思考。

GRPO的模式实际上很简单:它通过比较同组样本来计算策略梯度,既降低了训练的不稳定性,又提高了学习效率。

打个比方,就像老师出题,让模型对每道题给出多个答案。然后通过奖惩规则给这些答案打分,模型就会追求高分、避免低分,从而不断改进。

整个流程是:输入问题 → 模型生成多个答案 → 规则系统评分 → GRPO计算相对优势 → 更新模型

DeepSeek为何如此强大?

首先,性能方面,DeepSeek在数学、代码、自然语言推理等任务上,表现相当出色,完全可以和OpenAI的o1正式版媲美。

其次,价格方面,目前每百万输入token的价格是4元,如果命中缓存的话,价格还能降到1元。输出价格则是每百万token16元,这绝对是全网最低价。

而且,DeepSeek的代码仓库完全开源,使用的是最宽松的MIT 开源协议,不限制商用,无需申请。还允许用户通过模型蒸馏等方式训练其他模型,蒸馏出的小模型已经完全超越OpenAI o1-mini。

DeepSeek这波格局拉得太满了,这才是真正的开源AI。虽然DeepSeek的官网界面和功能现在还比较简陋,但开源才是未来,DeepSeek就是未来。

DeepSeek走的路非常稳健

DeepSeek的母公司幻方量化,是金融领域的头部基金,创始人梁文峰不光是位亿万富翁,同时也是一位有远大梦想的人,他给公司定下的愿景就是实现通用人工智能AGI。

在母公司幻方量化的帮助下,deepseek可以做非常纯粹的AI研究,不用考虑盈利的事情,这样的路会走的非常长远。

这不仅是一次技术上的发布,更是对全球AI格局的强烈冲击,让全世界看到了国产AI的无限潜能,也令我们对中国AI的未来充满期待。

 

对了,我整理了一份Cursor官方指导手册(中文版)该⽂档写得相当清晰简洁,是新⼿⼊门开始学习Cursor的最佳选择。要学AI编程的同学,加我微信,备注【Cursor】,免费获取!

··············  END  ··············

你好,我是汤师爷,南京大学硕士,曾就职于华为、阿里,创业公司CTO,现大厂资深架构师,Qcon、IAS、A2M大会特邀讲师。日常分享AI编程,系统架构,AI工具,欢迎围观。



欢迎把文章分享至朋友圈
点赞、在看是对我最大的支持
↘↘↘

架构师汤师爷
南京大学硕士,曾就职于华为、阿里,创业公司CTO,现大厂资深架构师,Qcon/IAS/A2M大会特邀讲师。日常分享AI编程、系统架构、AI工具。
 最新文章