DeepSeek震撼美国科技界,被有组织来自美国的大规模网络攻击导致宕机

职场   2025-01-29 14:47   重庆  
‍‍‍

今天是大年初一,先问一声新年好。接下来,我们说一件AI圈刚发生的大事。

就在1月20日,中国AI公司DeepSeek发布了有推理功能的最新大模型,DeepSeek R1。你现在就可以到它的官网免费使用这个模型——http://chat.deepseek.com

这不是一次普通的模型发布,也不是一个普通的AI进展。它的重要程度可以跟OpenAI推出ChatGPT,或者第一次宣布o1推理模型相比。

今天的内容来自得到APP《万维钢·精英日课6》,下面,有请万维钢老师跟你展开聊聊,震撼美国AI圈的DeepSeek R1。
作者:万维钢

来源:《精英日课》

01

美国AI圈被彻底震撼

DeepSeek R1——
-达到了跟o1相当、或者至少接近的推理能力,它是除了OpenAI自家,目前唯一一个做到这一点的模型;
-它做到这个水平只用到少得多的资源,所以价格十分便宜;
-它是完全开源的;
-DeepSeek公司甚至发布论文,详细介绍了训练中所有的步骤和窍门 —— 而你要知道OpenAI至今对o1的算法和训练方式保密;
-而DeepSeek公司是一家纯粹的中国公司。
o1水平、超低价格、完全公开,做到任何一条都是爆炸性新闻,而R1全做到了。你就是写小说鼓吹中国AI有多强都不敢这么畅想,但这就是事实!
这两天X上的美国AI圈被彻底震撼,都感到不可思议,可是上手各种测试发现的确超级厉害,所以现在是好评如潮。我先给你汇总一下各方的反应,再稍微谈谈我的看法。
02
DeepSeek成为天下极客仰望的焦点
英伟达资深研究员Jim Fan,对每一次AI进展都有深刻的洞见,他的说法不可不听。这一次对R1,他的评论是——

「我们生活的这个时间线上,是一家非美国公司,在延续OpenAI最初的—— 真正开放的前沿研究,赋能所有人。这简直不可思议。这是最有趣的结局竟然成真了。」
他不但赞美了DeepSeek的开放,而且嘲讽了OpenAI今天一个暗示明天一个代号的不透明风格。
这是非常鲜明的对比。我们一直说开源是硅谷精神。你OpenAI最初的愿景就是开放,人家Meta也是坚决开源,只不过技术目前没你强……而现在是一家中国公司,不但接近你的技术水平,而且完全开源,连技术细节都公开了!
所以现在舆论是一边倒支持DeepSeek。我上两个截图你体会一下——

说的严重点,DeepSeek等于是给中国找到一面道义大旗。这次不但是一雪前耻,而且直接成为天下极客仰望的焦点。
而且这个仰望不只是道义上的,也是技术上的。
03

目前唯一一个支持上网搜索的推理模型

先看性能。R1在数学、编程和推理任务上的跑分已经达到,甚至偶尔超过了,o1的水平。

当然你可以说中国公司喜欢刷分,可能模型专门做过针对性的训练,但用户的体感是真的。我看X上用户的真实体验,R1水平确实很强。而且至少在一个编程案例上,它的表现比o1 pro还要好。

也有些用户发现,包括我自己也感觉,R1在生成洞见、创造性发挥和说理论证方面距离o1 pro还有相当的差距。

但你要知道这是一个比较小的模型,它总共只有6710亿个参数,而且是由一系列混合专家模型(Mixture of Experts)组成的,它一次推理调用的参数只有370亿个。
R1思考速度快而且非常省钱。官网直接用,它是免费的。如果是在自己的应用中调用API,它的输出价格是一百万tokens 2.19美元,相当于o1 60美元的4%!这意味着你可以用R1做很多很多日常的事情。
而且R1还支持上网搜索和PDF阅读——这是o1目前所没有的功能。我自己试用的体感不是说那么惊艳,但非常可用,而有的美国用户则表示感觉水平比ChatGPT搜索和Perplexity都高——
要知道这可是目前唯一一个支持上网搜索的推理模型。
04

什么叫赋能,这就叫赋能

DeepSeek的开放有多彻底呢?它不但开源、免费可下载和公开了训练方法,而且允许任何人用R1做数据蒸馏,去训练自家的模型,而且你可以商业化。
DeepSeek甚至已经用市面上的两个开源模型,阿里的Qwen和Meta的Llama,蒸馏出来六个小模型供你随便用。它们的跑分都相当高——
这些蒸馏出来的小模型很不简单。其中一个有320亿参数的小模型,数学和编程性能直接超越了o1-mini。
还有一个只有15亿参数的迷你小模型,数学和编程性能已经超过了当今最主流的两个非推理模型,也就是GPT-4o和Claude 3.5 Sonnet——而它小到可以运行在你的个人电脑,甚至是手机上!有人已经用上了——
这是非常不可思议的事情!你要知道,仅仅半年前,这两个模型还是神一样的存在……而你现在不用上网,自家手机就可以拥有它们至少是数学和编程方面的能力。
还有个哥们似乎是直接把整个R1下载运行了。为此他用了一台Mac笔记本和七台Mac Mini。

还有个前Deepmind的研究员,直接用R1蒸馏出一个自己的模型,数学和编程性能超过了o1-preview——

什么叫赋能,这就叫赋能。
05

DeepSeek的秘密是什么?‍‍‍‍‍‍‍

咱们再看DeepSeek介绍R1的论文[1],这篇论文是一个珍宝!因为这是有史以来第一篇公开了推理模型的秘密的论文。你要知道此前只有OpenAI有推理模型,连Anthropic和Meta都没有发布自己的推理模型,而OpenAI对o1怎么推理实行保密,外界只能猜测……
所以有人说,现在所有AI实验室都在阅读DeepSeek这篇论文——

DeepSeek的秘密是什么呢?是没有人为干预的强化学习。就如同当年的AlphaZero不看任何棋谱,自己跟自己下围棋一样,工程师并没有告诉模型如何推理,只是你做对了我给奖励——它完全靠自己摸索,就掌握了推理方法。研究者首先训练了一个叫DeepSeek-R1-Zero的基础模型,它在训练过程中自行涌现出来了几个解题方法——
-解数学题会写下步骤,自动检查每一步是否正确;
-解题中间如果意识到错误,会中断思考,重新推导;
-解完一道题会反思回顾自己的解题步骤,尝试不同的方法,寻找最优解;
-能自动生成非常详细的解题步骤;
-如果感觉题目比较难,会自动延长推理步骤,增加推理时间……
简单说,它就像是人一样在做题。而我再强调一遍,训练者并没有*告诉*模型你应该这么解题,这些都是模型自己摸索出来的能力!
更有甚者,模型在推理过程中还涌现出一个「aha 时刻」,也就是解决关键一步,恍然大悟的时刻——

在场研究者第一次目睹这个现象都震惊了。模型就好像活了一样,它有像人一样的思想爆发火花,你甚至可以说它的智能自行升级了。
R1-Zero有时候喜欢中英文混合输出,界面不太友好,所以研究者又把它进一步人性化,才得到R1。

最近OpenAI的研究者也出来讲话,说是用的是强化学习自动涌现,听起来跟DeepSeek论文里的路数一致。但OpenAI从未提供过任何细节,DeepSeek等于是不但自己探索,而且还公之于众了。
还有个有意思之处是R1每一次输出的时候,都提供了自己的思考过程——这也是OpenAI不愿意全给的。很多人表示单纯阅读那些思考过程也很有收获。比如沃顿商学院教授伊桑·莫利克(Ethan Mollick)感慨说,目睹R1第一人称的思考过程,你不能不强烈感觉它是一个人……


所有这些,都是R1之前我们不知道的。请允许我再说一遍:现在是一家来自中国的小公司,给人类贡献了决定性的AI新知。
06

独树一帜的重量级存在

主流编程软件Cursor中已经可以直接调用R1,大量的程序员会每天用它。中国没有对美国用户施加任何限制,甚至Google账号可以直接登录DeepSeek官网。你再对比一下OpenAI的种种限制,到底谁更open?
最后我再说一点展望。
DeepSeek用这么少的算力就能做到这么好,对所有人都是重大启发,我相信OpenAI也会琢磨这到底是为什么。如果DeepSeek找到了低算力高效率的大门,对整个人类都是好消息。
但是,OpenAI投入那么大算力不是白费的。我理解R1是专门在数学和编程这两项上做的优化,它完成别的任务的水平还不够强。我自己的体感是,比如用来搞清楚一个什么科学问题,它能力不如o1-pro。
我怀疑这里面可能有个二八定律。你用比较少的算力资源,就能应对比如说工作中80%的问题——但是要想覆盖剩下的20%,你需要投入多的多的资源。而后者恰恰是OpenAI要做的事情。
这两天另一个大新闻是OpenAI和软银等公司联手,要搞个5000亿美元的大项目,叫「星际之门计划(The Stargate Project)」,对标当年美国搞原子弹的曼哈顿计划和后来的登月计划。这个项目要做的事情不是编程和解数学题,甚至不是AGI——而是ASI,是用于加速各个领域的科研,是探索未知世界。
前几天还有消息爆出,OpenAI一年多前就搞了个生物学模型叫GPT-4b mini,目前已经找到了把普通细胞变成干细胞的方法,有望给人类增加10年寿命。
这次的星际之门,几个领导人谈论的都是科幻级的科学突破,比如用AI探测癌症并且在48小时内用基因编辑+mRNA的方式给你提供疫苗,从而治愈一切癌症;山姆·奥特曼甚至说很快一切疾病都可以治愈。
所以我们不能低估算力的作用,更不能低估美国的野心。这是一场国运之争。也许当你读到这期专栏的时候,OpenAI的Operator功能就已经上线了。OpenAI仍然大幅度领先。
但是中国现在至少有个DeepSeek!这不是追赶更不是复制,这是独树一帜的重量级存在。

注释:

https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

@THE END


应广大粉丝要求,我们建立了一个【领导者管理交流群】,小伙伴们热情踊跃,目前人数已经上万人了,不能直接进群啦,想要进群的添加小编微信,拉你进群。两个添加其一即可!

欢迎加入10W+领导者社群

文章来源 领导者养成笔记「ID:GoToLead 」,转载请公众号回复“转载

版权说明 们尊重原创者版权,除我们确实无法确认作者外,我们都会注明作者和来源。在此向原创者表示感谢。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,我们将根据您提供的证明材料确认版权立即删除内容;本文内容为原作者观点,并不代表本公众号赞同其观点和对其真实性负责。


领导者管理笔记
关注我,与100万领导者一起学组织和管理。张三峯,15年500强高层管理经验,“人人都是领导者“理念推动者,“商业新知”管理十佳创作者,多家公司管理咨询顾问。
 最新文章