DeepSeek震撼美国科技界，被有组织来自美国的大规模网络攻击导致宕机

职场 2025-01-29 14:47 重庆

‍‍‍

今天是大年初一，先问一声新年好。接下来，我们说一件AI圈刚发生的大事。

就在1月20日，中国AI公司DeepSeek发布了有推理功能的最新大模型，DeepSeek R1。你现在就可以到它的官网免费使用这个模型——http://chat.deepseek.com。

这不是一次普通的模型发布，也不是一个普通的AI进展。它的重要程度可以跟OpenAI推出ChatGPT，或者第一次宣布o1推理模型相比。

今天的内容来自得到APP《万维钢·精英日课6》，下面，有请万维钢老师跟你展开聊聊，震撼美国AI圈的DeepSeek R1。

作者：万维钢

来源：《精英日课》

美国AI圈被彻底震撼

DeepSeek R1——

-达到了跟o1相当、或者至少接近的推理能力，它是除了OpenAI自家，目前唯一一个做到这一点的模型；

-它做到这个水平只用到少得多的资源，所以价格十分便宜；

-它是完全开源的；

-DeepSeek公司甚至发布论文，详细介绍了训练中所有的步骤和窍门 —— 而你要知道OpenAI至今对o1的算法和训练方式保密；

-而DeepSeek公司是一家纯粹的中国公司。

o1水平、超低价格、完全公开，做到任何一条都是爆炸性新闻，而R1全做到了。你就是写小说鼓吹中国AI有多强都不敢这么畅想，但这就是事实！

这两天X上的美国AI圈被彻底震撼，都感到不可思议，可是上手各种测试发现的确超级厉害，所以现在是好评如潮。我先给你汇总一下各方的反应，再稍微谈谈我的看法。

DeepSeek成为天下极客仰望的焦点

英伟达资深研究员Jim Fan，对每一次AI进展都有深刻的洞见，他的说法不可不听。这一次对R1，他的评论是——

「我们生活的这个时间线上，是一家非美国公司，在延续OpenAI最初的—— 真正开放的前沿研究，赋能所有人。这简直不可思议。这是最有趣的结局竟然成真了。」

他不但赞美了DeepSeek的开放，而且嘲讽了OpenAI今天一个暗示明天一个代号的不透明风格。

这是非常鲜明的对比。我们一直说开源是硅谷精神。你OpenAI最初的愿景就是开放，人家Meta也是坚决开源，只不过技术目前没你强……而现在是一家中国公司，不但接近你的技术水平，而且完全开源，连技术细节都公开了！

所以现在舆论是一边倒支持DeepSeek。我上两个截图你体会一下——

说的严重点，DeepSeek等于是给中国找到一面道义大旗。这次不但是一雪前耻，而且直接成为天下极客仰望的焦点。

而且这个仰望不只是道义上的，也是技术上的。

目前唯一一个支持上网搜索的推理模型

先看性能。R1在数学、编程和推理任务上的跑分已经达到，甚至偶尔超过了，o1的水平。

当然你可以说中国公司喜欢刷分，可能模型专门做过针对性的训练，但用户的体感是真的。我看X上用户的真实体验，R1水平确实很强。而且至少在一个编程案例上，它的表现比o1 pro还要好。

也有些用户发现，包括我自己也感觉，R1在生成洞见、创造性发挥和说理论证方面距离o1 pro还有相当的差距。

但你要知道这是一个比较小的模型，它总共只有6710亿个参数，而且是由一系列混合专家模型（Mixture of Experts）组成的，它一次推理调用的参数只有370亿个。

R1思考速度快而且非常省钱。官网直接用，它是免费的。如果是在自己的应用中调用API，它的输出价格是一百万tokens 2.19美元，相当于o1 60美元的4%！这意味着你可以用R1做很多很多日常的事情。

而且R1还支持上网搜索和PDF阅读——这是o1目前所没有的功能。我自己试用的体感不是说那么惊艳，但非常可用，而有的美国用户则表示感觉水平比ChatGPT搜索和Perplexity都高——

要知道这可是目前唯一一个支持上网搜索的推理模型。

什么叫赋能，这就叫赋能

DeepSeek的开放有多彻底呢？它不但开源、免费可下载和公开了训练方法，而且允许任何人用R1做数据蒸馏，去训练自家的模型，而且你可以商业化。

DeepSeek甚至已经用市面上的两个开源模型，阿里的Qwen和Meta的Llama，蒸馏出来六个小模型供你随便用。它们的跑分都相当高——

这些蒸馏出来的小模型很不简单。其中一个有320亿参数的小模型，数学和编程性能直接超越了o1-mini。

还有一个只有15亿参数的迷你小模型，数学和编程性能已经超过了当今最主流的两个非推理模型，也就是GPT-4o和Claude 3.5 Sonnet——而它小到可以运行在你的个人电脑，甚至是手机上！有人已经用上了——

这是非常不可思议的事情！你要知道，仅仅半年前，这两个模型还是神一样的存在……而你现在不用上网，自家手机就可以拥有它们至少是数学和编程方面的能力。

还有个哥们似乎是直接把整个R1下载运行了。为此他用了一台Mac笔记本和七台Mac Mini。

还有个前Deepmind的研究员，直接用R1蒸馏出一个自己的模型，数学和编程性能超过了o1-preview——

什么叫赋能，这就叫赋能。

DeepSeek的秘密是什么？‍‍‍‍‍‍‍

咱们再看DeepSeek介绍R1的论文[1]，这篇论文是一个珍宝！因为这是有史以来第一篇公开了推理模型的秘密的论文。你要知道此前只有OpenAI有推理模型，连Anthropic和Meta都没有发布自己的推理模型，而OpenAI对o1怎么推理实行保密，外界只能猜测……

所以有人说，现在所有AI实验室都在阅读DeepSeek这篇论文——

DeepSeek的秘密是什么呢？是没有人为干预的强化学习。就如同当年的AlphaZero不看任何棋谱，自己跟自己下围棋一样，工程师并没有告诉模型如何推理，只是你做对了我给奖励——它完全靠自己摸索，就掌握了推理方法。研究者首先训练了一个叫DeepSeek-R1-Zero的基础模型，它在训练过程中自行涌现出来了几个解题方法——

-解数学题会写下步骤，自动检查每一步是否正确；

-解题中间如果意识到错误，会中断思考，重新推导；

-解完一道题会反思回顾自己的解题步骤，尝试不同的方法，寻找最优解；

-能自动生成非常详细的解题步骤；

-如果感觉题目比较难，会自动延长推理步骤，增加推理时间……

简单说，它就像是人一样在做题。而我再强调一遍，训练者并没有*告诉*模型你应该这么解题，这些都是模型自己摸索出来的能力！

更有甚者，模型在推理过程中还涌现出一个「aha 时刻」，也就是解决关键一步，恍然大悟的时刻——

在场研究者第一次目睹这个现象都震惊了。模型就好像活了一样，它有像人一样的思想爆发火花，你甚至可以说它的智能自行升级了。

R1-Zero有时候喜欢中英文混合输出，界面不太友好，所以研究者又把它进一步人性化，才得到R1。

最近OpenAI的研究者也出来讲话，说是用的是强化学习自动涌现，听起来跟DeepSeek论文里的路数一致。但OpenAI从未提供过任何细节，DeepSeek等于是不但自己探索，而且还公之于众了。

还有个有意思之处是R1每一次输出的时候，都提供了自己的思考过程——这也是OpenAI不愿意全给的。很多人表示单纯阅读那些思考过程也很有收获。比如沃顿商学院教授伊桑·莫利克（Ethan Mollick）感慨说，目睹R1第一人称的思考过程，你不能不强烈感觉它是一个人……

所有这些，都是R1之前我们不知道的。请允许我再说一遍：现在是一家来自中国的小公司，给人类贡献了决定性的AI新知。

独树一帜的重量级存在‍

主流编程软件Cursor中已经可以直接调用R1，大量的程序员会每天用它。中国没有对美国用户施加任何限制，甚至Google账号可以直接登录DeepSeek官网。你再对比一下OpenAI的种种限制，到底谁更open？

最后我再说一点展望。

DeepSeek用这么少的算力就能做到这么好，对所有人都是重大启发，我相信OpenAI也会琢磨这到底是为什么。如果DeepSeek找到了低算力高效率的大门，对整个人类都是好消息。

但是，OpenAI投入那么大算力不是白费的。我理解R1是专门在数学和编程这两项上做的优化，它完成别的任务的水平还不够强。我自己的体感是，比如用来搞清楚一个什么科学问题，它能力不如o1-pro。

我怀疑这里面可能有个二八定律。你用比较少的算力资源，就能应对比如说工作中80%的问题——但是要想覆盖剩下的20%，你需要投入多的多的资源。而后者恰恰是OpenAI要做的事情。

这两天另一个大新闻是OpenAI和软银等公司联手，要搞个5000亿美元的大项目，叫「星际之门计划（The Stargate Project）」，对标当年美国搞原子弹的曼哈顿计划和后来的登月计划。这个项目要做的事情不是编程和解数学题，甚至不是AGI——而是ASI，是用于加速各个领域的科研，是探索未知世界。

前几天还有消息爆出，OpenAI一年多前就搞了个生物学模型叫GPT-4b mini，目前已经找到了把普通细胞变成干细胞的方法，有望给人类增加10年寿命。

这次的星际之门，几个领导人谈论的都是科幻级的科学突破，比如用AI探测癌症并且在48小时内用基因编辑+mRNA的方式给你提供疫苗，从而治愈一切癌症；山姆·奥特曼甚至说很快一切疾病都可以治愈。

所以我们不能低估算力的作用，更不能低估美国的野心。这是一场国运之争。也许当你读到这期专栏的时候，OpenAI的Operator功能就已经上线了。OpenAI仍然大幅度领先。

但是中国现在至少有个DeepSeek！这不是追赶更不是复制，这是独树一帜的重量级存在。

注释：

https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

@THE END

分割线

应广大粉丝要求，我们建立了一个【领导者管理交流群】，小伙伴们热情踊跃，目前人数已经上万人了，不能直接进群啦，想要进群的添加小编微信，拉你进群。两个添加其一即可！

欢迎加入10W+领导者社群

文章来源 ：领导者养成笔记「ID：GoToLead 」，转载请公众号回复“转载”

版权说明 ：我们尊重原创者版权，除我们确实无法确认作者外，我们都会注明作者和来源。在此向原创者表示感谢。本文所用视频、图片、文字如涉及作品版权问题，请第一时间告知，我们将根据您提供的证明材料确认版权立即删除内容；本文内容为原作者观点，并不代表本公众号赞同其观点和对其真实性负责。

领导者管理笔记

关注我，与100万领导者一起学组织和管理。张三峯，15年500强高层管理经验，“人人都是领导者“理念推动者，“商业新知”管理十佳创作者，多家公司管理咨询顾问。

最新文章

工作能力强的人，都有闭环思维

内部资料：华为干部管理经验分享

Deepseek为何成功？其对企业管理者的启发？（人机合作完成的回答）

MIT 技术观点｜DeepSeek逆袭成功的诀窍：打破规则的创新典范

一场由DeepSeek引发的技术裂变，正在重写AI时代的权力分配方程式

DeepSeek的150人小团队，怎么就让硅谷颤抖了？

DeepSeek突围奥秘曝光，一招MLA让全世界抄作业！150+天才集结，开出千万年薪

DeepSeek创始人梁文锋回老家过年：家乡拉横幅、立拱门欢迎，还有游客打卡

一夜之间，微软、英伟达、亚马逊全部接入DeepSeek！吴恩达：中国AI正在崛起

一个优秀的管理者，必然经历的3次蜕变

DeepSeek这把火，烧旺了谁，又烧疼了谁？

111页PPT读懂原汁原味的《领导梯队》|领导力开发的圣经

DeepSeek薪资曝光！

DeepSeek梁文锋的民主化革命，正在颠覆精致利己主义的管理思想

为何人一当上了领导，就像变了个人似的？

为什么杭州出了Deepseek、宇树科技和《黑神话·悟空》？

DeepSeek创始人梁文锋除夕夜回应冯骥“国运论”

王煜全：DeepSeek的4篇重要论文，聊聊R1登顶全球榜一这事

知乎10W赞：国内外这么多 AI 大模型，为什么是 DeepSeek 击败百度字节跳动和ChatGPT火了？

DeepSeek老板梁文锋究竟何许人也？

DeepSeek震撼美国科技界，被有组织来自美国的大规模网络攻击导致宕机

超全推理语言模型蓝图来了！揭开o1、o3、DeepSeek-V3神秘面纱

DeepSeek独立发现o1核心思路，OpenAI首席研究官亲自证实！奥特曼被迫发声

这篇对 DeepSeek 的分析：获马斯克点赞

英伟达市值蒸发近6000亿美元，而DeepSeek刚刚又开源新模型

全球掀DeepSeek复现狂潮！硅谷巨头神话崩塌，30刀见证啊哈时刻

DeepSeek创始人梁文锋专访：中国的AI不可能永远跟随，需要有人站到技术的前沿

史上首次，DeepSeek登顶中美AppStore！NYU教授：全球「AI霸权」之争已结束

DeepSeek登顶中美双榜，CNBC 40分钟深度专题访谈实录

马斯克与“第一性原理”：颠覆创新的哲学根基

高质量的沟通：从第一分钟开始！

警惕那些正在拖垮你人生的“狗屁”工作！40%的工作都无意义

开会，最显一个人的领导力

《企业经营分析-揭秘商业本质，提升管理效益》读书笔记PPT

2025开年第-课 | 读懂2025年经营关键词《胖东来经营的本质》全面解读 | 火热报名中！

曾国藩的中国式领导力：如何将乌合之众打造成一支精兵？

真正有效的员工激励：让归属感带领团队嗷嗷前进（推荐）

战略，其实就6个字：选择-聚焦-击穿

领导10 句话，搞定下属立信任

精美PPT 读书笔记丨《金字塔原理》完全解析

走上管理岗才明白：让员工死心塌地、拼命干活的办法，从来都不是“钱”

P90彼得·德鲁克《卓有成效的管理者-55周年新译本》读书笔记

新年研学第一课：《解码零售标杆胖东来——用心发现/用心领悟自由•爱！》，火热报名中！

埃隆·马斯克：判断一个人有没有领导力，就看这5点

走上管理岗位才知道，真正决定一个人职场的上限的是“复盘”能力

金字塔原理·构建逻辑思考与高效表达——最经典的思维训练课

特朗普的四大“成功特质”，让他成为美国第47任总统

走上管理岗位才知道，一流的企业都善于“复盘”

好公司与烂公司的区别：精细化管理

走上管理岗才明白：跟领导汇报，姿态越高越好

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉