什么是DeepSeek?

文摘   2025-01-30 05:06   陕西  

近日,DeepSeek-R1在Chatbot Arena综合榜单上升至第三,与OpenAI的顶尖推理模型o1并列。其应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT,点燃了全球关于人工智能发展格局的深度讨论。

1、新闻报道

这几天,中国AI 新创公司深度求索(DeepSeek)先后发布了DeepSeek-V3 和DeepSeek-R1 两款大模型,成本价格低廉,性能与OpenAI 相当,让硅谷震惊,甚至引发了Meta内部的恐慌,工程师们开始连夜尝试复制DeepSeek的成果。

  DeepSeek,甚至冲上美国APP Store免费APP下载榜第一名,被称为东方神秘力量,而DeepSeek创始人梁文锋的超狂背景也曝光。据悉,该团队成员都来自顶尖学校,核心成员是应届生,才女罗福莉(据媒体报道,雷军为罗福莉开出了千万元级别的年薪)也参与开发。

梁文峰搞出来的deepseek有多强大呢?他在短短1个月之内就震惊了西方科技界两次。

第一次是在2024年12月底,deepseek发布了一个叫deepseek—V3的AI模型,对标的是open AI的GPT4O,当时美国的AI界的众多大佬们瞬间就炸锅了,炸锅的原因是:

第一,中国居然能搞出这么先进的模型;


第二,训练出来的这个V3模型,deepseek团队仅用139人,2048块低端GPU,花费两个月以及557.6万美元,而对比一下谷歌和open AI,他们上千人的团队,花费了好几年时间,耗资数亿美元,调用了几万块最先进的GPU才干成同样的事。

紧接着在1月20号,也就是距离上次V3版本发布不到一个月,deepseek又发布了一个叫deepseek-R1的模型,颠覆了“中国AI依赖西方开源”的刻板印象,让西方科技界再次震惊。

但没想到,这个并不老练的团队,仅用一年多时间,就推出了模仿人类思维的DeepSeek-R1,在数学、编程自然语言推理等任务上,性能比肩当前“地球最强大脑”——OpenAI o1。

外国选手已经验证,对比很直观:

案例1,“编写一个 Python 脚本,让黄色小球在正方形内弹跳,确保正确处理碰撞检测。让正方形缓慢旋转。用 Python 实现。确保小球停留在正方形内”。

左边是OpenAI o1,右边是DeepSeek R1:

案例2,“要求实现一个带有红球的旋转三角形。”

左边是OpenAI o1,右边是DeepSeek R1:

这两个对比非常直观,DeepSeek-R1在数学、编程等复杂推理的性能,与OpenAI o1旗鼓相当甚至超越。

R1对标的是open AI线上的最强模型O1,不仅在数学、代码、自然语言推理等任务上,性能丝毫不输Open O1正式版,还在价格上将Open O1逼得无路可走。

Open O1模型199美元,而deepseek-R1则是近乎免费。

在仅用2048块H800 GPU的情况下,DeepSeek完成了6710亿参数模型的训练,而DeepSeek-R1的预训练费用不到OpenAI GPT-4o模型训练成本的十分之一。低成本、高性能的模型,迅速打破了以往AI领域依赖高昂算力和大量资金投入的格局。

同时,其创新的“动态价值拓扑网络”架构,将伦理框架内化为模型基础结构,而非传统的后期矫正模式,解决了困扰行业多年的“性能与安全悖论”。DeepSeek在技术路线的根本性创新,如同在智能进化的高速公路上另辟新道。

更可气的是,deepseek还100%开源,不限制商用,无需申请。不管你是拿来玩儿、用来搞科研、或者拿来赚钱都没问题,唯一需要做的就是注明这个模型是R1就够了。

随着DeepSeek被广泛关注,硅谷科技巨头股价应声下挫,包括英伟达、微软、谷歌、Meta和亚马逊在内的多家科技巨头股价出现下跌,市值蒸发严重。标普500指数跌了1.46%,纳斯达克指数暴跌3.07%,科技巨头方面,谷歌大跌4.03%,微软下跌2,14%,最最意外的是,全球AI芯片的王者——英伟达,在前天晚暴跌近17%,差点跌了近1/5!市值蒸发约6000亿美元,约合4.27万亿人民币!外媒说这是史上最大的一次暴跌,心态都快跌崩了。

BBC:中国DeepSeek震撼AI行业,削弱美国霸气。

奥特曼点评DeepSeek:令人印象深刻,我们不怕,会推出新版本。

DeepSeek登上全球媒体:一夜干掉多家AI公司万亿美元市值。

特朗普:DeepSeek给美国敲响警钟,如果真便宜我们也会效仿。

英伟达就DeepSeek发表声明:R1模型是一项出色的AI进步。

认识梁文峰:DeepSeek爆火背后的对冲基金经理。

现实又再真实不过!DeepSeek的横空出世,直接打破西方前沿科技只可追赶无法超越的神话。其实,关注时政的人应该能察觉,1月20日,新闻联播报道DeepSeek创始人梁文峰获邀参加高层座谈会,就是个重大信号。

首先,肯定是这个小公司在AI领域有了特别重大突破;其次,就是这个突破在世界上都属于领先。DeepSeek的横空出世,让美国科技圈睡不着觉,同样也让很多国人睡不着觉。

不起眼的小公司DeepSeek,靠性能较差的硬件和并不老练的团队,掀翻英伟达,有人说,这是以少胜多、以弱胜强。但我认为,任正非说得对:从国外引进来的高新技术,打开后发现竟是中国鸡下的蛋。中国从来不缺人才,也不缺天才,缺的是敢想象,敢独立自主走自己的路。

硅谷半导体神话故事的天花板终于被桶开了一个窟窿,英伟达的故事被梁文峰做成了事故,我们终于等来那只可以引发大洋彼岸科技股神话松动破灭蝴蝶效应的那只全世界等待的蝴蝶。属于我们的世纪,终于缓缓地打开了那扇沉甸甸的大门。

Deepseek如何deep(深度)seek(求索)?尽管DeepSeek当前风光无限,但要积大胜为常胜,还需立足后续发展,久久为功,保持定力,卯足后劲。中国科技企业若想实现从“跟跑”到“领跑”的质变,既需珍惜当前的技术窗口期,更需克制“毕其功于一役”的心态,持之以恒,不断求索,方能行稳致远。

在GPT-5即将发布、量子计算革命蓄势待发的背景下,DeepSeek的阶段性成功只是序章。这场始于技术突破的轰动事件,终将演变为文明智慧的集体试炼。DeepSeek一是原创,二是便宜,犹如少林寺突然闯进来一个小孩,击败众高僧,这就好比一个低成本的中国电影在大片云集的美国拿了票房冠军一样,你敢相信吗?但是,此事千真万确!

梁文峰的两句话特别打动人们的心:第一句 "不一定是做过这件事的人才能做这件事,看重基础能力、创造性和热爱,而不是经验" , 这也是DeepSeek能够创新的关键。第二句 "中国AI不可能永远跟随",没有情怀,没有热爱,是不可能做出DeepSeek这样的产品的。

传统认知中都是美国擅长0-1的创新,中国擅长1-10的应用创新。而DeepSeek的出现让中国也可以引领0-1的创新,称为国运级别的科技成果并不为过。为何说DeepSeek比六代机的影响大万倍?因为它摧毁了美国当下的所有战略目标!2025年,中国AI将会迎来大爆发!“星际之门”出身未捷身先死?DeepSeek竟使美国AI泪满襟!

2、杭州深度求索人工智能基础技术研究有限公司(DeepSeek)

在人工智能领域,“深度求索”通常指的是杭州深度求索人工智能基础技术研究有限公司(DeepSeek)。以下是关于它的一些信息:

(1)、公司概况 

 成立时间:2023年7月17日。 

 背景:由知名量化资管巨头幻方量化创立。 

 团队规模:团队成员数量不到140人。 

(2)、技术成果 

 2024年1月5日:发布DeepSeek LLM,包含670亿参数,在推理、编码、数学和中文理解等方面表现出色。 

 2024年1月25日:发布DeepSeek-Coder,在多种编程语言和各种基准测试中达到了开源代码模型的最先进性能。 

 2024年2月5日:发布DeepSeek Math,在竞赛级Math基准测试中取得了51.7%的优异成绩。 

 2024年12月26日:上线DeepSeek-V3首个版本并同步开源,在知识类任务上水平显著提升,生成吐字速度相比V2.5模型实现了3倍的提升。 

 2025年1月:发布最新开源模型DeepSeek - R1,用较低的成本达到了接近于美国OpenAI开发的GPT - 01的性能。 

(3)、技术优势 

 训练方法创新:DeepSeek-R1在后训练阶段大规模使用强化学习技术,在仅有很少标注数据的情况下极大提升了模型的推理能力。 

 架构优化:采用MoE(混合专家模型)架构,通过有针对性地激活不同的子模型,有效降低了计算成本。 

 精度训练提升:独特的FP8混合精度训练方法提高了训练效率,降低了单次训练成本。 

(4)、行业影响 

 技术变革:打破了人工智能发展依赖“堆算力”的传统模式,为行业发展提供了新的路径。 

 市场竞争:其低成本、高性能的模型降低了大模型开发门槛,使小型企业也能参与竞争,可能会改变人工智能市场的竞争格局。 

 开源推动:开源模型为全球用户提供了更好的选择,有利于推动人工智能技术的开发和应用。

3、深度求索人工智能掌门人是梁文锋

梁文锋简介

深度求索人工智能掌门人是梁文锋,以下是他的简介: 

 教育背景:1985年出生于广东省湛江市。2002年,17岁的他以吴川一中“高考状元”的成绩考上浙大本科电子信息工程专业,后于2007年考上浙江大学信息与通信工程专业研究生,并于2010年获得硕士学位。 

 职业经历:2013年,与浙大同学徐进共同创立了杭州雅克比投资管理有限公司。2015年,创立杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资,2021年,幻方的资产管理规模突破千亿大关。2023年7月,正式创办杭州深度求索人工智能基础技术研究有限公司(DeepSeek),专注于AI大模型的研究和开发。 

 个人成就:带领深度求索团队推出了多个有影响力的大模型,如2024年发布的DeepSeek LLM、DeepSeek-Coder、DeepSeek Math等,以及2024年12月26日上线并开源的DeepSeek-V3模型,还有2025年1月20日发布的DeepSeek-R1模型,该模型在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

4、为什么Deepseek式的AI创新没有出现在清华系的企业里?

Deepseek创始人梁文锋是硕士毕业,但明显是创业者的底色,本科和硕士都就读于浙江大学,2008年,研究生毕业的梁文锋并没有走上“码农”的道路。所以本质上他是个商人,饥渴、务实、第一性、喜欢从0到1、喜欢把手弄脏,有责任感。反观清华系的教授们是否还是让硕士生+博士生的模式推动,底色不是创业,而是干科研,人不对,事情又怎么对?

Deepseek的爆发正是市场化机制更具有生命力的证明。在内在驱动力的推动下更有机、更容易纠偏,更诚实地做正确的事情。不逆人性就是市场化的很好体现!年轻人的氛围构建起信息真实、高效的流通。DeepSeek非常偏爱没有工作经验的年轻人,而且指明不要资深人士,“工作经验在3~5年已经是最多的了,工作超8年的基本就pass了”。这样的流转更促进地迭代。再看清华系的任人唯亲,没有危机感,可见一斑。

北京这座城市有很多顶尖高校,清华和北大也有很多人才和聪明人。但是聪明反被聪明误,聪明人大多过不了自己要求“完美”和“清白”这一关。完美主义者们,手弄得不够脏,有把事情做正确的实力,但缺乏把事情做正确的勇气。把事情做正确的前提是,把事情快速做错。北京没有创新了,因为本质是科研,而科研的现状是是阶级固化是服从式训练,人若不自由,哪会有创新?

参考文献
1.小红书。为什么Deepseek式的AI创新没有出现在清华系的企业里? #AI #创业 #人工智能 #科研 #北京 #清华 #deepseek #openai #市场化 #逃离北京  2024.11.28发表于广东
2.短评:DeepSeek:全球AI竞赛中的“中国震撼”|东西问 中国新闻周刊 2025年01月29日 12:00 北京
3.一个撼动全球的中国人!燕大 燕梳楼 2025年01月29日 13:15 江苏

(图片来源网络,如有侵权联系删除!)


1、如何才能更好地解读历史真相?

2、《关于“美元代用券”的答疑》

3、“为何中国富人在中国能够发财,到了美国后就衰落了?”

4、《西方文明冲突模式底层逻辑》

5、《一位美国母亲的GDP计算》

6、2025春晚:传统与创新交织的视听盛宴

7、《美国为何不允许中国在美国办学?》

8、如果俄罗斯真输了我们的选择?

9、建立人脉需要黄金法则还是白金法则(上)?



↓↓↓

心理治疗师+中医心理师+心理咨询师

报名扫码咨询


扫码报名


请点亮“在看”,谢谢支持!

心声经典
心理健康与精神保健
 最新文章