DeepSeek创始人梁文锋除夕夜回应冯骥“国运论”

科技   2025-02-02 22:19   浙江  


▲点击图片查看deepseek手册

公众号后台回复:“deep”,获取deepseek手册

公众号后台回复:“社群”,进入知识分享社群

热文推荐:

思维导图自学手册,让你更聪明地学习!

Adobe 2025全家桶破解版发布(附安装包)

DeepSeek凭借其颠覆性的成本优势,给全球带来了一场AI变革,这一趋势在资本市场上已有比较明显的反应。DeepSeek的应用在1月27日登顶苹果中国地区和美国地区应用商店免费App下载排行榜,甚至在美区下载榜上超越了ChatGPT。DeepSeek凭借其卓越的技术实力和创新精神,迅速崛起为AI领域的佼佼者。

梁文锋的除夕夜感言:

各位知乎的年轻朋友好,我是深度求索(DeepSeek)的梁文锋,刚回答了一个问题,又看到这个问题,除夕之夜忍不住回复一些。

  前几天看到冯总这篇长文时,我正在调试新模型的损失函数,手边的咖啡直接洒在了键盘上——既因为被行业前辈认可的惶恐,更因为冯总这些灼热的文字让我想起十二年前在浙大实验室第一次跑通神经网络时的颤栗。

  必须坦白,团队读到“国运级”这个形容时所有人头皮都是麻的。我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。

  您提到的六大突破,其实每一环都凝结着更动人的故事:那个能在手机上跑的mini模型,灵感来自甘肃一位中学老师在GitHub提的issue;支持联网搜索的功能,是内测用户连续三十天凌晨三点提交错误日志喂出来的。

  特别想分享个细节:上周有位视障开发者用我们的API做了个“气味导航”应用,当他演示如何通过不同频率的震动识别街道商铺时整个会议室安静得能听见显卡风扇的嗡鸣,那一刻我突然眼眶发热,终于理解了您说的“水与电”一一真正伟大的从不是某个模型,而是千万普通人用它创造的善意涟漪。

  冯总说“知识和信息平权”,这正是我们夜夜啃论文的动力。三年前在余杭塘路的小仓库里,我们曾用马克笔在玻璃墙上写下:“让最偏远山村的孩童,能和硅谷工程师用上同样聪明的AI助教”。虽然离这个梦想还很远但每次看到网友们分享的对话截图,就觉得那些熬掉的头发都值得,

  最后想对所有人说:请把掌声留给正在改写规则的每个中国开发者。当你在公交车上调试模型,在早餐摊前画架构图,在产房里突深明级“的瞬间。

  DeepSeek愿做大家代码荒野里的火柴,但真正点燃AI火种的,永远是你们眼底不灭的好奇与坚持,说来特别巧,上周在云栖小镇的创业者夜宵摊上,我还和宇树科技的王总蹲在马路牙子啃烧烤一一他们给四足机器人装的那个动态平衡算法,看得我们团队直拍大腿。

  后来强脑科技的韩总过来拼桌,三句话不离脑机接口与具身智能的融合可能,烤茄子还没上桌,我们已经开始在白纸上画异构计算架构了。

  这就是杭州最迷人的地方吧,所谓“六小龙”从来不是六个孤岛。上个月游科的艺术总监还帮我们调试过3D场景生成模型,而群核的渲染引擎正在让我们的数字人拥有更生动的微表情。

  或许在不远的未来,当宇树的机器人踩着云深处的步态算法走来,搭载着强脑的神经接口,运行着DeepSeek的认知引擎,用群核构建的虚拟世界作为训练场——那个我们幻想中的具身智能,就会从西溪湿地的晨雾里跌跌撞撞地走向人间。

  记得那晚分别时,冯总把竹签子往啤酒瓶里一插,说了句:“你们搞AI的得把灵魂价格打下来啊。”

  现在想来,真正的“国运”或许就藏在这些街边摊的油烟气里:一群不信邪的傻子,用代码当砖瓦,拿算法做钢筋,在资本与质疑的裂缝中,硬生生垒出通向未来的栈桥。

  最后补充一个招聘,欢迎大家加入我们。

  祝大家除夕快乐,来年期待我们的更多模型

DeepSeek发展进程

‌2023年7月‌:DeepSeek成立,总部位于杭州‌。

‌2023年11月2日‌:发布首个开源代码大模型DeepSeek Coder,支持多种编程语言的代码生成、调试和数据分析任务‌。

2023年11月29日‌:推出参数规模达670亿的通用大模型DeepSeek LLM,包括7B和67B的base及chat版本‌。

‌2024年5月7日‌:发布第二代开源混合专家(MoE)模型DeepSeek-V2,总参数达2360亿,推理成本降至每百万token仅1元人民币‌。

‌2024年12月26日‌:发布DeepSeek-V3,总参数达6710亿,采用创新的MoE架构和FP8混合精度训练,训练成本仅为557.6万美元‌。

‌2025年1月20日‌:发布新一代推理模型DeepSeek-R1,性能与OpenAI的GPT-4o持平,并开源‌。

2025年1月26日‌:DeepSeek登顶美区App Store免费榜第六,超越Google Gemini和Microsoft Copilot等产品‌。

1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。


Deepseek的技术秘密 🔍

年轻的创新力量 💥

撑起Deepseek这块金字招牌的,是一群平均年龄极低的顶尖人才
🎓 清北应届生成为主力军
🏆 获奖论文的缔造者
🚀 从DeepSeek LLM v1到v3的全程参与者

这群90后、00后用技术改写AI边界:
1️⃣创新式运用MLA新型注意力机制
2️⃣突破GRPO强化学习对齐算法
3️⃣用年轻定义前沿

技术创新速览 🌈

🔬 自主研发的671B参数模型
🧠 独特的DeepSeek-MoE架构
💻 代码生成能力直逼顶级模型
📚 海量专业知识深度训练

核心竞争力分析

去年12月开源的大模型 DeepSeek-V3简直是开源界的颜值与实力并存:

  • 仅用2000张GPU卡完成训练
  • 训练成本比Llama 3 405B低10倍!
  • 性能几乎相同,但价格仅为GPT-4o的5%
  • API调用成本是Claude 3.5的1/50






——推荐阅读——


DeepSeek最全攻略获取方式

关注公众号

回复: deep 


















干货▶


Adobe2025正式发布!破解版限时领取

思维导图自学手册,让你更聪明地学习!

57套思维导图类PPT模板送给你,思路整理神器!

六大思维导图神器,中文破解版(附安装包)

思维导图软件+教程,提升逻辑思维必备!

300款Xmind思维导图模板:思路整理神器(附下载)

Xmind 2024思维导图中文破解版(附安装包)

40种经典思维模型,提升八大维度能力

六大思维导图神器,中文破解版(附安装包)

138套甘特图表模板,项目管理神器 (附下载)

19个终身受用的世界顶级思维(附思维导图)

100个超经典思维模型(附下载)

麦肯锡十大思考框架(附下载)

收藏!300份麦肯锡中国案例分析报告和分析方法

300套麦肯锡内部案例分析+核心工具方法 (附下载)

麦肯锡、埃森哲等顶尖咨询公司PPT模板(附PPT)

图解丨麦肯锡式逻辑思考术思维导图

麦肯锡工作培训9大手册,职场必备圣经(附全套PPT)

280份麦肯锡、BCG、埃森哲等顶尖咨询公司项目案例

战略咨询公司麦肯锡的工作方法、经典报告、项目案例

40页PPT看懂麦肯锡的思考方式和沟通法则

麦肯锡认知升级三部曲:《麦肯锡方法》《麦肯锡意识》《麦肯锡工具》

查理·芒格的100个思维模型(推荐收藏)

收藏!2000部TED演讲视频合集,20年精华汇总!

500门985大学公开课,拓宽思维增长见识必备!

50大产业链全景图(高清完整版)

历史高清地图集499张

重磅!100大产业链全景图发布(附下载)

47张新质生产力产业链图谱(附下载)

58大新质生产力产业链图谱(附下载)

8个免费好用的PDF编辑器,不想加班的你一定要收藏!


PPT

57套思维导图类PPT模板送给你,思路整理神器!

雷军年度演讲PPT合集(附下载)

最全440套PPT可视化模板,数据展示必备神器

麦肯锡、埃森哲等顶尖咨询公司PPT模板(附PPT)

世界500强PPT模板,让你逼格瞬间UP

联合国都在用的演示神器,比PPT酷炫一百倍!

炫酷的地图图表PPT模板,可编辑可动态展示!

63套科技PPT模板,让你的PPT酷炫如科幻大片!

73套顶级互联网发布会PPT源文件,PPT逼格提升必备!

百度内部培训资料PPT:数据分析的道与术(附源文件)

影视

2500集BBC高清纪录片,中英文双语字幕!

豆瓣2023年度电影榜单(附下载)

豆ban评分Top250高分电影,少看一部都是遗憾!

98部超级英雄电影——漫威经典电影合集送给你

北京电影制片厂194部珍贵绝版大合集,经典收藏!

20大制片厂绝版电影大合集,172部超清经典!

100部世界经典名著电影合集(直接观看)

豆瓣年度电影汇总(高清字幕版)

2022高分电影汇总,经典值得收藏(高清字幕版)

2024第96届奥斯卡获奖名单和资源合集

10大制片厂绝版电影大合集,172部超清经典!

98部超级英雄电影——漫威经典电影合集送给你

邵氏电影295部4K大合集,难得的经典(无删减完整版)

全部9分以上!经典历史国产剧(高清未删版)

一度被禁,大型系列纪录片《先生》十集全找到了

阅读

知乎高赞:盘点知识最多、含金量最高的42本书

豆瓣2023年度读书榜单(附下载)

豆瓣TOP250高分经典好书,少看一本都是遗憾(附下载)

《人民日报》:世界公认的十大名著,人生至少要读一遍

《人民日报》:狂读这70本书,脑子真的会变快

人民日报书单:100本深度思考书籍,让你脑洞大开(附PDF

《人民日报》推荐100本高质量书单(附下载)

人民日报书单:100本增长见识的好书(附PDF)

人民日报:100部高分中文小说,堪称伟大(附下载)

体制内必读书单,熬夜也要看完的5本书

二十世纪最伟大的100部中文小说,少看一本都是遗憾

BBC评出的最伟大的100部小说,知识就是力量(附PDF)

史上最经典的100部长篇小说

【干货】罗辑思维推荐书单全集,给大脑充电!

思维升级必读100本书单,终身学习者赶紧收藏

简史系列书籍55部,拓宽你的知识边界

历届茅盾文学奖作品集:中国文学领域巅峰之作

改革开放40年最有影响力的40部小说(附下载)

【合集】影响世界的100部经典名著(有声版)

豆瓣中文小说TOP100,经典值得收藏(附下载)

豆瓣高分外国小说Top100:人类历史的精神宝库

干货丨巴菲特推荐的十本书,堪称投资圣经(附PDF)

马斯克最爱的十本书,颠覆世界从阅读开始(附PDF)

乔布斯反复推荐的10本书(附PDF)

刘慈欣小说合集:探索未来的星辰大海(附下载)

最值得一读的15部中国当代小说,你看过几部?

10分钟搞懂《今日简史》《人类简史》《未来简史》

凯文·凯利和他的科技三部曲:预言帝带你看未来

【干货】2000本Kindle电子书免费领取

香港中文大学推荐书单50本(附PDF)

100本哈佛商学院必读书单(附1067页哈佛商学院经典案例)



职场▶

工作计划进度甘特图模板,高效工作必备神器!

推荐收藏!字节+腾讯+华为人力资源体系汇总

2024中国大陆薪酬观察报告(附下载)

191页《腾讯员工职业发展体系》管理手册(完整版)

40张PPT完整解析字节跳动人力资源体系(附PPT)

字节跳动、华为、阿里绩效考核体系(附PPT)

138套甘特图表模板,项目管理神器 (附下载)

926套高逼格Excel可视化图表模板,办公效率神器

54份竞品分析资料(报告、案例、方法与技巧)

PDF编辑神器丨格式转换、编辑修改一键搞定

联合国都在用的演示神器,比PPT酷炫一百倍!

华为项目管理法10大模板【Excel和Word版】

华为干部与人才发展手册(附PPT)

《华为基本法》全文,难得一见,值得珍藏!

使用“丰田一页纸”的人,混得都不差

华为任正非内部文章全集(67篇)、任正非400余篇讲稿

麦肯锡最新报告《工作新未来》,2030年,应该做什么工作?

麦肯锡报告:2030年,哪些行业会衰落?

元宇宙▶

清华大学:元宇宙发展研究报告(附PDF)

北京大学:2022年元宇宙全球年度报告(附PDF)

复旦大学:2022年元宇宙报告(附下载)

2021元宇宙报告汇总:重启新世界(附下载)

元宇宙深度研究报告合集(20份)

元宇宙六大技术全景图(附图谱)

元宇宙框架梳理(附PDF)

177页元宇宙深度报告,推荐收藏(附PDF)

元宇宙报告:下一个生态级科技主线(附PDF

一文看懂元宇宙的6层框架、4大赛道,元宇宙深度解析报告

ChatGPT

ChatGPT深度报告合集:奇点临近,未来已来

微软ChatGPT深度研究报告(中文版附下载)

ChatGPT中文使用手册(附下载)

高盛重磅报告:ChatGPT消灭全球3亿打工人(附下载)

清华大学:ChatGPT发展研究报告(192页PPT下载)

ChatGPT提问技术完整指南(附下载)

ChatGPT官方发布:《GPT提问最佳实践》(附下载)

OpenAI《GPT-4 技术报告》中文版(附下载)

南京航空航天大学:ChatGPT的前世今生(附下载)

哈工大:ChatGPT调研报告(附下载)

ChatGPT报告:开启AI新纪元(附下载)

陆奇:ChatGPT新机遇分享(附完整PPT下载)

麦肯锡报告:ChatGPT如何改变商业模式

ChatGPT报告:从ChatGPT到生成式AI

2023ChatGPT研究框架报告(附下载)

ChatGPT深度报告: 重新定义搜索“入口”

ChatGPT背后的核心技术详解

ChatGPT发展历程、原理、技术架构详解和产业未来


互联网

Adobe2025正式发布!破解版限时领取

PDF编辑神器丨格式转换、编辑修改一键搞定

73套顶级互联网发布会PPT源文件,PPT逼格提升必备!

54份竞品分析资料(报告、案例、方法),商业分析必备!

138套甘特图表模板,项目管理神器 (附下载)

腾讯发布95页重磅报告:全面预测中国未来5年趋势


数据▶

最全440套PPT可视化模板,数据展示必备神器

10份数字化转型报告汇总(附下载)

926套高逼格Excel可视化图表模板,办公效率神器

百度内部培训资料PPT:数据分析的道与术(附源文件)

《数字化转型工作手册》(附下载)


科技

马斯克39页火星计划,也许是人类史上最伟大的PPT

麦肯锡发布:2024科技趋势报告(附下载)

麦肯锡、高盛发布:2024十大科技趋势报告(附下载)

《麻省理工科技评论》:2024 年“十大突破性技术”报告(附下载)

高盛发布:两万字人工智能报告(附下载)

特斯拉企业文化手册

500位科学家联合声明:进化论误导了全人类

马斯克疯了!美国人要砸掉中国5000万建筑工人的饭碗!

数学大师丘成桐:中国的科技至少要倒退20年

63套科技PPT模板,让你的PPT酷炫如科幻大片!

阿里120页PPT诠释国家“智能2.0”战略

惊人的预测——来自麦肯锡报告《中国与世界》完整版

美国公布35页的《2016-2045年新兴科技趋势报告》

BBC分析了365个职业,最不可能被机器淘汰的居然是……


社会

美国纪录片《中国这五年》,全世界都沉默了!

麦肯锡报告:2030年,8亿人被机器取代,近亿中国人面临职业转换(附PDF)

高盛2024全球报告:最艰难的已经过去(附下载)

高盛炸裂报告:变革中的中国

联合国报告:中国经济 复苏面临阻力(附下载)

德国颁发抄袭大奖,中国包揽前10名拿了大满贯!

中国一流大学校长们的“洋相”:足够出一本笑话集了!

颜宁在美国又获大奖,我们真的失去了一位伟大的科学家

颜宁现象的警钟:中国不是没有人才!但只成就奴才

BBC分析了365个职业,发现最不可能被机器淘汰的居然是……

清华硕士集体逃离北京!中科院科研人员的自白:我为什么离开北京

刘鹤:我感到了真正的危机,中国要建一道防火墙!

中年危机报告:35岁,中国式中年

德国颁发抄袭大奖,中国包揽前10名拿了大满贯!

朱镕基之子朱云来:中国多盖了三亿人的房子,未来房价将跌到刚需人群能买得起为止











扫码进入知识分享社群

分享优质内容,让阅读有价值

 愿行者智,并智者行  

公众号后台回复 “社群”,  加入社群















悟空智能科技
在未来面前,我们都是孩子
 最新文章