DeepSeek刷屏！那个震惊硅谷的浙大天才，暴露了中国教育最大的短板

教育 2025-01-28 16:21 河北

来源 | 外滩教育（ID：TBEducation）

作者 | 张楠

最近，硅谷的一众大咖开启了“夸夸模式”，都被国产AI DeepSeek惊艳到了。我们也惊喜地发现，这是一个超级年轻、完全本土化的团队。更让人好奇的是，以他们为代表的年轻人，为何如此有创新能力？究竟是怎样的土壤孕育了这样的新生代？

2025年的第一波科技震撼，来自国产人工智能DeepSeek（深度求索）。

1月20日晚，DeepSeek发布新模型 DeepSeek-R1 正式版。很快，访问量激增，甚至一度让DeepSeek闪崩，但问题在数分钟内得到解决。

截至发稿，DeepSeek已经在App Store中国区免费榜登顶，在美区也已经飙升至第二，仅次于ChatGPT。

在专业测试中，该模型表现优于OpenAI、Meta和Anthropic等一众美国领先人工智能公司。

更重要的是，DeepSeek仅仅用了十分之一的成本，就达到了GPT-o1级别的表现。

与国际巨头相比，DeepSeek这个国产AI凭借更低成本、更强性能和更开放的技术路线，迅速引发全球关注。

谷歌搜索关于DeepSeek的新闻报道

Scale AI 的 CEO Alexandr Wang 称其为一款“震撼世界的模型（earth-shattering model）”；

英伟达高级研究科学家Jim Fan评论说：“我们生活在这样一个时代：一个不是美国公司的AI企业却实现了 OpenAI成立时的使命——做真正开放的前沿研究、为所有人赋能”；

而扎克伯格则立即表示，Meta计划在 2025 年投入超过 600 亿美元，加大对人工智能的投入。

自2022年底ChatGPT问世以来，AI正在空前地快速迭代。如何培养孩子的创新思维和全球视野，在日新月异的科技商业世界中谋求一方天地，成了许多家长最挂心的问题。

而DeepSeek的故事中，或许就有答案。

DeepSeek

何以震撼行业？

创立于2023年7月，DeepSeek诞生至今还不足两年，但这却不是它第一次成为众人瞩目的焦点。

去年，他们发布的DeepSeek V2的开源模型，提供了一种史无前例的性价比：

推理成本被降到每百万token仅1块钱，相当于花1块钱就能写1万条小红书（以350字计算），约等于GPT-4 Turbo的1/70。因此，DeepSeek还得了个“AI界拼多多”的名号。

2024年中，各大模型API价格对比

图源：硬AI

去年底发布的DeepSeek-V3，延续了这种超高性价比的特点。它以极低的训练成本，实现了与GPT-4o等顶尖模型相媲美的性能。

而此次推出的新模型DeepSeek-R1，不仅成本低，更是在技术上有了大福提升。最重要的是，它还是一个开源模型。

这些到底意味着什么呢？

熟悉AI的朋友可能有所了解，以GPT为代表的大语言模型，是以巨大的算力喂养出来的。

而巨大的算力则需要巨大的能耗、高昂的成本——有云计算专家提出，1万枚英伟达A100芯片是做AI大模型的算力门槛——这往往不是一家创业公司能够负担得起的。

而且，根据DeepSeek的说法，国内最好的AI模型水平和国外最好的相比，因为模型和训练方式的差距，可能需要消耗4倍算力，才能达到同等效果。

再加上，美国对先进半导体的出口管制使情况变得更加复杂。自2022年起，美国就持续对中国实施AI芯片出口管制。今年1月13日，美国商务部扩大AI芯片出口管制，中国被列为高风险国家，被全面禁止进口英伟达先进芯片。

《华尔街日报》相关报道截图

有钱、有芯片，就卡死了国内一大片想要人工智能大模型的创业公司。套用李开复的话，这是一个“前排玩家”才有资格入局的游戏。

而DeepSeek，恰好是“前排玩家”之一。

DeepSeek的掌舵人梁文锋，此前更广为人知的身份，是私募巨头幻方量化的创始人。而这家公司，则是迄今为止业内唯一规模曾迈过千亿大关的量化私募，据说每年用于慈善捐款的预算都有数亿元。

梁文锋一直是人工智能的忠实信徒，坚信AI可以改变世界。所以在DeepSeek创立之初，它就是大厂外唯一一家储备万张A100芯片的公司。

但“有资格入局”和“玩出名堂“毕竟是两码事——真正让DeepSeek震撼行业的，是其凭一己之力，实现了技术创新，松动了“唯有大力才能出奇迹”的游戏规则。

训练AI的推理能力传统的方法通常是，给AI模型一个范本答案，通过微调指令和过程奖励模型，来让模型学会用思维链思考。有的还会加入会加入算法，让模型找到最优解。然后再不断反复强化，使模型向范本无限靠近。

传统模型训练路径

图源：腾讯新闻

而DeepSeek-R1则采用了一种“纯”强化学习路径，只给出两个基本规则：答对了加分，答错了扣分；同时要求模型用特定方式记录思考过程。让模型在不断尝试和得到反馈中来提升推理能力。

这种直接的训练方式，虽不完美，但极大提高了训练效率，也大幅减少了对计算资源的需求。

当然，这只是DeepSeek“减负增效”魔法的一小部分。压缩、并行、提升硬件使用效率，DeepSeek一直在技术端尝试，如何“花小钱办大事”。所以，与外界普遍认为的"烧钱"不同，DeepSeek已经实现盈利。

这还没有说到最关键的部分：模型开源和公开技术报告。

DeepSeek-R1训练技术全部公开

图源：Github截图

2025年了，人工智能领域的竞争已经白热化。Open AI都不open（开源）了，Deepseek此举可不仅仅是姿态上好看，更是对那些试图通过出售技术来获取巨额利润的公司构成了实打实的挑战。

o1类推理模型价格对比

图源：DeepSeekAPI文档

从这个角度上看，让硅谷难安的DeepSeek，可说是翻开了AI技术发展的新一页。

坚信AI改变世界

浙大学霸勇闯无人区

对于DeepSeek模型在美引发的广泛讨论，背后的操盘手梁文锋却很淡然。

他在接受媒体采访时表示，“在美国每天发生的大量创新里，这是非常普通的一个。他们之所以惊讶，是因为这是一个中国公司，在以创新贡献者的身份，加入到他们游戏里去。毕竟大部分中国公司习惯follow，而不是创新。”

1月20日，梁文锋参加总理座谈会

图源：央视新闻

1985年，出生于广东湛江的梁文锋为人低调，但在技术创新上却是信心十足。

在浙江大学先后拿到电子信息工程学士学位和信息与通信工程硕士学位后，2015年，梁文锋和两位浙大校友共同创立了幻方量化。

梁文锋在浙大就读期间的科研成果

图源：浙江大学官网

之后，仅用了六年，幻方便抵达千亿规模，并被业界称为“量化四大天王”之一。

彼时，幻方就自带一股离经叛道的气质。和其他同类公司创始人大多拥有海外对冲基金履历不同，幻方完全本土起家，独自摸索，而且在很多做法上也没有“按照约定俗成的道路”走，大大方方按照自己想要的方式来。

梁文锋坚持对人工智能的研发投入，就是很好的例证。他从在浙大读书时就坚信，人工智能可以改变世界。在专注做量化的数年间，他也没有停下对AI领域的关注和探索。

2019年，幻方量化成立AI公司，其自研的深度学习训练平台“萤火一号”总投资近2亿元，搭载了1100块GPU；两年后，“萤火二号”的投入增加到10亿元，搭载了约1万张英伟达A100显卡。

幻方量化官网截图

据梁文锋自己说，这是一个“好奇心驱动”而非商业逻辑下的动作，所以在当时很多人都不理解。不过，如今再看，恰恰是这份对技术的好奇、对创新的向往，让他比很多大厂都更早拿到了做Open AI的算力入场券。

这当然不仅仅是运气，更源于他敢于执行不被普遍理解的事业的勇气。

很少公开谈自己的梁文锋，提过一则年少时的往事：

父亲是一名小学老师，经常有家长找到家里来，谈的“基本就是家长觉得读书没用”。九十年代，广东赚钱机会很多，读书反而显得又些“不务实”。

但今天再看，一个时代过去了，那个时代的观念也过去了。

或许是对这件事的反思，也或许是对自身技术能力的自信，梁文锋在采访中透露出一种坚定从容的气质，即使是没有人做过的事、不被理解和支持的事，他也能不被周围裹挟、坚持做自己认为对的事。

这一次，入局人工智能领域，选择做AGI(Artificial general intelligence，通用人工智能)的基础模型，而不是做产品，亦是如此。

在梁文锋看来，以中国今天的经济体量，中国企业完全有资本去创新，真正缺乏的，其实是信心，以及不知道怎么组织高密度的人才，实现有效的创新。

1%的天才

做99%中国公司做不到的事情

DeepSeek石破天惊一般地问世，让大家不禁好奇，实现了如此创新的团队，是一群怎样的人？

OpenAI前政策主管、Anthropic联合创始人Jack Clark甚至说，DeepSeek雇佣了“一批高深莫测的奇才”。

梁文锋对此回应，“并没有什么高深莫测的奇才，都是一些Top高校的应届毕业生、没毕业的博四、博五实习生，还有一些毕业才几年的年轻人。”

而且，在 V2 模型的研发团队中，“没有海外回来的人，都是本土的”。

年轻化、本土化，是DeepSeek核心团队最鲜明的特点。这也是梁文锋人才观的体现，目前在人工智能领域，“前50名顶尖人才可能都不在中国，但也许我们能自己打造这样的人。”

“量子位”资料显示，在DeepSeek搞科研的人中，有很多是应届生、在读生，尤其是来自清北的。

DeepSeekMath核心作者之一邵智宏，是清华交互式人工智能（CoAI）课题组博士生。研究领域包括自然语言处理、深度学习等，之前还曾在微软研究院工作过；

DeepSeekMath论文作者第一个就是邵智宏

在DeepSeek担任训练/推理基础架构工程师的赵成钢，此前是衡水中学信息学竞赛班成员，CCF NOI2016银牌得主，清华学生超算团队成员，曾三次获得世界大学生超算竞赛冠军，还有英伟达实习经历。

赵成钢（右三）所在的清华超算团队夺得SC19总冠军

图源：清华新闻网

前段时间被全网热议的“95后AI才女”罗福莉，也是因为在DeepSeek的项目经验，才有了后来被雷军“相中”、许以千万年薪的故事。

图源：b站@公子龙龙龙

和很多科技公司一样，DeepSeek对人才的核心标签都是“年轻高潜”，只是DeepSeek对于没有经验的年轻人的偏爱，要更加极致一些：

年龄在1998年出生左右，工作经验最好不要超过五年，“聪明、理工科、年轻、经验少”。

还有消息称，DeepSeek非常重视竞赛成绩。有多个第三方合作机构表示，DeepSeek对竞赛成绩看得非常重，“基本金奖以下就不要了”。

如此说来，说DeepSeek聚集了一群天才，也不算夸大。这种人才聚集模式，为国内的科技创新组织也提供了全新的组织范式。

不过DeepSeek的特别之处，还不仅仅在于挖掘到这部分顶级人才的能力，更重要的是在管理方式上，这家创业公司也有在认真鼓励创新。

有DeepSeek前员工向媒体透露，在那里工作期间，他可以获得丰富的计算资源，并可以自由地进行实验，“这是应届毕业生在其他任何公司都无法享受到的奢侈”。

梁文锋在采访中也证实了这一点。“我们每个人对于卡和人的调动是不设上限的。如果有想法，每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门，也可以灵活调用所有人，只要对方也有兴趣。”

所以，DeepSeek也不做前置分工，全部自然分工。每个人自带想法，然后主动拉人讨论，当这个想法显现出潜力，公司再自上而下调动资源支持。

敢想敢做

这代年轻人的突围之路

DeepSeek之所以如此青睐年轻人，还有一个很重要的原因，那就是创新的底气。

梁文锋说，为什么硅谷那么有创新精神？关键是敢于尝试。

当ChatGPT出现时，国内对前沿创新普遍缺乏信心，从投资人到大厂，都倾向于做应用而非突破。即便也做大模型，还是离不开堆资源堆硬件的老路子。除了出于盈利模式的考虑，对创新不敢想、不敢做，也是一大阻碍。

而这种阻碍和束缚，在年轻人身上会少一些。

初生牛犊不怕虎的道理，自是不用说。不过在外滩君看来，梁文锋，和他手下这群锐不可当的年轻人身上，可贵的并不只如此，还有一种对世界祛魅后由内而外的自信。

可以说，DeepSeek代表了国内新一代年轻人的创新精神：不受传统“美国擅长创新”叙事的束缚、突破了“从1到10”的应用思维局限、对全球科技发展有更加开放和自信的视野。

对上一代创业者来说，科技创新的故事总是围绕硅谷展开，所以很多人心里默认也接受了“美国擅长从0到1的创新，中国擅长从1到10的应用”这套逻辑。

但对这一代年轻人来说，从小就习惯了走出去看世界，他们也自然没有那层“外国月亮”的滤镜。对西方叙事的祛魅，反而让他们无师自通地克服了一些历史遗留的“桎梏”。

如果说一代人有一代人的时代红利，那么这种创新的底气，又何尝不是这一代年轻人天然的优势呢？

言及此，又难免要提及创新生态的形成条件。

孩子的创新能力，需要天赋，更需要后天成长环境的创新生态。毕竟，真正的创新从来都不是一蹴而就，而是在一个宽容、鼓励试错的环境中一步一步迭代出来的。

正如DeepSeek目前打造出的这个创新氛围十分浓厚的环境，每所学校、每个家庭也完全有可能成为一个小小的“创客天地”。

培养新一代创新人才，需要我们用新的教育理念和引导方式。不苛责每一个看似不成功的想法。每一次看似荒谬的尝试，可能都是创造力萌发的契机。

关键是构建一个低压力、高支持的成长空间。鼓励提问，尊重不同观点，让孩子明白探索本身就是一种有价值的学习。创新不仅仅是解决问题，更是培养独立思考和勇于尝试的能力。

最终，孩子们会明白，创新精神不一定非得在硅谷，创新也不一定意味着完美。走在持续探索的路上，那本身就是值得赞许的创新之举了。

K12 成长与教育社区

追踪前沿资讯洞察成长规律

挖掘充满温度的故事探索融合世界的教育

编辑 | 京教君

内容来源 | 外滩教育

今日推荐视频

欢迎扫码加入

京教圈学习交流群

注意！微信算法改版了!

圈友们要是不给京城教育圈加星标，

可能就收不到京城教育圈的推文了，

所以，亲们一定一定一定要加星标！

重要的话说三遍！

然后，多点在看、多点赞、多分享，

不然我们就要失去彼此了……

亲们，快加星标，风里雨里，

京教君在这里等你！

点分享

戳在看

求点赞

京城教育圈

聊聊京城教育圈的人和事，沟通信息，分享故事，交流观点，发现价值。

最新！海淀教委通报

定了！这所北京高校腾退5个校区，整体搬迁

提醒！北京仍处在流感高发期！这四类孩子需要积极治疗

提前两天返校？！北京多区中小学开学时间出炉 | 附开学全攻略

阵风10级以上！北京明起大风降温，冷冷冷……

剩余39项！2025中小学生可参加的全国性赛事活动公布！

春节长假后，孩子出现这些情况不要忽视！

今年寒假，很多人都不带孩子出去玩了

北京仍处流感高发期！市疾控紧急提醒

孩子“佳节胖三斤”怎么减？来看国家新版减肥指南 ——

大S因流感并发肺炎去世，为何流感会致命？专家：高危人群自救“黄金48小时”很重要

《哪吒2》导演饺子：不能给自己留后路，给孩子最好的成长榜样

首位！C9教务处长、国家杰青，当选会士！

我们问DeepSeek，孩子学什么才不会被它淘汰？回答亮了！

八年蛰伏，一朝《封神》！那尔那茜火爆热搜背后，这三点逆袭密码说给孩子听

小孩扔鞭炮引爆沼气，天价赔偿？当地回应——

问了DeepSeek，“非典型做题家”梁文峰们给创新人才培养的10条建议

官宣！389个！市教委认定金帆等高水平学生社团，快看有你的学校么

约满、售罄、“人从众”！假期出游这份安全提示请收好

破15亿！《哪吒2》爆火，背后隐藏的4个育儿密码，令人深思！

春晚爆火小品的教育真相，家长们快来围观！

提醒！小男孩一个“操作”，路被炸飞、车被掀翻……

剑桥放榜！北京已摘得22枚offer！他们来自这些学校，谁是黑马？

热搜爆了！北京这些高校学子亮相蛇年春晚

春晚也开始“卷数学”了？这道“数学魔术”题背后的奥秘讲给孩子听

父母是北大教授，儿子初中辍学，这个家庭真正的托底是什么？

蛇年春晚这些瞬间，刷屏了！

定了！春节假期限玩8小时

DeepSeek刷屏！那个震惊硅谷的浙大天才，暴露了中国教育最大的短板

官宣！2025央视春晚节目单来了

北京发布2025年重要民生实事，这些跟教育相关——

14岁学霸儿子成绩大跳水，妈妈才发现，养育路上的坑，自己心安理得踩了好几个……

贝赛思来北京了！“美版衡水中学”将冲击国际教育格局？

蛇年春晚，最新“剧透”来啦！

孩子的春节仪式感，从打开这份过年清单开始

王星事件后，我带着孩子逃离了泰国国际学校……

最新！教育部重要通知

一波儿新建校和新校区来啦！北京重大民生改善项目发布，31个涉及教育——

关注！44个中小学生志愿服务岗位，面向中小学生

寒假里手机该不该管？这份靠谱的行动指南家长请收好

新年最该给孩子的仪式感，藏在这10件小事里

教育部推荐！中小学生阅读指导目录，值得收藏！

冷҈冷҈冷҈！北京发布大风+寒潮双预警，最低温降至-12℃左右

北京28人获奖！来自这7所学校！信息学奥赛2025冬令营获奖名单出炉

一本线480-490分！海淀高三期末成绩预估市排名出炉！

汇文中学大兴分校签约落地，南城再添一所优质教育资源校！

速看！海淀这18所学校招聘啦——

官宣！事关集团直升！

寒潮突袭！北京首场降雪即将到来，气温“断崖式”暴跌至-12℃！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉