起底DeepSeek背后的8位年轻人

文摘   2025-02-08 14:00   河北  

DeepSeek不鸣则已,一鸣惊人。自2025年1月20日发布,最新开源模型DeepSeek R1在全球范围内引发持续轰动。DeepSeek大模型的一大突破,是通过一种名为GRPO的算法,创新训练方法,大大降低了成本。其背后的中国公司深度求索(DeepSeek)也“浮出水面”。

DeepSeek团队的年轻力量

应届生与在读生的活跃表现DeepSeek团队最大的特点之一就是年轻。团队成员中,应届生和在读生占据了相当大的比例,他们活跃在公司的各个项目和研究领域中。这些年轻人思维敏捷、充满活力,对新技术和新方法有着敏锐的洞察力和强烈的探索欲望,为DeepSeek的发展注入了源源不断的动力和创新活力。

清北应届生的关键贡献。在DeepSeek团队中,来自清华大学和北京大学的应届生尤为突出。他们不仅在学术上有着扎实的功底和丰富的研究成果,而且在实际工作中也展现出了卓越的能力和潜力。许多关键的技术创新和项目成果,都离不开这些清北应届生的贡献。他们将所学知识与实际问题相结合,不断突破技术瓶颈,推动DeepSeek在AI领域的持续进步。

从v1到v3的全程参与。有些团队成员从DeepSeekLLMv1开始就加入了公司,并一直参与到了DeepSeek-v3的开发和研究中。他们见证了DeepSeek大模型从无到有、从弱到强的全过程,积累了丰富的经验和深刻的理解。这些全程参与的成员,对DeepSeek的技术发展和产品迭代起到了至关重要的作用,他们的经验和见解为公司未来的发展提供了宝贵的参考和指导。

北京大学罗福莉

罗福莉,女,95后,出生于四川,本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学研究所计算语言学专业。

罗福莉2019年曾在国际顶级会议ACL上发表8篇论文,其中2篇为第一作者。罗福莉的职业生涯始于阿里巴巴达摩院,罗福莉主导开发了多语言预训练模型VECO,并推动了AliceMind的开源工作。2022年,罗福莉转战DeepSeek,参与了MoE大模型DeepSeek-V2的研发 。2024年12月,网传罗福莉被小米创始人雷军以千万年薪招募,担任小米AI实验室的大模型团队负责人 。12月31日,罗福莉的高中班主任告诉红星新闻记者,罗福莉还没决定去小米,还在考虑。

北京大学高华佐

高华佐是MLA架构的关键创新者之一,他非常低调,目前只知道是北大物理系毕业。在DeepSeek团队中,高华佐凭借其扎实的物理基础和对AI技术的深刻理解,为MLA架构的提出和发展做出了重要贡献。他的创新思维和严谨态度,为DeepSeek的技术进步提供了有力的支持。另外,在“大模型创业六小强”之一阶跃星辰的专利信息中也可以看到高华佐的名字,虽然暂不确定是否是同一人,但这也从一个侧面反映出他在AI领域的影响力和活跃度。

北京邮电大学曾旺丁

曾旺丁来自北邮,研究生导师是北邮人工智能与网络搜索教研中心主任张洪刚。在DeepSeek团队中,曾旺丁主导了GRPO算法的研究和开发工作。他深入分析了强化学习中的关键问题和难点,提出了GRPO这一创新的算法,为DeepSeek-Math项目和整个强化学习领域的发展做出了突出贡献。曾旺丁的研究成果不仅在学术界得到了认可,也在实际应用中展现出了强大的潜力和价值。

清华大学邵智宏

邵智宏是清华交互式人工智能(CoAI)课题组的博士生,师从黄民烈教授。他的研究领域包括自然语言处理、深度学习等,特别对如何构建一个稳健且可扩展的AI系统感兴趣。在DeepSeek团队中,邵智宏参与了DeepSeekMath、DeepSeek-Prover、DeepSeek-Coder-v2、DeepSeek-R1等多个项目,为公司在自然语言处理和AI系统构建方面的发展做出了重要贡献。他之前还曾在微软研究院工作过,积累了丰富的研究和实践经验。

北京大学朱琪豪

在北京大学攻读博士期间,朱琪豪校友师从熊英飞副教授和张路教授,研究方向为深度代码学习技术,致力于探索程序语言定义与深度学习技术的深度融合。他的科研成果在ICSE、IJCAI、AAAI、ESEC/FSE、ASE等国际顶级会议上频频亮相,共发表CCF-A类论文16篇。凭借基于语法制导的程序修复技术,他荣获ESEC/FSE 2021杰出论文提名奖,并多次斩获ACM SIGSOFT杰出论文奖。

在博士阶段,朱琪豪校友不仅在学术上收获颇丰,还将研究成果成功应用于产业。他主导开发了国产开源代码大模型DeepSeek-Coder-V1,达到国际领先水平,相关技术广泛应用于反编译、代码分析、代码修复等领域,受到全球学者和企业的高度关注。由此开发的修复工具Recoder在深度学习修复研究中首次超越传统方法,推动整个行业迈向深度学习的新时代。

朱琪豪校友以其卓越表现,连续获得字节跳动奖学金、北京大学校长奖学金、国家奖学金及北京大学三好学生标兵等重量级荣誉。他的博士论文《语言定义感知的深度代码学习技术及应用》更是入选2024年CCF软件工程专业委员会博士学位论文激励计划,成为该领域具有里程碑意义的研究成果。

北京大学代达劢

除了DeepSeek-V2 MLA和DeepSeekMath GRPO这两项关键成果,值得一提的是,还有一些成员从v1就加入其中,一直到v3。代表人物之一是代达劢,2024年博士毕业于北京大学计算机学院计算语言所,导师是穗志方教授。

北京大学王炳宣

北大元培学院的王炳宣,来自山东烟台,2017年进入北大。硕士毕业后加入DeepSeek,参与了从DeepSeek LLM v1开始的一系列重要工作。

浙江大学梁文锋

梁文锋,1985年出生于广东湛江吴川,父母都是小学语文老师,这也使得他从小就成绩优异。“湛江发布”提及他一段成长往事:梁文锋性格很文静,但不是书呆子,在学习上很有自己的“一套方法”,初中时就学完了高中数学,甚至开始学大学数学。

2002年,梁文锋以吴川一中“高考状元”的成绩考上浙江大学,本科就读电子信息工程专业,之后又继续攻读浙江大学信息与通信工程专业研究生。大学期间,梁文锋就与同学一起开始积累市场行情数据和探索全自动量化交易。

2015年,梁文锋硕士毕业后和几位浙大同学共同创立了量化对冲基金公司幻方量化,并于当年拿到第一张私募牌照,几年时间管理规模迅速超百亿。

有意思的是,2016年幻方量化便首次上线AI策略,并在之后实现投资策略全面AI化,同时也是国内唯一公开宣称拥有万张英伟达A100显卡的企业。大学时期梁文锋便坚信“AI一定会改变世界”,这些都为后来投身AI埋下伏笔。

转折点是2023年,全球AI大模型风起云涌,国内大佬纷纷宣布AI创业,梁文锋也是其中一员。那年4月,梁文锋宣布正式进军通用人工智能领域,“追寻一直以来的技术理想,超越投资去直面更大的课题”。很快,DeepSeek在杭州应运而生同年11月,DeepSeek 发布了开源的代码大模型。

成立至今,DeepSeek并未开放过外部融资,因此也并未引起创投圈的过多关注。直至2024年5月,DeepSeek发布DeepSeek-V2开源MoE模型,因极度降低推理成本,意外掀起一场大模型“价格战”,开始出圈。

隐秘低调,却聚集了一群AI天才。据悉,DeepSeek包括创始人梁文锋在内,仅有130多名工程师和研究人员。不同于其他明星创业公司,DeepSeek鲜有海归,团队成员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,不少还是在读博士。去年底,雷军开出千万年薪挖角DeepSeek研究员罗福莉。

这一次,DeepSeek正式浮出水面。上个月,梁文锋和团队开发的大模型DeepSeek-V3正式发布。起初在AI发烧友圈内流传,由于表现出色,一时轰动硅谷。2025年1月20日,DeepSeek正式发布DeepSeek R1,开始席卷全球。

对人工智能行业的影响与启示

DeepSeek团队的成功不仅为公司自身带来了巨大的价值和声誉,也为整个AI行业提供了宝贵的经验和启示。首先,DeepSeek团队的年轻化和创新化,展示了年轻人才在AI领域的巨大潜力和价值,激励着更多年轻人投身于AI行业,为行业的发展注入新鲜血液。其次,DeepSeek在技术创新和团队建设方面的成功经验,也为其他AI企业提供了借鉴和参考,推动了整个行业的技术进步和人才培养。最后,DeepSeek的成功也进一步证明了AI技术的巨大应用前景和发展潜力,为行业的发展指明了方向,增强了人们对AI未来的信心和期待。(来源:本文根据网络公开信息整理而成,转载请注明出处。)

全国高校人工智能与大数据创新联盟

全国高校人工智能与大数据创新联盟(简称:高校联盟)是由清华大学、浙江大学、中南大学、东北大学、上海工程技术大学、重庆邮电大学、东北林业大学、佛山科学技术学院、曲阜师范大学、黑龙江大学、海豚大数据科技等全国54家高校、企业共同发起,于2018年5月26日在北京中国科技会堂正式成立。迄今为止,联盟发展会员300多家, 覆盖全国20多个省市。联盟由一批积极投身于“人工智能、大数据、区块链”教育事业的高校、科研机构、企事业单位和个人自愿组成的公益性、全国性学术交流服务平台。中国工程院原常务副院长、中国工程院院士潘云鹤、中国科学院院士陈国良、中国工程院院士李伯虎担任联盟名誉理事长,中国工程院院士谭建荣担任联盟理事长。联盟工作接受工信部、国家网信办等政府部门行政管理和业务指导。联盟主要工作是推进产教融合、校企合作、协同育人。(加盟微信13651193492)


华算人工智能研究院

华算人工智能研究院全称是“山西省华算人工智能研究院有限公司”,是经山西转型综合改革示范区管理委员会批准,于2023年10月在太原成立的第一批专业研究人工智能、赋能数字经济产业发展的独立法人组织。华算人工智能研究院依托全国高校人工智能与大数据创新联盟专家委员会及理事会资源,按照山西省委省政府、山西转型综合改革示范区管理委员会发展人工智能、数字经济的系列文件精神和工作计划,将研究院打造成为山西省发展人工智能、数字经济的示范应用推广平台,同时面向全国开展人工智能业务。华算人工智能研究院名誉院长由中国工程院院士李伯虎担任。研究院内设AI产业学院共建中心、实训实习就业中心、实验室建设中心、专家智库等6个职能部门。欢迎加入华算人工智能研究院专家智库,共同赋能高校AI人才培养及产教融合事业发展。


高校区块链专委会

全国高校人工智能与大数据创新联盟区块链专委会(简称:高校区块链专委会),是由北京大学、浙江大学、武汉大学、西南财经大学、北京交通大学、郑州大学、贵州大学、桂林电子科技大学、山西农业大学、佛山科学技术学院、陕西师范大学、中国网安、海豚大数据科技等全国40多家高校、企业和机构共同发起,于2019年12月7日在广东省佛山市正式成立。目前发展高校及企业会员70多家。中国工程院院士、浙江大学教授陈纯担任高校区块链专委会名誉顾问;福州大学教授蔡维德、中国计算机学会区块链专委会主任斯雪明教授、中国人民银行数字货币研究所副所长狄刚担任高校区块链专委会名誉主任;北京大学信息科学技术学院区块链中心主任陈钟教授担任高校区块链专委会主任。高校区块链专委会主要工作是促进高校区块链教育,为高校区块链专业建设及学科发展提供专家咨询服务。


高校元宇宙专委会

全国高校人工智能与大数据创新联盟元宇宙专业委员会(简称:高校元宇宙专委会),是由清华大学、湖南大学、浙江大学、四川大学、汕头大学、河北金融学院、保定市元宇宙协会、英伟达中国、海尔衣联网研究院、海豚大数据科技(天津)有限公司等全国20多所高校、企业和机构共同发起,于2022年11月5日在北京正式成立。中国工程院院士、计算机软件与虚拟现实领域专家赵沁平担任高校元宇宙专委会名誉顾问;中国工程院院士、北京航空航天大学电气与自动化学院名誉院长、中国航天科工集团有限公司科技委高级顾问李伯虎担任高校元宇宙专委会名誉主任;清华大学信息国研中心可信软件和大数据部常务副主任邢春晓担任高校元宇宙专委会主任委员。目前已发展高校及企业会员30多家。高校元宇宙专委会主要工作是促进高校元宇宙教育、加强校企合作、推动元宇宙专业建设及学科发展,为元宇宙教育教学提供专家咨询服务。


高校数字经济专委会

全国高校人工智能与大数据创新联盟数字经济专业委员会(简称:高校数字经济专委会),是由华算人工智能研究院、清华大学、北京大学、中国人民大学、中国社会科学院信息化研究中心、四川大学、北京外国语大学、北京科技大学、北京工业大学、北京语言大学、北京化工大学、北京联合大学、北京物资学院、北京印刷学院、西藏民族大学、河北金融学院、重庆财经学院、苏州城市学院、北京中关村软件园、百度、海豚大数据科技等全国60多家高校、企业和机构共同发起,于2024年1月12日在北京正式成立。清华大学经济管理学院教授姜旭平、北京大学信息管理系教授赖茂生、中国社会科学院信息化研究中心主任姜奇平、中国科学院大学经济与管理学院教授吕本富担任高校数字经济专委会主任委员。高校数字经济专委会主要工作是促进高校数字经济专业建设及学科发展,推动产学研合作,为高校数字经济专业教育教学提供专家咨询服务。

联盟“资料图书馆”

左右滑动查看更多







微信咨询

说明:转载文章和图片均来自公开网络,推送文章除非无法确认,都会注明作者和来源,如有侵权请联系删除。

往期精彩文章(单击就可查看):

. 2024全国535所普通高校人工智能专业教育教学综合实力排行榜
. 2024全国775所高校数据科学与大数据技术专业教育教学综合实力排行榜
2024全国76所高校智能医学工程教育教学综合实力排行榜
. 2024全国217所高校智能科学与技术专业教育教学综合实力排行榜
2024全国79所高校区块链专业教育教学综合实力排行榜
. 2024全国252所高校大数据管理与应用专业教育教学综合实力排行榜
. 2024全国336所高校智能制造工程专业教育教学综合实力排行榜
. 2024全国366所高校机器人工程专业教育教学综合实力排行榜
. 2024全国224所高校数字经济专业教育教学综合实力排行榜
2024全国224所高校数字经济专业教育教学综合实力排行榜
2024全国964所高职高专院校大数据技术专业教育教学综合实力排行榜
. 2018全国高校人工智能与大数据教育教学创新论坛暨北大创新评论峰会在京成功举办
. 2019第二届全国高校人工智能大数据教育教学创新论坛暨教材出版研讨会在京成功举办
. 2020第三届全国高校人工智能大数据区块链教育教学创新论坛在京成功举 
. 2021第四届全国高校人工智能大数据区块链教育教学创新论坛在京成功举办
. 2022第五届全国高校人工智能大数据区块链教育教学创新论坛在京成功举办
. 赋能知识图谱20人 2019赋能中国人工智能知识图谱20位标杆人物
. 习近平:培养人工智能高端人才 是教育的重要使命
. 元宇宙2021年度中国领军人物榜单揭晓
. “ 优秀教材建设奖”获奖人员名单及获奖理由 2021年度全国高校人工智能大数据区块链优秀教材建设奖揭晓
. 两会好声音:20位代表委员提案人工智能 新基建新风口带来哪些新机遇?
. 教育部发布全国高等学校名单(普通高校2688所,成人高校268所)
. 施一公:无论什么学科,最不重要的素质是智商
. 教育部印发《高等学校区块链技术创新行动计划》在高校布局一批区块链技术创新基地
. 斯坦福大学——人工智能本科4年课程清单

. 信息量巨大!美国终于公开了《2016-2045年新兴科技趋势报告

高校大数据与人工智能推进联盟
全国高校人工智能与大数据创新联盟是普及人工智能大数据区块链知识,推广人工智能大数据区块链技术与应用、创新高校服务的学术团体和服务平台。
 最新文章