在人工智能领域,一场激烈的竞争正在上演。
随着DeepSeek推出新模型DeepSeek-R1,1月27日,Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。这一消息让广大用户对这款新兴应用产生了浓厚兴趣。
图片来源:央视新闻
随着DeepSeek登上热搜,其创始人梁文锋也逐渐被外界关注。据介绍,梁文锋,1985年出生于广东省湛江市,17岁考入浙江大学。另外,有网友注意到,除了梁文锋来自广东湛江,中国还有两位AI大佬也是广东人:Kimi创始人杨植麟来自广东汕头,人工智能领域的杰出科学家何恺明来自广东广州。
17岁考入浙江大学
业内称其是“极致的80后技术理想主义者”
DeepSeek的爆火,让其创始人梁文锋颇受关注。业内口碑称,这是一位极致的80后技术理想主义者,每天就是“看论文,写代码,参与小组讨论”。
2002年,这位对数学建模充满热情的年轻人考入浙江大学电子信息工程专业,并在随后的几年里继续深造,最终于2010年获得信息与通信工程硕士学位。
在校期间,他对金融市场产生了浓厚的兴趣。特别在2008年全球金融危机之际,他带领团队探索了机器学习技术在全自动量化交易中的应用潜力,这一经历为他日后的职业生涯奠定了坚实的基础。
毕业后,梁文锋将目光转向更广阔的金融市场。
2013年,他与浙大同学徐进共同创立了杭州雅克比投资管理有限公司,两年后又成立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。2015年的市场波动中,幻方依靠先进的高频量化策略取得了令人瞩目的成绩。
2016年是幻方的重要转折点。这一年,公司推出了首个基于深度学习的交易模型,并实现了所有量化策略的AI化转型。2018年,幻方正式确立了以AI为核心的发展战略。然而,随着业务的快速扩展,算力瓶颈逐渐显现。
为解决计算资源不足的问题,2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。
2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。2023年,他宣布将正式进军通用人工智能领域,并创办了深度求索DeepSeek,专注于做真正人类级别的人工智能。
又一次厚积薄发的中国式奇迹
极目新闻评论员 徐汉雄
继“小红书”之后,DeepSeek又一次让中国科技火出了圈,引发现象级的讨论与传播效应,其强大的推理能力与文本生成能力,在朋友圈竞相转发的测试作品中可见一斑,可以说是令人叹为观止。
DeepSeek火出了圈(视频截图)
在中国传统文化中,蛇是智慧与吉祥的象征。蛇年到,中国人的智慧通过DeepSeek展现得淋漓尽致。这真是一份厚重的新年礼物,寓意着中国人的智慧还会创造出无限可能的奇迹。
DeepSeek的爆火,不仅是因为下载量超越了ChatGPT而令人引以为傲,更因其强大的实力与潜力而让中国人精神振奋。在第三方基准测试中,其表现优于OpenAI、Meta和Anthropic等美国领先人工智能公司。其以极低的算力(仅为同行的1/11)和GPU芯片数量(2000个)训练出了性能超越GPT-4o的大模型DeepSeek-V3,被认为是大模型行业的大“黑马”,外国网友惊呼为“神秘的东方力量”。
在人工智能领域,之前的看法是算力目前美国强,算法大家慢慢地差不多,但是数据一定是中国强。DeepSeek的成功就在于巧妙地绕过了算力制约,另辟蹊径,通过相关架构节省了大量显存,进而实现底层算力的高效利用,以更低的成本训练出更加出色的模型效果。这种技术思路可谓是以扬长避短来实现弯道超车,令硅谷AI界感到措手不及。
DeepSeek引发下载热潮(图片来源:东方网)
DeepSeek的横空出世,称得上是一鸣惊人,因为这是一家于2023年成立的中国初创企业,一出手即是不同凡响。看起来是“大黑马”,实际上是中国科技厚积薄发的必然,是中国科技整体实力“大白马”的投射。
数据显示,截至2020年底,我国科技人力资源总量为11234.1万人,居世界首位。2022年,中国在各学科最具影响力期刊上发表的论文数量排名世界第一。
今年1月11日发布的《全球高层次科技人才态势报告》则显示,过去五年,全球高层次科技人才格局历经深刻变革,中美两国始终占据主导地位,但人才占比走势截然相反。美国高层次科技人才数量从2020年的36,599人逐年下降至2024年的31,781人,占比相应从32.8%降至27.3%。中国高层次人才数量从18,805人上升至32,511人,占比从16.9%跃升至27.9%。
以AI领域来看,据美国乔治城大学数据库ETO截至去年12月最新数据显示,2014年至今,中国是论文最“高产”的国家,近十年共发表AI相关论文近64万篇,位居全球第一,是美国(第二位)的1.6倍。《日本经济新闻》今年1月9日发文指出,近年来中国AI研究实力突飞猛进,开发的AI产品足以同美国同类产品匹敌。
DeepSeek的异军突起,放在中国AI领域的宏大叙事中,是其中的精彩一笔,也是水到渠成的必然。就如DeepSeek创始人梁文锋所说,中国AI不可能永远处在跟随的位置。中国人一定会在探索中寻求突破。
美国《时代》周刊早就发现端倪,虽然美国在芯片上对中国卡脖子,但中国在人工智能领域以极快的速度追上来了。原来,支撑AI领域发展的核心三件套,分别是数据、算法以及算力。美国只能通过限制芯片来限制算力,但数据和算法是难以被限制的。中国有丰富的AI人才储备,且数量多于美国。芯片限制是徒劳的。
DeepSeek的成功证实了美国《时代》周刊的分析。中国的AI大模型通过软件和算法的优化,反超有尖端芯片支持的美国大模型。限制没有出路,合作才能共赢。
DeepSeek的成功举世瞩目。OpenAI前政策主管、Anthropic联合创始人Jack Clark曾认为DeepSeek雇用了“一批高深莫测的奇才”,实际上其团队成员多是来自清华、北大、北航等顶尖高校的应届博士毕业生、在读生以及硕士生,没有“海归”,完全是本土人才。
这是典型的中国式成功。中国高校自己培养出的青年才俊,一家位于杭州的中国公司,推出的国产大模型,创造出超越ChatGPT的传奇。一切就这么简单又不可思议,令西方大跌眼镜。
看似寻常最奇崛,看似奇崛却寻常,这就是DeepSeek带来的震撼与震动。在平凡中创造伟大,在于无声处听惊雷,对中国科技人员来说,早就不足为奇。DeepSeek的爆发,不过是又一次厚积薄发的中国式奇迹。
从“两弹一星”到神舟飞船;从银河系列计算机到量子计算机……一系列重大科技成果早已证明了这一点,没有任何限制可以阻挡中国科技的发展。
恭喜DeepSeek!中国科技的征程是星辰大海。灿烂星空中,那些平凡的科研人员会带来更多感动!
来源:极目新闻(记者:孙喆 评论员:徐汉雄)综合广州日报、光明网、都市快报、上观新闻、财联社等
编辑:陈曦紫
审核:谢礼逵