[人物故事]
世界领先的科技创新人才
——梁文锋的故事
作者 信 真
最近DeepSeek全球“爆火”。
Deepseek 创始人是梁文锋。
他被誉为:异军突起的AI怪才,强悍的后来居上者!
2025年1月20日,DeepSeek最新发布的R1模型不仅在性能上比肩甚至超越了OpenAI的 o1,并完全开源,且以极低的成本实现了这一突破。
2025年1月20日下午,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。
在座谈会上,李强总理提到,“要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点。”
梁文锋参加此次座谈会并进行了发言。
1985年,梁文锋出生于广东省湛江市,父亲是小学老师。2002年,他考入浙江大学电子信息工程专业,后在浙大继续深造,于2010年获得信息与通信工程硕士学位,论文题目是《基于低成本PTZ摄像机的目标跟踪算法研究》。在校期间,他对金融市场产生了浓厚的兴趣。特别在2008年全球金融危机之际,他带领团队探索了机器学习技术在全自动量化交易中的应用潜力,这一经历为他日后的职业生涯奠定了基础。
2013年,梁文锋与浙大同学徐进共同创立了杭州雅克比投资管理有限公司。2015年,创立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。在2015年的市场波动中,幻方依靠先进的高频量化策略取得了令人瞩目的成绩。
2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。
到2017年底,幻方量化几乎所有的量化策略都采用AI模型计算。2018年,幻方正式确立了以AI为核心的发展战略。随着业务的快速扩展,算力瓶颈逐渐显现。
2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。
同年8月30日,梁文锋在金牛奖颁奖仪式上,发表主题演讲《一名程序员眼里中国量化投资的未来》,引发金融从业人士热议。
两年后,梁文锋团队研发“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。
2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。
2023年5月,梁文锋宣布做通用人工智能(AGI),7月,他正式创办杭州深度求索人工智能基础技术研究有限公司(DeepSeek),专注于AI大模型的研究和开发。
2024年5月,DeepSeek发布混合专家语言模型DeepSeek-V2,并宣布DeepSeek-V2的推理成本被降到每百万token仅1块钱,约等于GPT-4 Turbo的七十分之一。随后国内排名靠前的大模型先后跟进降低成本,DeepSeek因此被称为“AI界的拼多多”。
同年12月26日,DeepSeek宣布上线并同步开源的 DeepSeek-V3模型,并公布了长达53页的训练和技术细节。模型测算数据显示,DeepSeek-V3虽然文字生成类任务较弱,但其代码、逻辑推理和数学推理能力均名列前茅。
在DeepSeek研究团队同步公开的技术论文中,一个细节引发广泛关注:DeepSeek-V3整个训练过程仅用了不到280万个GPU小时,按每GPU小时2美元计算,模型全部训练成本仅为557.6万美元(约4000万元人民币),这一成本几乎是GPT-4o训练成本的二十分之一。
梁文锋在AI大模型领域的创新主要体现在其提出的MLA架构和DeepSeek-V3模型上。DeepSeek-V3以极低的训练成本和高效的性能,被誉为“来自东方的神秘力量”,在多个基准测试中表现优异,性能接近甚至超越了世界顶尖的闭源模型。
梁文锋的成功不仅推动了中国AI技术的发展,也激励了广大学子。他通过自己的经历,展示了出身平凡的人通过努力和坚持也能取得卓越成就的可能性。
梁文锋对全球人工智能领域的颠覆性贡献
一是打破成本限制改变行业格局
梁文锋带领团队提出的创新架构如MLA架构等,对全球AI大模型研发产生了巨大冲击。以前AI发展受到高昂成本的制约,无论是算力、存储还是研发资源等方面的高投入,使得很多企业望而却步。而他的创新技术使得模型开发成本大幅降低,例如DeepSeek - V2和DeepSeek - V3模型的研发成本远低于国际水平,DeepSeek - V3研发成本只要558万美元。这使得更多的参与者能够进入AI大模型研发领域,不再被高成本所限制,对行业格局产生颠覆性改变,加剧了全球范围内的竞争同时也加速了AI技术的普及速度。
二是 开源理念推动技术共享与创新
梁文锋倡导的开源文化在闭源趋势为主流的AI领域如同清流。开源行为促进了全球范围内的技术共享,世界各地的开发者都能够基于深度求索开源的模型结构、算法等进行优化和再创新。这种开源行为打破了传统上算法和模型的闭源垄断,激励更多的开源项目诞生,形成一个更加开放、竞争更加充分、创新更为活跃的全球AI技术生态,每一个开发者都可能根据开源资源推动整个行业向前发展,而不再受限于少数拥有闭源技术的企业,促使AI这一颠覆性技术能够在共享和交互中不断提升。
三是改变中国AI在全球的形象与地位
多年来中国AI企业在全球范围内被部分人认为是模仿者或者跟随者,但梁文锋创立的深度求索凭借其自主创新,如在模型架构和研发思路上的独特创新,以及在多个性能指标上接近或超越国际顶尖水平的大模型产品,改变了这一固有印象。深度求索向世界展示了中国AI企业能够成为创新贡献者,能够在全球人工智能技术前沿领域占据一席之地,不仅仅是在应用上摸索,在基础研究如模型结构、算法优化等方面也有自己的独特见解并引领趋势,进而提升了中国AI在全球的整体影响力,成为中国AI迈向国际领先的重要里程碑式的推动力量。
四是激发全球对AGI发展的重新思考
他对通用人工智能(AGI)的积极探索和深度求索在多个方向上的努力,引发全球对AGI发展进程的重新考量。AGI被视为人工智能的终极目标,过去很多企业或是在性能提升的局部探索,或是专注于商业应用而对AGI的远景投入和探索不够全面深入。深度求索的尝试促使全球的企业、研究机构重新审视自己在AGI发展路径上的布局,是否应该兼顾商业和科研长远目标、是否需要在多模态、自然语言和数学推理等多方向协同进行AGI的升级探究等,激励了更多组织在AGI方面进行更为全面和深入的研究规划进程。
关于梁文锋的权威报道和评价
🔺 业界关注与认可
深度求索的模型成绩斐然。如DeepSeek - R1模型跻身大模型竞技榜前三,在复杂提示词/风格控制榜单上独占鳌头,在衡量模型编程开发能力的WebDev分榜上紧随ChatGPT - 4o(2024年11月20日版)位列第二,引发了业界广泛关注。图灵奖得主LeCun对DeepSeek给出了高度评价,认为它代表了开源的力量,意味着开源模型正在超越专有模型,这也侧面反映了对创始人梁文锋的肯定。这些报道表明梁文锋在全球人工智能领域已经赢得了行业内部高端群体和权威代表的重视与认可 。
🔺🔺国外网友视角下的梁文锋
在对梁文锋的中文采访被翻译并且传播后,国外网友对他视角独特。国外网友感慨他和他的团队是一群有点理想化的技术狂,但坚信他们能搞出通用人工智能(AGI),并且认可他们确实有这个资源和天赋。像这样的来自于国外普通大众(尤其是对AI技术感兴趣的群体)中的高评价反馈,也说明了梁文锋以及其带领的深度求索在国际上有相当的影响力,他们的创新行为和理念已经跨越国界被大众所知晓和探讨 。
【作者简介】信真,1953年生。1973年入伍。历任北京军区党委秘书、军区政治部宣传部副部长,军区政治部秘书长,某甲种师政委,石家庄警备区政委。从部队退休后,放弃京城优越生活,回乡创业十年,组织退役军人、军烈属、困难户成立了天津龙鑫园农作物种植专业合作社,创办了有机生态果园,为乡村振兴做出了贡献。爱好文学写作,有多部(篇)作品出版、发表,并多次获奖。