中国对冲基金幻方量化创始人梁文峰领导开发的AI开源模型DeepSeek,最近几天以来引起了世界级的轰动。原因至少有这么三个:在技术层面,DeepSeek先后推出的DeepSeek V3和 DeepSeek-R1两款模型,在能力上几乎可以分别比肩OpenAI的GPT-4o和o1模型;与OpenAI的GPT-4o和o1模型相比,DeepSeek的V3和R1模型在研发成本方面要低得多;DeepSeek将V3和R1模型的技术都开源,让更多的AI团队,能够基于最先进且成本最低的模型,开发更多的AI应用。
游戏科学创始人、《黑神话:悟空》制作人冯骥(微博ID@Yocar-冯骥)在微博发布长文,极力推荐名为DeepSeek的国产AI大模型。他直言:“这可能是国运级别的科技成果。”作为深耕技术领域的行业领军者,冯骥鲜少公开为他人的技术产品站台。对于DeepSeek,他在微博上此番发声可谓情绪值拉满。
冯骥在博文中用“暴论”开篇,并列举了DeepSeek同时实现的六大惊人突破——每一项单拎出来都足以震动世人,而DeepSeek却全部做到了:可以比肩OpenAI付费版ChatGPT o1模型的推理能力,暂时没有之一;参数规模更小,训练和使用的经济门槛大幅下降,让普惠AI成为可能;模型、论文、训练细节全部公开,甚至提供可运行在手机端的迷你版,技术透明度高;官方服务零门槛开放,用户无需付费即可体验到世界顶尖AI模型能力;暂时唯一支持联网搜索的推理模型,反观OpenAI付费版ChatGPT o1推理模型至今还不支持联网搜索;开发团队由毫无海外背景的年轻中国工程师组成,印证本土科技力量的崛起。“这六条,DeepSeek全部、同时做到了。”冯骥感叹,“6到不真实。”
当然,也有人意识到,Deepseek的崛起,将可能导致国内外一些开源和闭源AI大模型公司加速倒闭,首当其冲的就是国内那几家“AI小虎”们;同时,将可能导致资源更加集中到巨型平台的竞争当中…
作为DeepSeek的创始人,梁文峰如今无疑已成为人工智能AI领域的代表性人物。那么,梁文峰究竟是何许人也?从互联网整理的信息来看,他过往的奋斗历程堪称励志,是通过自我努力在事业上取得巨大成功的典范之一。DeepSeek在全球AI领域一鸣惊人,甚至让一些外国人对中国人工智能AI技术的巨大进步心生“酸意”,这既是偶然,也是必然。
1985年,梁文峰出生于广东湛江这座五线城市。童年时期的成长轨迹虽难以追溯,但公开信息显示,他在访谈中提到父亲是一名小学老师。自幼,他便对数学建模展现出浓厚兴趣,这一兴趣如同种子在他心中扎根生长。
2002年,17岁的梁文峰凭借优异成绩考入浙江大学电子信息工程专业。2007年,22岁的他又考上浙江大学信息与通信工程专业硕士,师从项志宇,主修机器视觉。
有消息称,大疆创始人汪滔曾邀请梁文峰共同创业,彼时大疆正处于起步阶段。若梁文峰加入,或许也能实现财富自由。但他坚信人工智能AI将改变世界,最终决定独立创业。
网络上还有另一种说法,2008年,梁文峰没有像大多数同学那样投身大厂成为安稳的码农,他独自前往成都,在一间不足十平米、昏暗潮湿的出租屋内潜心钻研。屋内仅有一张破旧书桌和一张单人床,这便是他的全部家当。在这个简陋的空间里,他开始研究用计算机赚钱的各种途径,整日与代码和数据相伴,饿了就吃泡面,累了就趴在桌上小憩。
在探索过程中,梁文峰接触到量化投资。当时,量化投资在国内还是新鲜事物,但他敏锐地察觉到其中的潜力,坚信自己能在这个领域闯出一片天地。为掌握量化投资的核心技术,他开始疯狂学习金融知识。他购置大量金融书籍,从经典金融理论著作到最新量化投资研究报告,如饥似渴地阅读。同时,他报名参加各种金融培训课程,利用网络资源,学习国内外顶尖量化投资机构的经验与方法。
学习过程中,梁文峰遭遇无数困难与挫折。量化投资的数学模型复杂难懂,金融市场波动变幻莫测,每一次尝试与失败都让他感到沮丧和迷茫。但每当他想要放弃时,总会想起量化投资之父西蒙斯的一句话:“一定有办法对价格建模。” 这句话如同一束光,照亮他前行的道路,给予他在黑暗中坚持下去的勇气。熬过无数个日夜,经历无数次失败尝试后,他的坚持终于迎来曙光。2010年,沪深300股指期货正式推出,犹如春风唤醒沉睡的量化投资市场,梁文峰敏锐地抓住了这个机遇。
2010年6月,25岁的梁文峰从浙江大学信息与通信工程专业硕士毕业。硕士毕业后的第三年,28岁的梁文峰将人工智能AI与量化交易结合,和同是浙江大学的校友徐进等人创立了雅克比投资(杭州雅克比投资管理有限公司)。2015年,他们共同创立杭州幻方科技有限公司,也就是今天的浙江九章资产管理有限公司,次年又成立了宁波幻方量化投资管理合伙企业(有限合伙)。
量化投资,简单来说,就是利用数学模型和计算机技术,对金融市场的数据进行分析和预测,从而制定投资策略,即通过计算机取代人,以数量化方式程序化发出买卖指令。这是一个融合金融、数学和计算机科学的交叉领域,需要具备深厚的专业知识和强大的技术能力。
经过几年发展,幻方量化在国内迅速崛起。2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,几乎所有量化策略都采用AI模型计算。2019年,幻方量化管理规模突破百亿,成为国内量化私募“四巨头”之一。
此后,幻方量化一度成为中国首家突破千亿规模的私募量化大厂,确切地说,也是迄今为止业内唯一规模曾迈过1千亿元人民币大关的量化私募投资基金。在此期间,梁文峰在量化投资领域积累了强大的技术实力和算力资源,幻方量化也以强大的算力支持闻名。
网上有文章称,从2019年到2021年前三个季度,幻方量化的投资业绩极为出色;2017年至2022年的业绩曲线收益率达124%,若算上最高点,收益率更是高达200%。也正是在这段时间,幻方的规模疯狂增长,不到2年时间暴涨十倍,在2021年年中突破千亿元规模。私募基金的管理费一般在1.5% 左右,也就是说管理1000亿元规模,仅管理费就能收入15亿元,更不用说还有20%的业绩报酬。即便在2022年到2023年股市行情不佳的情况下,幻方依旧盈利。上证50指数、中证500指数、中证1000指数基本下跌20个百分点,而幻方量化却获得了15%以上的超额收益。
然而,出于某些原因,幻方量化开始收敛锋芒,不声不响地主动收缩投资管理规模。2025年,梁文峰的幻方量化资金管理规模已小于300亿元。
接下来回到AI的话题。随着幻方量化基金规模不断膨胀,梁文峰迎来新挑战。AI交易策略对算力的需求与日俱增,尤其是随着模型参数不断激增,每一次策略优化和模型训练都像是一场对算力的疯狂“掠夺”。GPU芯片算力成为制约幻方量化发展的关键因素,如同高速行驶的汽车突然面临燃料不足的困境。
面对这一棘手问题,梁文峰果断做出大胆决策——大规模布局AI算力。在他看来,算力是未来科技竞争的核心,谁掌握强大算力,谁就能在这场科技革命中抢占先机。
2019年,幻方量化投资2亿元人民币,建成 “萤火一号” AI算力集群。该集群搭载1100块GPU算卡。彼时,特斯拉才刚刚提出Dojo超算概念,而幻方量化已在算力领域迈出坚实一步。
但梁文峰并未满足于此。几个月后,当英伟达发布最新的A100芯片时,他再次展现出敏锐洞察力和果断行动力,抢在众多竞争对手之前,成为亚太地区第一批拿到A100 GPU芯片的人。这一举措让幻方量化在算力竞赛中再次占据领先地位。
2021年,梁文峰再次豪掷10亿元,建成“萤火二号”。这个庞然大物搭载1万A100 GPU算卡——算力相当于76万台个人电脑,占地面积比10个篮球场还要大。“萤火二号”的建成,标志着幻方量化在算力领域已达到世界领先水平。
在AI大模型尚未爆发的年代,梁文峰的这些举动让很多人难以理解,甚至有人觉得他疯了。一家私募基金,为何要在算力上投入如此巨大的资源?但梁文峰心中清楚,他所做的一切都是为了实现一个更大的目标——探索人工智能AI的无限可能。
2023年,随着ChatGPT的爆火,AI大模型成为全球科技领域的焦点,一场没有硝烟的大模型竞赛在全球范围内激烈展开。百度、腾讯、阿里巴巴、字节跳动等国内互联网巨头纷纷入局,投入大量资源进行大模型研发。在这场激烈竞争中,梁文峰看到了人工智能领域的巨大潜力和无限可能,他毅然决然地做出重大决定——成立 DeepSeek,全力进军AI大模型研究开发领域,致力于通用人工智能(AGI)的探索。
在团队组建方面,梁文峰展现出独特眼光和魄力。他没有像其他公司那样执着于聘请具有丰富AI技术经验的老将,而是将目光投向充满朝气和潜力的年轻人。他认为,年轻人思维活跃,富有创新精神,没有被传统思维模式束缚,更有可能在AI领域取得突破性进展。
于是,一群来自清华、北大、北航等中国顶尖高校的应届毕业生、在读生以及毕业才几年的年轻人,汇聚在DeepSeek。他们有的在国际大学生程序设计竞赛中屡获金奖,有的在顶尖学术会议上发表过高水平论文……虽然他们缺乏实际工作经验,但对研究充满热情和好奇心,拥有扎实的专业知识和强大的学习能力。随便举一例,DeepSeek核心成员赵成钢,曾是衡水中学信息学竞赛班成员,获得CCFNOI2016银牌,后进入清华大学,三次获得世界大学生超算竞赛冠军!
在DeepSeek,团队采用扁平化管理模式,淡化职级,鼓励员工自由交流与合作。在这里,没有严格的上下级之分,每个人都能根据自己的兴趣和专长,自由加入不同的研究小组。这种管理模式极大地激发了员工的积极性和创造力,让他们能够充分发挥自己的才能。
在梁文峰心中,AI不应是少数人手中的“奢侈品”,而应是普惠大众的“工具”,让每个人都能从中受益。他深知,开源文化是实现这一目标的关键。通过将 DeepSeek的模型开源,他希望打破技术壁垒,让更多开发者和企业能够基于开源模型进行创新和应用开发。
正如Linux操作系统的开源催生了无数基于它的软件和应用,推动了整个计算机行业的发展。DeepSeek的模型开源也吸引了全球开发者的关注和参与。他们在DeepSeek模型的基础上,开发出各种各样的应用,从智能客服到智能写作,从图像识别到数据分析,涵盖各个领域。这些应用不仅丰富了AI的应用场景,也让更多人体验到了AI的魅力。
同时,梁文峰还致力于降低AI的使用成本。他通过技术创新,不断优化模型的性能和效率,使得DeepSeek 的模型在保持高性能的同时,推理成本大幅降低。这使得中小企业和个人开发者也能够负担得起AI技术的使用,为AI的普及和应用提供了更广阔的空间。
Scale AI创始人兼CEO Alexandr Wang在一个节目表示:中美之间在AI领域的竞争至关重要,被认为是当今最重要的议题之一,并且中国的AI能力正在迅速赶超美国,在某些方面甚至可以与美国顶尖模型相媲美,这出乎许多人的意料。Scale AI 发布了名为 “Humanity's last exam” 的AI模型评估基准,该基准由数学、物理、生物、化学等领域的教授设计,旨在测试AI模型的极限能力,中国AI实验室DeepSeek 开发的模型在该基准测试中表现出色,与美国的顶尖模型 (如 ChatGPT o1 ) 性能相当。虽然Alexandr Wang长着一副中国人面孔,但他在社交平台上发帖表示,DeepSeek为美国敲响了警钟。他建议“美国加强芯片出口管制”。尽管他可能是真心在跪舔美国,但他这样的言行在社交媒体上反倒让美国人的鄙视。
可以这么认为,幻方量化和DeepSeek,是中国市场经济环境下的一个产物——这也是为什么说DeepSeek的在全球AI领域的异军突起,既是偶然,也是必然。未来DeepSeek能否继续给世界带来更大的震撼?想必已有很多人在期待……