起底DeepSeek的老板梁文锋

财富   2025-01-30 09:58   北京  

梁文锋的故事,就是「小镇做题家」的逆袭版。

他出生在广东湛江的一个五线小城市吴川,17岁就考进了浙江大学,2010年硕士毕业,专业是信息与通信工程,还不是计算机。

其具体的童年成长轨迹已不可考,从公开信息唯一可知的是,梁文锋有在采访中提到过自己的父亲是一名小学老师。

《南方日报》报道,梁文锋从小成绩优异,小学六年级时他就通过考试被吴川一中录用,在吴川一中完成了初中、高中学业。

梁一直是学校里的「尖子生」,并在数学学科表现出极大天赋,初中时期就学完了高中数学,甚至开始学大学的数学。

梁文锋的容姓初中男班主任说:「他初中就学完高中的数学,甚至已经开始学大学的数学,数学思维能力很强。」

容姓班主任也称,初中时期的梁文锋性格很文静,但不是书呆子,他在学习上很有自己的一套方法,很注重劳逸结合,仿佛不需要花很多时间来学习就可以学好每一个学科。

大学毕业后,他直接带着团队搞起了全自动量化交易,用机器学习这种的技术(彼时还不是深度学习)。

2010年,他和浙大的校友一起创立了雅克比投资,年仅25岁。

据传,2008年到2014年梁在家炒股,量化打板策略为主。期间从8w本金做到5个小目标。

2015年,30岁的他和一个「股东出轨女下属」的徐进联合创办了杭州幻方科技。

他们靠数学和人工智能搞量化投资,立志要成为世界顶级的量化对冲基金。

2018年,幻方量化首次获内地私募证券领域最高奖项「私募金牛奖」,并确立以AI为发展方向。

结果还真牛,到2021年,幻方量化管理的规模突破了1000亿元。

2018年,幻方量化首次获内地私募证券领域最高奖项「私募金牛奖」,并确立以AI为发展方向。2023年DeepSeek正式成立,因训练成本极低而被称为「AI界的拼多多」。

这一年,梁文锋又开始找「副业」,买了几千张英伟达的GPU显卡,开始发力AI技术。

不过到了2023年,幻方量化的规模降到400多亿。

2023年DeepSeek正式成立,因训练成本极低而被称为「AI界的拼多多」。

2023年初,幻方量化还吹牛说有1万张英伟达A100 GPU卡,结果被拆穿,他们其实只有几千张A100卡,其他的都是消费卡、老款显卡,甚至还有租用的。

这事儿被业内人士看作是亿万富翁找新爱好时的「古怪行为」

DeepSeek的热度很大程度上是因为国内媒体吹捧中国大模型企业超越美国。

但说实话,DeepSeek的技术并没有那么牛。

第一版的时候很粗糙,大量用GPT的开源数据,甚至调用过GPT-3.5的API接口。

现在虽然被媒体捧成「AI界的拼多多」,但其实它只是AI infra技术和团队厉害。

媒体拿它一个模型就说中国AI超越美国,这逻辑太牵强了。

DeepSeek只是AI技术迭代的受益者,但并不意味着它能超越OpenAI这些领先企业。

DeepSeek的案例也说明,AI技术没有明显的「护城河」,模型技术的超越已经很常见了。

现在AI大模型的竞争,关键在于算力规模的增长和长期的模型迭代。

DeepSeek现在不融资,短期内也不打算上市,现金流很充裕。

他们用这些钱招了一大堆AI研究人才,搞了个「研究院」氛围,只搞前沿研究,不操心商业变现。

虽然团队很懂基础设施和芯片原理,但他们更专注于技术本身。

梁文锋还从对冲基金行业挖走了最牛的团队,加入了DeepSeek。

此外,DS的核心成员也曝光了,并不都是清北,甚至都没有多少海归,也不全是博士。比如最近特别火的罗小姐,本科也不是清北本,也不是博士。
小米加步枪始终是我们的特色,以后也会是。

DeepSeek开源,这对小团队乃至个人来说是个天大的好消息——我们终于可以自己搭建大模型!

这对高端芯片市场,到底是好还是坏?其实挺微妙的。虽然市场会更分散,但蛋糕也更大了。那些囤积了很多高端芯片的大模型团队,反而暴露了自己的低效和无能。

而我们这些小团队和个人,则更容易被DeepSeek这样的开源项目淘汰。毕竟,技术门槛降低了,竞争只会更加激烈。

更要命的是,大模型的本地化部署下沉到小团队手里,对某些地区的诈骗团伙简直是天赐良机。

他们只需要手搓一个诈骗话术大模型,就能把这玩意儿调教得比真人还要智能、还要拟人,到时候受害者更难分辨,防不胜防!

未来我们每个人都要面对两个问题:一是如何在ChatGPT抢走饭碗之前找到新的生存之道;二是如何在大模型越来越像人的时代,不被它们欺骗。

毕竟这次的DeepSeek,比起之前的ChatGPT更像人了。以后出的大模型只会越来越像人,我们要做好准备,既要警惕被取代的风险,也要擦亮眼睛识别那些披着智能外衣的骗局。

Financial小伙伴
关注公号,加入小伙伴金融群-\x26gt;
 最新文章