国产AI模型DeepSeek R1震动美国科技界，创始人梁文峰成为英雄

文摘 2025-01-25 20:37 四川

如果在AI大模型领域突然出现了一个足以挑战ChatGPT或者赶超ChatGPT的竞争者，而且这个竞争者还将先进/强大的AI（推理）模型开源；那么可能就会对ChatGPT的付费商业模式带来强烈的冲击——比如说，站在普通用户的角度来想，既然可以用更低的成本或者接近零成本使用到几乎同等强大的AI模型，那自然就没有理由花更多的钱使用ChatGPT（及其API）。OpenAI的ChatGPT因为有着全球领先的AI大模型如GPT-4o、o1以及即将上线的o3等，在市场上占得了先机——目前，ChatGPT的月度活跃用户超过3亿，付费订阅用户超过1千万；同时可以很确定的是，OpenAI希望可以借助闭源AI模型在技术上领先的优势继续发展更多的付费用户。

被一些人称为“神秘东方力量”的DeepSeek，最近在AI领域里连续投下两个重磅炸弹，先是推出了DeepSeek V3模型，后又推出了DeepSeek R1推理模型。DeepSeek V3的表现几乎追上了Anthropic Claude 3.5 Sonnet和OpenAI GPT-4o，而DeepSeek R1的表现实在太过惊艳，已经可以与OpenAI的推理模型o1相提并论。网上也流传，DeepSeek 正在开发更强大的推理模型DeepSeek R2。

有一个ChatGPT Pro付费用户@Leo Xiang就这样发帖说：“在Deepseek R1之前，OpenAI的o1还是领先中国的大模型厂商一代，Deepseek R1出来之后已经不存在代际差了。OpenAI如何说服大家购买他的200美元/月的ChatGPT Pro？”随后，他又补充道：“我也用ChatGPT Pro，也体验了DeepSeek R1, ChatGPT o1目前还是最强的存在；DeepSeek系列模型的提升速度让人刮目相看，我会时不时地体验一下DeepSeek的模型，感受一下它的进步。”

根据外媒最新报道称，由对冲基金经理梁文峰创立的DeepSeek，在本周一发布了推理模型 DeepSeek R1，并且通过一篇论文做了详尽的阐述。美国公司如OpenAI和Google DeepMind等在推理模型领域开辟了先河，这一相对较新的AI研究领域旨在让AI模型具备类似人类认知的能力。2024年12月，OpenAI才正式发布完整的o1推理模型。DeepSeek R1的发布引发了硅谷科技界关于美国AI公司（如Meta和Anthropic等）能否保持技术领先地位的激烈讨论。与此同时，在中美高科技激烈竞争博弈的当下，梁文峰也成为了备受瞩目的民族英雄。

2021年，梁文峰在运营量化交易基金幻方的期间，开始购买数千块英伟达图形处理单元（GPU芯片）用于AI研发。业界当时认为这不过是亿万富翁的新兴趣爱好。“最初见到他时，他是个书呆子模样，发型很糟糕，总是谈论用1万块芯片搭建集群训练模型。我们当时没把他当回事，”一位商业伙伴回忆道，“他无法清晰描述自己的愿景，只是说：‘我要做这个，它会改变游戏规则。’我们认为只有像字节跳动、阿里巴巴这样的巨头才可能做到。”

然而，梁文峰在AI领域的“外行”身份反而成为了一种意外的优势。在幻方，他通过AI和算法分析影响股价的模式积累了财富。他的团队熟练使用英伟达芯片进行交易。2023年，他创立了DeepSeek，宣布进军类人智能研发。“梁文峰带领着一支对芯片工作原理有深入了解的优秀团队，”一家竞争公司创始人表示，“他从对冲基金将最优秀的人才带入了DeepSeek。”

在美国禁止英伟达向中国出口高尖端AI GPU芯片之后，中国AI公司被迫创新，以最大化利用有限的本土芯片计算能力，而梁文峰的团队早已掌握了解决之道。“DeepSeek的工程师们能够挖掘GPU的潜力，即使它们并非最新的型号，”一位接近公司的AI研究员表示。

正因为DeepSeek对研究的专注，让自己在全球AI领域成为了一个实力强劲的竞争者。DeepSeek倾向于分享技术上的突破，而非将AI用于谋取商业利益。迄今为止，DeepSeek没有接受外部融资，也没有大规模商业化AI模型。梁文峰自己曾说过：“我们面临的问题从来不是钱，而是高端芯片被禁运。”当然，他也说过这样的话：“我们只是按照自己的步调来做事，然后核算成本定价，我们的原则是不赔钱，也不赚取暴利。”DeepSeek所需的资金主要由幻方量化提供支持。幻方量化在2024年的投资回报率不尽如人意，据说是与梁文峰将大部分精力放在DeepSeek有关。

梁文峰将DeepSeek定位为一家纯粹“本土化”的公司，DeepSeek核心团队成员来自北京大学、清华大学和北京航空航天大学等中国顶尖名校，而非拥有海外背景的专家。他曾表示：“我们的核心团队没有海外归来的人才。他们都是本土的……我们必须自己培养顶尖人才。”在人才层面，DeepSeek确实走了一条不同的路——这种纯粹中国化的身份定位在国内赢得了广泛赞誉。

DeepSeek仅用了2048张英伟达H800 GPU芯片和560万美元训练出了一个拥有6710亿参数的模型。而OpenAI和Google为训练出类似规模的模型，所投入的资源远远超过了这一水平。尽管DeepSeek在资源有限的情况之下获得了令人印象深刻的成果，然热业界人士仍认为，随着行业不断演变，DeepSeek未来在AI领域的竞争力尚待观察。与此同时，美国的竞争对手们并未止步不前。举例来说，OpenAI日前宣布了资金规模高达5000亿美元的“Stargate（星际之门）”计划——在美国AI基础设施领域投资；埃隆·马斯克的xAI也在扩展超级计算机Colossus，计划搭载超过100万块先进的GPU芯片，用于训练Grok AI模型；等等。“DeepSeek在中国拥有最大规模的高级计算集群之一，”梁文峰的商业伙伴称，“目前他们的计算能力尚足够，但这种优势不会持续太久。”

前面写道，OpenAI在2024年12月才正式面向用户发布上线完整的o1推理模型。换言之，DeepSeek R1推理模型的发布也就只比o1完整版推理模型晚了大约一个月而已。在海外社交平台上，最近几天关于DeepSeek及其推理模型R1的讨论，热度颇高，相关的贴文、评论等有很多很多。有的外国网友戏谑：DeepSeek才是OpenAI（开源AI），OpenAI是Closed AI（闭源AI）。

日前在匿名职场社区teamblind上，一位Meta公司员工发布的匿名贴子特别火——《Meta genai org in panic mode》，该贴子的中文意思是：

Meta的生成式AI团队陷入了恐慌状态。

这一切的开端是DeepSeek V3的推出，这让Llama 4在各项基准测试中全面落后。更让人雪上加霜的是，一家“未知的中国公司”用仅550万美元的预算完成了训练，直接打脸了现有的大型模型。

目前，工程师们正在疯狂拆解DeepSeek，试图复制其中的一切。我不是在夸张，事情就是这么紧迫。

管理层也在焦虑如何为生成式AI团队的高昂成本向高层交代。尤其是，当团队中每一位所谓的“领导者”拿到的薪水都远远超过了训练整个DeepSeek V3的成本，而这样的“领导者”团队却有数十人之多。

DeepSeek R1的出现让事情变得更加可怕。虽然有些信息还不能透露，但很快就会公开，到时候情况可能更加不利。

本来，这个团队应该是一个以工程为核心的小型组织，但因为一些人想借机刷存在感、抢占资源，人为地扩大了团队规模，结果反而让大家都成了输家。

就以今天的数据为例，在苹果App Store上的效率类应用排名榜上，在中国大陆地区，DeepSeek已经位居第2，直追第1名的豆包；在中国香港特区，DeepSeek位居第1，豆包降为第2名；在美国，DeepSeek排名第3，超过了第4名的谷歌Gemini，而第1名则是ChatGPT。在苹果App Store免费总榜排名上，在中国大陆地区，DeepSeek排名第24，豆包排名第2；在美国，DeepSeek排名第14，ChatGPT排名第1。可以这么说，DeepSeek在没有主动砸钱做营销推广的情况下，却在包括中国、美国等国内外地区开始“出圈”了。

我为科技狂Tech

专注于科技资讯解析分享

最新文章

OpenAI与DeepSeek颠覆对决升级，o3-mini紧急上线救场！

震撼全球的中国AI公司DeepSeek到底投了多少钱、买了多少芯片？Semianalysis发长文揭秘

史无前例！国产AI模型DeepSeek狂扫全球，OpenAI已经慌了？

苹果正与SpaceX开展合作，iPhone手机将支持自动连接星链卫星网络

带领DeepSeek强势崛起为AI界“中国骄傲”，创始人梁文峰的传奇人生超乎想象

灵魂人物赵明离职，李健接替CEO，荣耀“成也华为、败也华为”？

国产AI模型DeepSeek R1震动美国科技界，创始人梁文峰成为英雄

英伟达稳坐中国GPU市场王座，华为做出了重大AI芯片策略转向

特朗普为TikTok量身定做的拯救方案，字节跳动会接受吗？

SpaceX星舰第七飞惨遭爆炸，2025年高频发射计划要泡汤？

特朗普正在瞄准最后努力挽救TikTok，CEO周受资将成座上宾

SpaceX向用户推出超便宜星链上网套餐，每月资费不到70元人民币

TikTok计划完全关闭美国业务，但中国版抖音似乎有了出人意料的新变化

ChatGPT再放大招！“Tasks”功能降临，AI管家的时代来临了？

字节跳动将TikTok美国业务卖给伊隆·马斯克？事情没那么简单

拟全面禁止向中国出售GPU？拜登芯片新规引发美国科技产业界震动

荷兰ASML执行长访台 “搞大事”：急催台积电购买天价EUV光刻机

张一鸣赌对了，字节跳动豆包AI用户流量持续疯涨，在国内已无对手？

相当震撼：英伟达黄仁勋CES 2025最新演讲全文

倒计时：SpaceX星舰第七飞，将首次在太空中部署有效载荷！

中国手机市场风云变幻：华为引发内卷新态势，苹果遭受冲击

特斯拉电动车销量遇冷，中国消费者救场，自动驾驶成破局关键？

很意外，英伟达性能降级版AI芯片H20在中国市场成了“香饽饽”

SpaceX在2024年创造了商业航天新纪录，真正意义上的“遥遥领先”

美国航空巨头波音公司已无药可救？

百度在中国搜索市场老大地位不保，微软必应已成功拿下50%以上份额

总统特朗普以三重身份提出主张，救字节跳动TikTok于危局

名不见经传的AI大模型DeepSeek，却为中国科技争了光

对中国芯片展开301调查，美国意欲何为？

程序员职业危矣？

颠覆性AI模型o3登场，解答编程、数学和科学问题能力强到恐怖

百度遗憾出局，苹果将联手腾讯和字节跳动打造AI iPhone？

字节跳动TikTok在美国‘是走是留’？或许谜底很快就将揭晓

先进芯片代工市场上已无对手，台积电2025年吃到饱，营收大增2成无悬念

不被完全信任？传马斯克没有权限接触SpaceX公司最大的政府机密

SpaceX申请将德州星舰基地升级为城市，为人类打造星际之门

市场监管总局对英伟达立案调查，一位反垄断案亲历者详细说出前因后果

仅一年，SpaceX估值翻倍至3500亿美元，马斯克是如何创造商业航天奇迹的？

OpenAI的视频生成模型Sora今天终于震撼登场，到底有多强大？

谷歌量子计算芯片Willow面世：5分钟完成“10000000000000000000000000”年计算！

张一鸣亲自督战，字节跳动全力押注AI，豆包已成为ChatGPT的最强挑战者？

字节跳动TikTok或将退出美国市场？命运仍充满不确定性

OpenAI发布地球上最强AI模型o1 Pro，新增200美元/月豪华档订阅套餐！

特朗普任命‘太空商人’艾萨克曼执掌NASA，背后有何深意？

最后翻盘的机会？传英特尔将打破传统寻找新的首席执行官

市场最新预期：SpaceX估值3500亿美元

SpaceX星舰第六次试飞，虽然算不上完全成功，但依然令人震撼

一出大戏：前首富钟睒睒要求新首富张一鸣道歉

SpaceX总裁：未来四年可能发射400次星舰，星链将升级为千兆网速

特朗普成功当选美国总统的背后，马斯克将获得哪些好处？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉