对美帝,一次外科手术般精准的打击

时事   2025-02-02 11:03   北京  

近期随着DeepSeek R1的发布,中国AI在世界上掀起了一阵热潮。

随着国外AI行业对DeepSeek的认识愈发深入,这阵热潮在世界上有着愈演愈烈之势。

DeepSeek以极其低廉的训练成本以及开源的部署方式得到了世界AI产业界的极高评价,并被认为是AI发展道路上的“规则改编者”(Game Changer)。

截止至2月1日,国际上在AI领域领先的大厂几乎都已经部署DeepSeek R1模型,包括但不限于:

1)英伟达(NVIDIA)宣布,DeepSeek-R1正式登陆NVIDIA NIM平台。

2)微软(Microsoft)把DeepSeek R1部署到了自家的云服务Azure上以及Github中,并且宣布在Windows的Copilot中集成DeepSeek R1。

3)亚马逊(Amazon)已经在Amazon Bedrock 和 SageMaker AI 中上架 DeepSeek-R1 模型。

4)世界上最大的AI搜索引擎公司Perplexity已经把DeepSeek R1集成进自己的搜索平台。

5)AMD把DeepSeek V3集成到了Instinct MI300X GPU上。

尽管美国众多公司对DeepSeek颇有微词,但却纷纷口嫌体正直地以最快的速度把DeepSeek集成进入自家的平台。

原因很简单,免费的太香了。

不仅仅是大公司这么想,很多国外原先订阅Open AI o1模型的用户也这么想,于是这两天出现了大规模退订OpenAI的风潮。

要知道,OpenAI o1原先是200美元/月,而DeepSeek R1直接免费,效能和Open AI o1又不相上下、甚至在某些领域有所超出,直接让很多原先付费订阅Open AI o1的用户直接投入DeepSeek的怀抱。

而Open AI反应迅速,立即将最新的o3-mini版免费发布,作为对DeepSeek R1的对冲。


1.规则改变者

之所以DeepSeek能成为规则改变者原因很简单,就是因为它能以极低的训练和部署成本改变了整个AI业态的发展道路,为大家提供了摆脱臣服于美国AI霸权的路径。

这里先要提一下在DeepSeek出现之前,美国对AI霸权的预设发展路径,就是天价的硬件和人才投入。

AI大模型训练在DeepSeek出道之前,是一个需要天价投入的领域。

比如OpenAI o1,大概用了上万张英伟达H100的GPU,整体训练成本约为10亿美元。

而DeepSeek V3的训练成本,根据官方数据,使用了2048张阉割过的H800 GPU,总体成本为500万~600万美元。

二者的训练成本相差2个数量级,这就代表了DeepSeek的大模型可以在更多行业领域得到应用。而OpenAI的模型,仅仅是体量巨大的企业的玩物。

甚至现在有人开始在个人电脑上用游戏级显卡GPU,就能部署DeepSeek的大模型。

在这里我们需要明确两个概念:训练和部署

训练就是让AI围绕自己的需求建立模型,训练出的AI能够更加符合自己需要的应用场景。训练需要强大的算力,上面说到的o1的训练成本是上万个英伟达H100的GPU、整个成本约为10亿美元,就是说的训练的成本。

大规模训练成本降低两个数量级,意味着只要是大一些的企业,都可以用DeepSeek的开源版本去训练自己的专有模型、得到更加符合自己使用需求的AI。

部署就是让训练过的AI(你可以使用别人训练的模型)能够在自己搭建的环境下运行起来。而在个人电脑上就能脱离网络部署使用自己的AI,则说明AI的普及程度可以大大提高。

为什么美国对DeepSeek这么警惕,就是因为如果大家都联网使用DeepSeek,那么用户数据就可能被服务提供方收集,造成敏感资料的外泄。

如果DeepSeek能够部署在脱离联网的个人电脑上,那么也就消除了这个问题。

这也是为什么DeepSeek能够在个人电脑上部署如此重要的原因之一,因为这样美国就无法拿DeepSeek联网使用窃取用户数据说事了。

这是一个星星之火可以燎原的过程,只有极低的训练和部署成本,才能带动AI在全社会应用普及。

DeepSeek给全球用户带来的想象力就是:

第一可以以极其低廉的成本训练和部署私有AI,这是从来没想过的;

第二这个AI可以和OpenAI投入天价巨资开发的AI相媲美,这也是从来没想过的;

第三可以有一个脱离了美国控制的AI,这还是从来没想过的。

基于这三点,全球用户发现美国对AI的天价叙事崩塌了。

原来这么低的成本就能获得和OpenAI产品媲美、甚至超越的AI产品???那还要什么自行车……


2.DeepSeek的根本冲击

DeepSeek给美国AI霸权带去的根本性冲击,并不是DeepSeek比OpenAI能赚钱,而是DeepSeek让OpenAI赚不了钱。

美国最牛逼的能力就是画饼,而AI就是给美国股市画的一个香喷喷的大饼。

AI这个香喷喷的大饼,起码可以支持起未来10年美国股市的繁荣。而美国股市的繁荣,则可以掩盖美国国内的大部分矛盾、冲突与分裂。

以上就是为什么美国要画AI这个大饼的根本逻辑,不是能促进生产力发展,也不是能够赚大钱,而是AI概念支撑起了美国股市的繁荣。

股市的繁荣又能够反哺美国企业获得天量资金从而取得全球竞争的优势。

可以说美国股市只要能够一直繁荣,美国就能够通过货币周期一直全球吸血,从而长久维系美国霸权。

美国股市就是美国的全球吸血池,金融是美国全球霸权的根本。

我们必须认识到,AI争霸并不仅仅是在AI领域竞争,而是牵扯到了美国全球霸权的维系。

简而言之,AI和算力就是新时代的石油资源。

AI和算力霸权能够让资本能够源源不断的流入美国,从而撑起了美国金融市场未来10年的繁荣。

为什么OpenAI能获得如此多的估值和投资,为什么川普要投入5000亿美元支持美国的AI发展,就是因为大家都觉得AI可能是下一次工业革命的领导者。

而谁能夺取AI到AGI(简而言之就是通用的超越人类智慧的人工智能)的桂冠,谁就能取得下一次工业革命的领导权。

而取得了工业革命的领导权,则站在了人类文明之巅,可以名正言顺的攫取巨量的财富。

这就是为什么美国需要天价投入以OpenAI为首AI产业的根本原因——夺取第四次工业革命桂冠,从而能够长久维系美国霸权。

但整个逻辑有个弱点,就是OpenAI要一直获得投资的基础就是,人们觉得OpenAI未来可以占领AI的制高点、可以赚大钱。

而目前OpenAI一直是亏本的买卖,哪怕200美元/月的高昂订阅费用,也无法让OpenAI走出亏本的泥潭。

原先OpenAI预计2029年可以盈利,但是在DeepSeek以和OpenAI相当的水平且免费开源的狙击下,这一目标成为了泡影。

并且DeepSeek给全世界带来一个全新的实现AI甚至AGI的路线,这条路线与美国进行天价投资的AI路线叙事是不同的,这不禁让全球资本开始怀疑,AI是否需要这么巨大的投资?

最直接的表现就是,高盛1月24日的报告指出,随着DeepSeek崛起、并挑战美国在AI领域的主导地位,避险基金已在观望美国国内扶植的AI热潮是否还会持续。

DeepSeek所带来的冲击,很可能是美国股市崩塌的多米诺骨牌的第一张。

如果全球资本对AI领导者美国采取观望态度,那川普所吹嘘的投资5000亿美元的AI计划“星际之门”很可能会成为一个虎头蛇尾的把戏。

如果OpenAI不能有效降低其成本、从而跟DeepSeek进行刺刀见红的竞争,那么美国很可能会丢失AI霸权的宝座。

一旦美国丢失了AI霸权宝座,那么资本市场的反应将是残酷的。

以AI概念为首的美国科技股会整体下行,从而带动整个美国资本市场下行。

美国资本市场一旦失去了AI霸权这个锚点,来自全球市场的惊涛骇浪将会掀翻美国金融的航船。

一旦美国金融航船被掀翻,那么美国将丧失通过金融从全球吸血的能力,从而造成美国全球霸权的崩塌。

所以,DeepSeek狙击OpenAI赚钱,就是蝴蝶效应的第一步。

这一步,开启了我们打击美国资本市场的先河。

我一向认为,DeepSeek选择川普发布5000亿AI投资的“星际之门”计划之时发布开源的DeepSeek R1,是对美国金融市场的一次外科手术般精准的打击。也吹响了我们掀翻美国全球霸权的号角。


3.DeepSeek的后劲

DeepSeek最大的后劲来源于两个方面,一方面是低成本和开源,另一方面是国产GPU替代。

低价意味着不用投入太多资金,就可以训练适合于自己需求的AI,这对AI的商业化普及拥有决定性的意义。

而开源则意味着人人都可以部署AI,这对DeepSeek的生态发展拥有决定性的意义。

在低价和开源的加持下,DeepSeek将以极快的速度扩张自己的生态圈,从而在短期内形成一个强大的DeepSeek生态,从而可以于OpenAI在更加广泛的领域开展竞争。

这也是为什么很多用户把OpenAI戏称为CloseAI的原因,就是因为OpenAI已经背离了开源的初衷,以成本和技术构筑高墙阻碍竞争对手的AI发展。

而DeepSeek倡导的则是开源、分享和共同推动AI进步,与OpenAI的格局高下立判。

也只有开源并且效能与OpenAI最新产品相当的DeepSeek才能够引导全球AI的发展,毕竟开源的,才是世界的。

就在今天,川普和黄仁勋会面后传出消息,将要扩大对中国高算力GPU的禁运范围。

很多朋友觉得目前DeepSeek的训练还是基于英伟达的H800 GPU,如果美国对中国扩大封锁高算力GPU,那DeepSeek是不是就发展不下去了?

经过这两天的集中研究,我觉得这是多虑的。

原因很简单,DeepSeek不仅仅是基于英伟达的平台开发,而是绕开了英伟达的通用开发平台CUDA,直接使用PTX对英伟达硬件底层进行操作。

这意味着,DeepSeek的团队没有将整个AI构建于英伟达独有的CUDA平台之上,而是拥有了直接对硬件进行编程的能力。

绝大多数的AI的开发,建立在英伟达的CUDA平台之上。这样做的好处,就是当英伟达升级GPU产品后,只要该产品支持CUDA,就不用再针对新硬件进行专门开发,这样能够提高AI的通用性、降低开发成本。

而直接针对硬件底层编程,可以绕开CUDA对程序的转译、提高AI的运行效率,缺点就是一旦使用不同平台的GPU,就要针对这个GPU再重写一遍程序,升级成本高、平台通用性差。

而DeepSeek团队选择一部分绕开CUDA、直接对硬件底层进行编程,一定考虑到了美国可能扩大封锁范围的因素。

一旦英伟达平台不能使用,那么转移到其它GPU平台上进行训练则势在必行。

拥有了对硬件底层编程的能力,可以在多平台之间进行迁移,并且针对不同的硬件平台进行专门的优化。

简单说来,就是一旦不能使用英伟达平台,那么无论是切换到AMD的GPU,还是切换到国产的GPU,DeepSeek都能游刃有余进行切换。

而且针对不同的硬件平台,也可以通过硬件底层的编程实现专门的优化,从而达到软硬件配合获得最高的效能。

我相信DeepSeek现在一定和国产GPU厂商有合作,正在稳步推进国产GPU对国外GPU产品的替代。

很多朋友又会问,英伟达现在GPU算力绝对领先,而国产GPU刚刚起步,最好的产品可能才接近英伟达上一代产品的算力,这个如何破解?

其实也不难,OpenAI可以堆算力,我们也可以堆算力。


4.综合成本的竞争

我们先看一下另外一个领域,就是中国两台扛把子的超级计算机——神威·海洋之光和天河三号。

这两台超算均属于 E级超算(Exascale,百亿亿次计算),性能均超过 1 ExaFLOP/s,与美国最新的Frontier超算(1.1 ExaFLOP/s)性能相当。

这两台超算,均通过定制化互连技术将通信延迟降至纳秒级,确保大规模芯片协同时的效率。

其中神威·海洋之光实现了千万核心级的并行计算,而天河三号则实现了十万级节点协同。

这两者的共同特点,通俗化理解,就是我们可以通过众多核心或节点协同一起堆算力。

不要小瞧了这个堆算力的能力,目前能够实现大规模堆算力的也只有中美两国。

所以,哪怕是我们的GPU产品落后一些,我们也可以通过对算力去实现与美国差不多的算力。

有人又会问了,既然中美都能堆算力,而美国的单个GPU更加先进,我们如何赢得美国?

这就要跳出单纯的硬件竞争思维。

第一,美国堆算力需要考虑资本市场的反应。

很简单,双方如果不计成本的堆算力,那么我们可能会位于劣势的地位。但美国显然不可能不计成本去堆算力。

别忘了,美国的AI霸权需要在资本市场上把故事说圆了。如果不计成本的堆算力,美国固然可能赢,但资本市场会因为高昂的成本、微薄甚至没有产出而选择不继续投资。

永远记住,美国的AI霸权是建立在资本市场买账的基础上,它的终极目的是为美国的金融霸权服务。

这也是对美国不计成本堆算力的最大的束缚——不能画赚钱大饼的,终会被资本抛弃。

第二,不是堆算力就能够获得最佳性能。

AI技术的推进并不仅仅通过堆算力实现,如果通过堆算力就能获得AI技术霸权,那么美国早通过堆算力实现了AGI。

事实上随着硬件算力的增加,AI的水平并不是相应的增加。越往后发展,AI的算法优化才是AI效率增长的大头。

在这里我们需要注意,就是AI的算力≠AI的效率DeepSeek和OpenAI的对比就是最佳的例子。

DeepSeek通过1/20的算力成本,实现了和OpenAI相同的效率。这就是对硬件底层进行匹配优化、以及拥有更先进算法的威力。

因此我们有理由相信,DeepSeek敢于开源、让别人了解自己技术细节,就一定有更厉害的技术还没有展示出来。

如果DeepSeek拥有领先优势巨大的算法,那么美国哪怕通过极限堆硬件算力,也无法达到DeepSeek的效率水平。

第三,我们不计较一城一池的得失。

最简单的例子,就是中国的高铁。

中国的高铁网络从无到有遍布全国,虽然到目前大部分高铁线路并没有盈利,但这不代表我们要抛弃高铁。

因为我们对利益的估算一向是系统性思维。

高铁虽然不赚钱、甚至亏本,但高铁所带来的区域之间的连接、对人流、物流、资金流促进作用所带来的收益,远远要高于高铁建设和运营的成本。

我们更加看重的是AI给系统带来的整体损益,而不是在资本市场单一的收益。

这是由我们社会主义的制度所决定的,无论是AI还是高铁,一切都是为了全国统一大市场服务。

而在美国,AI仅仅是资本的敛财工具和玩物,根本没有形成全国统一大市场的可能。

在这种情况下,资本更看重的是AI画大饼的能力,而不是AI真正的对生产力的促进。

美国需要千方百计保证AI这张大饼能画得好画得圆,至于其它,都是次要的。

退一步说,在制造业空心化的美国,哪怕能够率先实现AGI,但它的应用场景是什么?

只有在拥有全球最佳生产力的中国,AI才有巨大的应用场景。AI在中国的应用可以极大推动生产力的发展。

而只有生产力在AI加持下极大发展,才是达成第四次工业革命的最基本条件。

缺少了代表全球工厂的全球最佳生产力的应用土壤,AI将成为无源之水无本之木。

这也是为什么AI在美国只能是资本市场的玩物、而无法推动生产力发展的原因。


5.DeepSeek的长期任务

最后,DeepSeek的任务非常清晰。

第一,狙击美国AI霸权发展,树立国际威望和信心。

通过低成本和开源打破美国对AI发展需要天价投入的叙事,提高美国AI在资本市场的融资成本、降低美国AI在资本市场的融资能力。

只有打破美国对AI发展画的大饼,才能有效地应对美国的科技战和金融战。

因为AI产业作为美国股市未来10年的重要锚点之一,是美国高科技产业发展和吸引产业回流的重中之重。

AI也是中美竞争的最重要指标性产业之一。

只有在AI产业能够抵挡住美国封锁、并且在美国封锁之下和美国杀得有来有回,才能够在国际社会树立起中国的威望和他国对中国的信心。

第二,在世界范围内打破美国AI霸权的垄断,为世界AI发展提供一条摆脱美国AI霸权的路径。

中国的替代路径是一条开放的、共享的、极大降低训练和部署成本的路径,而不是像OpenAI那样是一条封闭的、独有的、成本高昂的路径。

虽说AI竞争是科技竞争的最前沿,但DeepSeek用小米加步枪追赶上了飞机加大炮的美国,是教员农村包围城市路线的经典复现。

坚持教员的道路,星星之火可以燎原,DeepSeek可以击败美国的AI霸权。

第三,就是在中国范围内极大提高生产力。

中国拥有丰富的AI应用场景,这是绝大多数国家所不具备的。极大促进世界生产力的发展的基础,就是拥有着独步全球的生产力。

放眼全球,只有中国拥有联合国分类中所有门类最齐全的工业部门,因此只有中国能够把AI最有效地结合从而促进生产力的整体发展。

而中国的生产力发展的最主要目的并不是为了垄断资本服务,而是为全球国家提供物美价廉的工业产品,从而提高全球人民的生活质量,这也是中国AI促进生产力发展的伟大使命之一。


目前看来,DeepSeek已经完成了初步的任务,有效地阻击了美国AI在资本市场的吸金能力。

并且能够在敌人的包围下杀入敌人内部(英伟达、微软、亚马逊、AMD等纷纷接入DeepSeek大模型),起到了分化敌人的目的。

接下来,DeepSeek需要和国产硬件厂商一起,优化算法和国产硬件的匹配,形成对美国算力平台的替代方案。

只有形成我们完整的软硬件解决方案,才能够真正实现对美国AI平台的替代路径,才能够真正的在国际上实现对美国AI霸权的阻击。

我们的根本优势有三点:

第一,我们拥有一个开源的、成本低廉的且能够达到世界最先进水平的DeepSeek,这是AI长久发展的优势基因。

第二,我们拥有全世界最庞大的理工类毕业生,在人才方面我们拥有源源不断的供应,这是AI长久发展的必要营养。

第三,我们拥有世界上最齐全的工业生产部门,拥有世界最强的工业生产力,这是AI长久发展的必要土壤。

只要一步一个脚印稳步发展,我们必将击败美国占上世界AI之巅!

星火下南洋
星火在手,天下我有
 最新文章