美国芯片禁运倒逼中国AI创新:当所有门都关闭时,总会有人打破天花板

文摘   2025-01-27 15:31   辽宁  

不久前,拜登政府“火力全开”,端出了对中国的芯片“禁运大餐”。

英伟达、AMD这样的AI芯片被严防死守,生怕“美国的技术”落入竞争对手之手。

与此同时,美国工业和安全局(BIS)更是挥舞大棒,要从代工厂源头切断先进半导体给中国市场的供应链。

台积电、三星、英特尔……只要芯片超过300亿个晶体管、制程达14nm/16nm或更先进,就一律不准卖给中国。

说得更直白点:试图让美国及其盟友始终保持更强大的算力优势。

荷兰政府也紧跟步伐,把对光刻设备与检测设备的管控进一步收紧,阿斯麦(ASML)出口某些设备得先申请许可。

芯片禁运之外,美国还祭出了对闭源模型出口的限制。

这真的能阻挡中国AI的发展吗?

结果——人们刚准备等着看好戏,中国AI就抢先给了美国一个大大的“打脸时刻”。

一家仅一年前还几乎默默无闻的中国公司——DeepSeek,竟然一举在中美App Store双双登顶,超越了之前高高在上的ChatGPT,夺下下载量排行榜的头把交椅。

这一消息瞬间在科技圈刷屏。很多人惊呼:“美国政府的‘骚操作’,非但没阻止中国AI的崛起,反而倒逼了一批国产AI新星变得更具创造力。

外媒更是如临大敌地报道:中国的新AI模型正威胁着美国的主导地位。

透过现象看本质:技术封锁从来不是最终答案,只有不断创新,才能在AI的历史进程中占据一席之地。


美国的“芯片与AI双拳”组合

1月13日拜登政府发布最新的“全面规则”。

毕竟,为了确保美国牢牢把控AI与算力的优势,美国此前早就对中国高性能芯片和超级计算机设备做过好几轮封锁。

新上台的特朗普总统则是宣布了一个轰轰烈烈的“星际之门”计划,准备在未来4年砸下5000亿美元,号称重塑美国AI领导地位,由OpenAI、软银、甲骨文牵头,首期先拿出1000亿美金,先在得克萨斯州落地10座数据中心。

《纽约时报》甚至把这个项目形容成新的“曼哈顿计划”,因为“它不仅要打造巨大的计算与能源基础,还要催生出AGI”。

如此大手笔,放眼科技史都实属少见。

回想二战时的“曼哈顿计划”把人类第一次推向核时代,而如今美国要再造“AI时代的曼哈顿计划”,只为了在与中国的AI竞赛中依旧牢牢站在第一梯队。

特朗普也表示:“我们要做的,就是把它留在这个国家。中国是竞争对手,其他国家也是竞争对手。我们必须把关键设施建在美国本土。”

然而,这种在政策、资本、资源多管齐下的“围堵”与“抢跑”,真的能阻挡其他国家吗?

科学史屡次验证过,当一扇门被关上,总会有人去拆墙。


DeepSeek:一年前的无名之辈,今日的AI黑马

就在美国“封堵+加码”的双拳策略出台后,DeepSeek却突然脱颖而出。

他们的DeepSeek V2DeepSeek V3系列模型,最先让业界瞩目的是那些逆天般的创新:

MLA(多头潜在注意力):DeepSeek提出的MLA(Multi-Head Latent Attention,多头潜在注意力)就像给传统的注意力机制做了一个“瘦身”。MLA的核心思想是对“键”和“值”进行低秩压缩,就像把一个高分辨率的图片压缩成低分辨率的图片一样,虽然信息量有所减少,但仍然保留了主要的信息。
DeepSeek V3采用FP8混合精度训练框架。FP8训练的关键挑战在于低精度训练容易出现数值不稳定和精度下降的问题。为了解决这些问题,DeepSeek V3采用了精细的量化策略,例如使用分组量化来扩展FP8格式的动态范围,以及使用更高精度的累加过程来保证FP8 GEMM的精度12。
DeepSeek V3采用了超稀疏的MoE架构,用更形象的比喻来说:

•传统的稠密模型就像一个通才,什么都学一点,但可能不够精通。

•MoE模型就像一个由多个专家组成的团队,每个专家都有自己擅长的领域,可以更高效地解决问题。

•超稀疏MoE架构则像一个更大的专家团队,每个专家都非常专业,而且只有少数几个专家会在同一时间工作。


DeepSeek R1
DeepSeek R1 抛弃了传统方法。它采用了一种“完全无监督的RL训练”方法

没有人工标注数据: 没有给模型提供预先准备好的“标准答案”。

没有明确的奖励机制: 没有直接告诉模型“正确”的思考方式是什么。

直接在基础模型上进行强化学习(RL): 这就像让模型在一个“空白”的环境中进行学习。

更让人叹服的是,DeepSeek竟然完全开源

在OpenAI明令禁止用户“蒸馏”其闭源模型之时,DeepSeek直接鼓励大家用R1训练成果去做蒸馏,甚至提供相关教程——这才是名副其实的“Open”精神。

正如推特上一位博主感慨:“居然有一天,中国团队教美国人什么叫OPEN。”

Perplexity(一家以搜索式对话著称的AI企业)CEO也说得明明白白:“历史告诉我们,一旦开源追赶甚至超越闭源软件,开发者就会一窝蜂转向开源。”

这次,DeepSeek的出现让更多开发者乐意拥抱开源,相比美国那套“高算力、高成本、闭源”的做法,他们找到了几乎只要1/10的价格,却能获得相似乃至更强性能的选择。


从“卡少也能玩转大模型”到“极致扩容”,中国AI“后发先至”

有研究者指出,DeepSeek用更少的卡也能训练出效果相当的模型,这不仅仅是成本的优化,更是一种全新的规模定律(Scaling Law)突破

一旦方法更高效,把“卡”再多堆一些,模型能力可能再次上一个数量级;AGI(通用人工智能)之路,有望因此缩短若干年。

或许就像《道德经》里那句:“天下之至柔,驰骋天下之至坚。”

就算缺乏最先进的A100、H100,中国AI依旧化被动为主动,另辟蹊径,用基础算法突破硬件限制,用开源生态对抗封闭生态。

美国的封锁,反倒像是一记猛推手,把中国的AI企业直接推到自主创新的前沿。

要知道,这种转变并非凭空产生,也并非一蹴而就。

中国在过去十几年里,在深度学习、大模型、算法研究等领域早已积累了大量高水平科研成果。

如今在芯片采购上被封锁,只能倒逼企业更加注重算法效率、硬件自研和软件开源,体系化自主创新由此水到渠成。


“星际之门”计划能复制“阿波罗奇迹”吗?

美国如此大兴土木地在德州建数据中心,口号虽响,但是否能重现阿波罗登月的历史性辉煌,还有待观察。

就连OpenAI研究员也说,这当然是一项史无前例的大投资,会为AGI奠定坚实基础。

然而这并不意味着其他国家的AI就会乖乖停在原地。

上世纪的太空竞赛,苏联与美国的暗战曾诞生了火箭技术的辉煌;如今的AI赛场则是全球竞合,市场与人才都在全球流动

封锁与管制或许可以暂时减缓对手的脚步,却无法阻断知识与创新的全球传播。

况且,特朗普即便抛出5000亿美元的“终极计划”,也要考虑美国内部对政府开支的质疑、各州之间的博弈、选举周期的反复。

看似豪气冲天,其实暗流涌动。

而中国的创新浪潮则更多由市场驱动,民间需求和资本热情在数字化时代异常活跃。只要有应用场景,就不愁没有商业变现,也不愁没人去做技术突破。

当历史再一次见证“从封闭到开放”

纵观科技史,每次重大的进步,都离不开开放与合作。

半导体行业本身是一个极度全球化的产业链,没有任何一个国家可以独享。

美国一味将芯片、算法拒之门外,只会让更多像DeepSeek这样的中国AI公司探索新的“绕路方案”,一旦突破,就有可能直接站到新的制高点上。

AI要想继续发展,最好的方式就是在全球范围内集思广益,融合多方力量,共建一个开放的生态。

DeepSeek如今不仅实现技术突破,还将这些成果全面开源,正说明这种“开放”理念才是吸引开发者、推动全行业进步的真正核心驱动力

在封闭世界里,你能得到一时的领先,却也会限制思维的边界;而在开放世界里,大家互相启发、互相竞争,但整体创新能力却能被无限放大,甚至朝不可预见的方向加速迈进。


结语:封锁加码,创新开花

在“大国博弈”的历史浪潮中,每个时代都有相似的故事。

当美国的监管、封锁、投资、联盟全方位发力时,中国AI却走出了一条后发先至的新路。

DeepSeek的崛起,既是对美国“技术霸权”的有力回应,也为世界AI格局增添了一道亮色。

芯片禁运不会是终点,AI仍在不断演化。或许10年后回看,正是这段封锁最严的时期,让中国AI加速迭代出了一整套更高效的算法、更完备的开源社区与更多的产业生态。

推荐阅读

DeepSeek风头正劲 但说超越OpenAI还为时尚早

首席产品官 Kevin Weil:OpenAI 不是傻子,o3 一个月后推出

“穷人思维”正在阻止你享受智能时代的红利

职业教育、中高考改革与终身学习:重点解读《教育强国建设规划纲要(2024-2035年)》

辛顿敲响警钟:AI已学会撒谎,人类或将沦为“无用阶层”?

李飞飞:AI 以人为本!
14B参数打败 Gemini?微软 Phi-4 凭什么这么牛?
利用大模型LLMs随心所欲背单词!
马斯克:未来不是普遍基本收入,而是普遍高收入 CES 2025

宁犀牛
人工智能|教育|数学|Python
 最新文章