在AI竞技场中,常常有人认为,巨大的计算资源和雄厚的资金实力是取得领先地位的唯一法宝。美国在技术上的主导地位似乎一度是不可撼动的,但DeepSeek的出现,彻底打破了这一固有认知。在AI的核心领域——大模型训练和AGI(通用人工智能),DeepSeek凭借极其有限的资源,走出了一条与美国截然不同的技术路径,甚至实现了“新道超车”,使中国在AI竞赛中迎头赶上,缩小了与全球领先者的差距。
DeepSeek的逆袭体现了六大价值。
技术价值:独创性与改良性造就AI效能奇迹
DeepSeek的成功标志着技术突破的一个新起点。在资源相对匮乏的情况下,凭借一系列独创性和改进性技术以及精妙的策略,DeepSeek创造了一个低成本的技术奇迹。它通过自研的DualPipe训练框架、8位浮点量化技术,以及改进的MOE和多词预测等创新手段,极大地提升了计算效率,将本应需要数十亿美元的成本压缩至600万美元左右,通过对数据集和训练算法的精心优化,大幅降低了训练成本。这一切使得低资源、高效能的AI模型训练不再遥不可及,堪称“算效跃迁”。在推理性能方面,DeepSeek也表现不凡。其综合推理性能接近当前全球领先的ChatGPT O1 Pro,甚至紧随其后,挑战即将发布的O3。DeepSeek凭借创新的MLA技术、改进的RL和蒸馏技术,在推理时展现出超高效率,与全球最强的AI模型相匹敌。这一突破不仅证明了其技术的先进性,也展示了其广阔的应用潜力。DeepSeek的成功意味着AI训练技术的普及不再仅仅依赖庞大的硬件资源,而更多地依赖于架构和算法的优化。DeepSeek的推理技术将在未来数月成为各类AI平台广泛应用的主流模式。
思想价值:人类命运共同体的AI生动实践
DeepSeek成为全球排名第一的开源大模型,背后不仅仅是技术创新,更是全新理念的体现。美国长期依靠资金和算力优势主导AI大模型的开发,OpenAI推出的O系列推理慢思考模型便是典型例子,虽然强大却未能向用户开源,形成了封闭的技术壁垒。因此,DeepSeek的开源战略具有重大意义。这不仅是技术透明度的突破,更是对AI行业传统规则的深刻挑战。通过开源,DeepSeek为全球开发者提供了一个创新与应用的开放平台,加速了技术的普及,降低了中小企业与开发者进入AI领域的门槛。无论是学术界的研究人员,还是工业界的工程师,都能在这一平台上进行探索与合作,推动全球技术的协同创新。近日,硅谷核心技术圈也在广泛讨论DeepSeek的精神与技术,这无疑影响深远。
经济价值:十万亿人民币的大生意
AI大模型是AGI的基础,也是所有AI应用的底座,其地位甚至高于移动互联网时代的操作系统。就像安卓操作系统所推动的经济规模超过10万亿人民币一样,如果DeepSeek能持续保持开源第一,其经济价值也可能突破10万亿人民币,且通过金融杠杆的放大作用,其经济影响力将更为深远。这也是为什么美国股市因为DeepSeek的出现,出现了对英伟达等半导体芯片公司估值波动的原因。从长期来看,DeepSeek的成功不仅是中国AI行业的突破,更是全球经济的利好消息。
战略价值:中美进入AI博弈相持期
我们要认识到,AI技术的理论和实践主要来源于北美,它们长期主导着全球技术格局。打破这种技术传承,难度极大。美国在技术上的优势对其他国家形成了较强的控制力,长期以来,中国和其他国家更多处于追随式、渐进式创新的状态。中国企业既想参与,迫于资源和算力的限制又很难在原有赛道突破,没有先天优势,只能被逼另辟蹊径。然而,DeepSeek的崛起意味着美国技术控制力的松动,标志着中国可能实现从“基建狂魔”到“制造业狂魔”,再到“新质生产力狂魔”的战略跨越。
DeepSeek强势入局AGI领域,AGI不仅仅是AI技术的巅峰,更是全球科技竞争的核心战场。DeepSeek的成功证明了中国在这一领域的崛起,不仅推动了中国AI技术的自主创新,也引发了全球对中国AI研发能力的重新审视。这一成功将迫使美国技术界修正对中国的认知,中美在AI领域的竞争或将从单纯的追随式博弈,逐步向平等竞争过渡。这种良性竞争将推动AI技术的飞跃发展。DeepSeek的发展告诉我们,我们一只眼睛要盯着美国的技术进展,另外一只眼睛还要看着无人区,去寻找中国的新技术路径。
此外,DeepSeek若与华为技术体系结合,即可开辟中国AI技术体系独立自主的潜力,带来无限想象空间。
人才价值:中国本土人才的世界性贡献
DeepSeek团队主要由年轻的中国应届毕业生和优秀学霸组成,他们迅速成长为AI领域的领军人物。许多团队成员来自清华、北大、浙大等顶尖学府,展现了中国高等教育在培养高科技人才方面的强大实力。这些年轻科学家们不仅在技术上取得突破,还在全球市场展示了中国AI人才的巨大价值。DeepSeek的成就将激发年轻一代对AI和科技创新的热情,尤其是00后,他们将更加注重为理想而战,为价值而活。
产业生态价值:从分众到大众的AI应用大爆发
截至2024年底,中国AI非去重用户已突破亿级规模,这意味着AI应用即将迎来大爆发。DeepSeek的出现,使得国内用户首次能够使用到博士生水平的AI。相比2022年仅相当于高中生水平,2023年接近本科生水平,现在,所有用户都可以自由且免费地使用到博士生水平的AI,这对信息平权至关重要。DeepSeek的成功必将推动全球AI生态的重大变革。
DeepSeek的出现促使封闭的AI技术巨头加速技术更新,也推动了开源企业的进一步努力。在这一点上,AI技术的开放性将更加普及,尤其是针对中小企业和新兴团队,DeepSeek为他们提供了可行的技术路径和解决方案。随着AI技术成本的大幅下降,未来AI应用将覆盖教育、医疗、制造业、金融等多个领域,可能实现飞跃式发展。特别是定制化AI服务的普及,将使得更多中小企业能享受到低成本、高效率的AI技术,全球范围内更多的高效AI模型将涌现,彻底改变各个行业的运作模式。
如果开源AI大模型能够和人形机器人、脑机接口、基因编辑及mRNA疫苗、游戏及元宇宙、可控核聚变、超导材料、量子计算等板块深度融合,则能真正推动碳基文明向硅基文明的技术大跃迁。
随着美国即将发布ChatGPT O3、Grok3等新版本,中美在AI领域的博弈将进入新阶段。我们期待中国AI在这一过程中继续超越,并推动全球开源知识共享的理念实现。
(作者是清华大学新闻学院、人工智能学院 双聘教授)
来源:“学习强国”学习平台
责编:张恒
审校:乔驿珺