【震惊】中国初创公司DeepSeek横空出世,德媒激动发文,连酸溜溜都忘记了,全是有机会跟上AI时代的期待和兴奋

民生   2025-01-28 23:51   辽宁  
活动详情请扫码


今天是除夕,中国人最重要的节日。那么我们来说个最提气也是时下最热的话题,中国的AI进展,划时代的产品Deep Seek。


中国公司DeepSeek凭借其最新AI模型在世界范围内引发行业地震。初步对比测试显示,该模型性能至少与成熟的美国竞争对手相当,但运行效率显著提升。这使得整个行业的模式突然受到质疑。


这是德国媒体《世界报》最新发布的关于DeepSeek的文章,难得的是,这一次面对中国在人工智能领域的巨大飞跃,向来角度刁钻的《世界报》竟然全文平静,没有以往见惯的酸溜溜,全文保持理性,甚至还隐隐透着激动。看起来在AI时代落后一截的欧洲真的看到了跟着超车的机会,连政治正确都忘记了。以下是原文翻译:


《这场AI地震始料未及——DeepSeek为何能改变一切》



“自OpenAI发布GPT算法以来,人工智能主导着IT革命和股市行情。许多市场巨头看似地位稳固,市值几乎持续上涨。但由于技术尚处早期阶段,随时可能出现颠覆性变化:本周初所有AI概念股均告下跌,从互联网公司到基础设施供应商——从英伟达到西门子能源无一幸免。


原因在于一家中国小型初创公司成功挑战了该行业迄今最重要的铁律:如果想要参与AI竞赛,就必须预先投入数十亿美元建设数据中心。


但中国初创企业DeepSeek仅以不到600万美元的研发预算,就开发出名为R1的自主算法,在对比测试中追平甚至超越美国竞争对手的现有模型。


更重要的是,根据分析师初步估算,R1需要的算力仅为美国竞争对手所需算力的零头即可运行。因此DeepSeek目前可免费提供服务,此举直接冲击了行业的盈利模式和收入预测。


‘DeepSeek R1是AI领域的斯普特尼克时刻’,硅谷知名投资人马克·安德森在周日晚间发布时评论道——此时DeepSeek应用已在谷歌应用商店登顶榜首,大量用户希望试用这款新AI助手。


DeepSeek R1同步实现多项创新

DeepSeek过去数月已在GitHub编程平台开源其多个AI算法版本。但最新版R1首次实现多项创新整合,完成了此前被认为不可能的任务:在保持与美国竞争对手模型性能相当的同时,大幅节省数据中心的能耗和容量。


由于DeepSeek公开了全部程序代码,其模型性能声明具备独立验证性。在首批分析中,多位美国AI研究者确认了关键数据,并发现一系列创新点。


美国云服务商Dropbox的AI产品负责人摩根·布朗在X平台发文,解释了中国开发者如何重新审视AI训练的基础原则。


布朗指出,该行业迄今认为训练大模型至少需要价值超1亿美元的算力投入。‘DeepSeek斜刺杀出并提出:如果我们只用500万美元做到会怎样? 他们不仅停留在设想——而是真正实现了。’


DeepSeek研究人员通过在AI计算中适当降低小数点精度,将存储需求缩减四分之三。他们还改变了AI读取训练数据的方式——简而言之,R1不再拘泥于音节,而是整句读取。


最关键的是,R1并非单一大型算法,而是由多个并行"专家"AI组成,这些子系统仅在需要时激活:当处理数学问题时启动数学专家,创建演示文稿时启用管理专家。


2000块 vs 10万块英伟达芯片


‘在传统模型中,1.8万亿参数同时处于活跃状态。DeepSeek的6710亿参数中仅有37亿同时运行。、布朗解释道,‘就像一个庞大团队,但仅根据具体任务调用所需的专家。’


DeepSeek仅需2000块英伟达芯片即可完成其他公司10万块芯片的任务,初步估算其运行成本比OpenAI低95%。更重要的是,由于内存需求降低,R1甚至可在游戏显卡而非昂贵超级计算机上运行。


DeepSeek的创新直接源自美国政府对中国AI行业持续数年的制裁压力。英伟达被禁止向中国出售超级计算机,所有建设自主高性能芯片产业所需的设备和软件均被列入禁运清单。DeepSeek被迫走上能效创新之路。


对AI市场的深远影响


这种影响不仅限于中美两国:德国人工智能研究中心(DFKI)语言技术研究员阿尔约沙·布尔哈特(Aljoscha Burchardt )评论称:’美国企业营造出唯有数十亿投入才能保持AI竞争力的认知,以此威慑潜在竞争者。‘


’但此前用数十亿美元同时训练所有参数的粗暴方法,只是该技术的第一波浪潮。现在我们看到第二波——针对具体用途优化的模型,它们被蒸馏萃取至真正需要的核心。‘布尔哈特认为这给欧洲AI产业带来机遇。


’美国企业试图用巨额投资构筑护城河。但与传统行业不同,由于大量算法已开源,先发优势并不绝对。如果认为OpenAI的方案就是技术演进的终点,那才是奇迹。‘


行业转折点


中国能效创新可能恰逢其时——甚至中期会强化AI热潮。因为目前OpenAI等公司面临盈利难题。美国作家兼AI批评家加里·马库斯近日对《世界报》表示,最新AI系统最大弱点在于成本收益比:’当前算力消耗过高,难以实现商业价值。‘


据分析师估算,OpenAI每年消耗50亿美元,主要用于超级计算机租赁。而像DeepSeek R1这样小到可在智能手机运行的算法,提供了逃离算力陷阱的出路。


而英伟达则无需担心中期营收:如果AI变得更便宜,其广泛应用反而可以维持数据中心需求。


唯有OpenAI CEO萨姆·阿尔特曼面临困境。他刚宣布寻求5000亿美元投资建设’星际之门‘AI训练项目,现在投资者势必尖锐质问:为何中国用60亿甚至600万美元就能达成目标?”


======================


谨以此文作为春节礼物送给大家,一起高兴高兴。




转载及广告业务

扫一扫

添加客服微信

或发邮件

info@de-life.de



德国生活
介绍德国生活、风土人情,了解鲜活德国。
 最新文章