吴恩达:DeepSeek “觉醒”!中国 AI 如何颠覆全球格局 

文摘   2025-01-31 10:11   湖北  
!关注不迷路



 

 

 

 

吴恩达:DeepSeek “觉醒”!中国 AI 如何颠覆全球格局

导语: 本周,中国的 DeepSeek 模型引发了全球 AI 界的震动。人工智能领域领军人物吴恩达(Andrew Ng)在本文中深入解读了 DeepSeek 背后的重要趋势,他既对中国在 AI 领域的快速崛起表示赞赏,也对开源模式的价值给予了高度肯定,并呼吁美国避免因扼杀开源而错失 AI 发展良机。 这篇文章揭示了 AI 领域正在发生的重大变革。


要点总结:

  •  中国 AI 崛起: 中国在生成式 AI 领域正迅速追赶美国,差距正在快速缩小。
  •  开源力量: DeepSeek-R1 的开源发布,凸显了开源权重模型在 AI 供应链中的重要性。
  •  成本颠覆: 开源模型大幅降低了基础模型的成本,加速了 LLM 的商品化。
  •  应用机遇: 基于基础模型构建 AI 应用的时代已经到来,蕴藏着巨大的商业机会。
  •  创新路径: AI 进步不仅靠扩大模型规模,算法创新同样重要,可大幅降低训练成本。

正文:

亲爱的朋友们,

本周,关于 DeepSeek 的热议,让许多人清晰地看到了几个重要的趋势,而这些趋势其实早已显现:

(i) 中国正在生成式 AI 领域追赶美国,这将影响到 AI 供应链。
(ii) 开源权重模型正在使基础模型层商品化,这为应用开发者创造了机会。
(iii) 扩大规模并非 AI 进步的唯一途径。尽管算力备受关注,但算法创新正在迅速降低训练成本。

大约一周前,位于中国的 DeepSeek 公司发布了 DeepSeek-R1,这是一个卓越的模型,其在基准测试中的表现与 OpenAI 的 o1 相媲美。更重要的是,它以宽松的 MIT 许可证开源发布。上周在达沃斯,我从非技术商业领袖那里收到了很多关于它的问题。而在周一,股票市场出现了“DeepSeek 抛售”:英伟达和许多其他美国科技公司的股价暴跌(截至撰写本文时,它们已经有所回升)。

我认为 DeepSeek 让许多人意识到:

中国正在生成式 AI 领域追赶美国。 当 ChatGPT 于 2022 年 11 月推出时,美国在生成式 AI 领域明显领先于中国。人们的印象往往改变缓慢,所以即使最近,我仍然听到来自美国和中国的朋友认为中国落后。但实际上,过去两年中,这种差距迅速缩小。随着来自中国的模型如 Qwen(我的团队已经使用了几个月)、Kimi、InternVL 和 DeepSeek 的出现,中国显然一直在缩小差距,在视频生成等领域,中国甚至一度处于领先地位。

我很高兴 DeepSeek-R1 以开源权重模型发布,并附带分享许多细节的技术报告。相比之下,一些美国公司一直在推动监管,以炒作人类灭绝等假设性的 AI 危险,从而扼杀开源。现在很明显,开源/开放权重模型是 AI 供应链的关键部分:许多公司都会使用它们。如果美国继续扼杀开源,中国将主导供应链的这一部分,许多企业最终将使用更体现中国价值观而非美国价值观的模型。

开源权重模型正在使基础模型层商品化。 正如我之前写道的,LLM Token 的价格一直在迅速下降,而开源权重模型也促进了这一趋势,并为开发者提供了更多选择。OpenAI 的 o1 每百万输出 Token 的成本为 60 美元;DeepSeek R1 的成本为 2.19 美元。这近 30 倍的差异让许多人注意到了价格下降的趋势。

训练基础模型和销售 API 访问是一项艰巨的业务。该领域的许多公司仍在寻找一条途径来弥补模型训练的巨额成本。“AI 的 6000 亿美元问题”一文很好地阐述了这一挑战(但要明确的是,我认为基础模型公司正在做很棒的工作,并且我希望他们成功)。相比之下,在基础模型之上构建应用程序则提供了许多绝佳的商业机会。现在,既然其他人已经花费数十亿美元训练了这些模型,你只需花费几美元就可以访问这些模型,来构建客户服务聊天机器人、电子邮件摘要工具、AI 医生、法律文件助手等等。

扩大规模并非 AI 进步的唯一途径。 一直以来,都有一种通过扩大模型规模来推动进步的炒作。公平地说,我早期也是扩大模型规模的支持者。许多公司通过宣传这样的故事筹集了数十亿美元:通过更多资金,他们可以 (i) 扩大规模,并 (ii) 可预测地推动改进。因此,人们一直高度关注规模扩大,而没有更细致地看待我们可以取得进步的多种方式。部分受到美国 AI 芯片禁运的推动,DeepSeek 团队不得不创新许多优化措施,以便在性能较差的 H800 GPU 而非 H100 上运行,最终使得模型的训练成本(不包括研发成本)低于 600 万美元的计算成本。

这是否真的会减少对计算的需求,还有待观察。有时,降低商品的单位成本反而会导致购买该商品的总体支出增加。我认为,从长远来看,对智能和计算的需求实际上没有上限,所以我仍然看好人类会使用更多的智能,即使它的成本降低。

我在社交媒体上看到了许多对 DeepSeek 进展的不同解读,仿佛它是一个罗夏墨迹测验,让许多人将自己的意义投射到上面。我认为 DeepSeek-R1 具有尚未解决的地缘政治影响。这对 AI 应用开发者来说也是好消息。我的团队已经在集思广益,提出了一些新的想法,这些想法只有在我们能够轻松访问开源的高级推理模型的情况下才有可能实现。现在仍然是构建 AI 应用的绝佳时机!

保持学习,

Andrew


 


 

如果您想要让大模型写出优质的短篇小说,以及对其他内容感兴趣,也欢迎点击下面的链接,效果不错哦,很多朋友都说好。

点击这里:超强写作提示词 以及 最强写作指导

效果如下


AI写作批改助手

雪花写作法

prompt自动优化

一文读懂4种AI Agent设计模式



草台AI
世界潮流 浩浩荡荡 顺之则昌 逆之则亡。AI来了!AIGC,LLM,大模型,规模效应,软件开发
 最新文章