你好啊,我是雨飞,见字如面。感谢阅读,期待我们下一次的相遇。
随着 DeepSeek 的火热,Anthropic 的 CEO 也坐不住了,写下来这篇前后矛盾、逻辑混乱的文章,文章地址:https://darioamodei.com/on-deepseek-and-export-controls
这篇文章已经有很多公众号都做过翻译和解读了,谈下雨飞最关注的几点。1、文章中提到了三个关于人工智能发展的基本动态,包括规模定律(Scaling laws)、曲线偏移(Shifting the curve)以及范式转变(Shifting the paradigm),看起来没啥问题,但实则画风一转,认为RL的强化学习是投入早起,投入很少量的资金就足以获得巨大的收益。实则是希望掩盖DeepSeek取得的成绩,并给自己找下理由。果不其然,后面在文章提到,DeepSeek-V3是真正的创新所在,在某些任务上的表现已经接近美国最先进模型水平,而且训练成本大幅度降低。然后又反向提到 DeepSeek-V3并非一项独特的突破,只是持续成本降低曲线上一个预期的点。老哥写下这篇文章的时候,一定内心充满了矛盾。其次,在一开始提到RL的强化学习能够以少量的投入带来巨大的收益之后,老哥在文中又写到R1模型在创新或者工程角度来看,远不如V3模型有趣,避重言轻,一点也不谈DeepSeek开源整个训练体系、技术对开源社区以及全世界的影响。而且全球顶级的AI社区HF都根据DeepSeek开源的内容,做了相关优化和复现,充分说明了这项开源技术对全球科技圈的推动作用。最后,是老哥的真实意图,出口管制。根据自己前面的内容,认为想要制造出比人类更智能的人工智能,需要数百万芯片,因此要执行出口管制阻止中国获得芯片。前文还在说这成本的降低是趋势,后面就需要百万的芯片去做AGI了,直接自己打脸自己。既然训练的成本、显卡的需要都会逐渐降低,那么再做出口管制的意义是什么呢。退一步讲,现阶段DeepSeek使用了不到o1十分之一成本的资金就达到了o1的水平,那么未来也非常有可能再创奇迹。说实话,开源和闭源的争论已经很久了。曾记得某一些大佬也说过,闭源的模型会在很长时间内保持优势,因为他们要通过商业化去赚钱。而从现在开源社区的发展来说,开源的模型已经接近甚至超过顶级的闭源模型了。这也印证了一句话,颠覆你的,或许并非来自同行的正面强攻,而是来自跨界者出其不意的降维打击,在降维打击面前,传统优势可能瞬间化为乌有。 作为商人,为自己的闭源模型站队,可以理解,但是无论如何也不能否认开源社区的力量。大模型训练所需的数据都是来自互联网上每一个人,这本身就是利用了开源数据。当然,随着Dario这篇文章的发布,我相信中国的科技圈肯定也会出现各种不同的声音,但无论哪一种声音,我们都认为AGI是属于全人类的,而非某一家公司、某一个国家专属的内容。AGI的成果也应该普惠全人类。
如果你觉得这篇文章对你有启发,欢迎点赞收藏转发下。目前运营了两个Cursor交流群,付费、免费的都有,有想一起交流学习的可以添加下方的微信,邀你一起学习。
加微 1060687688,备注「公众号」,送你一份「AI工具与副业变现指南」
「雨飞同行」这是雨飞的介绍(第8版,交个朋友,限时送福利)