​李开复谈中美大模型差距:很多美国朋友都认为中国会远远落后

科技   2024-10-21 11:46   北京  

中美之间,AI大模型的差距究竟有多大?这个问题,很多普通人也都想知道。大概半年前,零一万物CEO李开复博士就说过,在一年前,我们(中国)落后OpenAI、Google 7到10年,现在,“我觉得差距也就是在6个月左右”,大大降低了。

最近,李开复博士在最新的发布会上又谈到了这个话题。我提取了相关的两段话,和大家一起学习。

李开复说:做好预训练模型是一个技术活,而且要非常多有才华的人在一起工作,慢工出细活,需要懂芯片的人,懂推理的人,懂基础架构的人,懂模型的人,有很好的算法同学,才能一起做出来。


如果一个公司能有幸拥有这么多优秀的人才,能够跨领域的合作,那我相信中国是绝对可以做出世界排名前十的预训练的通用模型,但不是每家公司都可以做这件事情,做这件事情的成本也比较高,以后有可能会越来越少的大模型公司训练做预训练。

这么看来,李开复博士认为,做大模型的关键在于人才。事实上,零一万物的团队也确实人数上非常少,其实国外也是这样的特点,比如OpenAI,整个团队人数也只有100多人,最近AI大爆发人数也增多了,但是即便如此也只有700多人。

真正懂大模型的人才依然非常非常少,比如岛主其实也只是一个观察人士而已,要让我带团队做个大模型,那也是不可能的。只有在AI领域具备极高专业度并且在资本圈富有号召力的团队,才有机会胜出。这些都意味着,大模型创业不是万众创业而是场小众创业。

所以我们能看到,现在中国AI基本集中在大厂和AI六小龙这两个层面了,其他创业团队基本没什么机会了。

提问:预训练模型要有自己怎样的独门特色,才能继续追赶、缩短时间差?

李开复:缩短时间差非常困难,我不预测我们可以缩短。因为毕竟人家是用十万张GPU训练出来,我们用的是两千张GPU训练出来,我们时间差能达到只是因为我们模型、AI infra等团队都热心聪明,去使用和理解对方做出来的东西,再加上我们每家的研发有特色,比如数据处理、训推优化等等,现在这一套方法论在零一万物已经成熟,我们有信心把自己的创新加上一些特长,融合对OpenAI和其他公司发布新技术的关注,把它的能力在我们产品里面发挥出来,我觉得这套方法保持在六个月左右,就已经是很好的结果了。

如果期待破局,可能需要一个前所未有的算法才有机会。我们千万不要认为落后六个月是很羞耻的事情,或者一定要追赶,因为很多美国朋友都认为中国会远远落后,也有美国朋友认为,人家十万张GPU等,我们要被甩掉三年、五年甚至十年都有可能,现在从零一万物证明,不会落后这么多,这次LMSYS榜单也有两家其他中国公司表现不错,不是只有我们一家在做。所以对于奋力图强、勤奋努力、聪明多元化的团队,在国内拥有这样团队的公司,要用类似零一万物的打法,去贴近美国最顶尖的公司,不落后超过六个月,我觉得是可能,而且不只是我们一家可能,但难度是高的,希望再往下减非常困难,除非真的有一个发明和科技上的突破。

半年前,李开复认为中美差距在六个月,如今李开复的观点是,保持六个月的差距就已经是“很好的结果了。”请注意,这说明了什么?说明美国的技术进步速度在增快,我们跟随的脚步如果不够快,很可能这个差距会更大。

那么我们的机会在哪里呢?李开复点名了算法。人工智能的三驾马车是,算力、算法和数据。我们知道,很多人一提到中国大模型的优势,都会强调我们的数据和场景优势,但是李开复认为关键在于算法。“如果期待破局,可能需要一个前所未有的算法才有机会。”

尽管中国在数据积累和应用场景上拥有显著的优势——庞大的人口基数和多样化的社会经济活动为AI提供了丰富的训练素材和实际应用的机会——但这些优势并不足以保证长期的技术领先地位。算力方面,虽然硬件技术的发展使得处理大规模数据集变得更加高效,但这同样是一个相对容易追赶的领域。

因此,在这样一个竞争激烈的环境中,算法创新成为了实现差异化、构建技术壁垒的关键因素。一个前所未有的算法不仅可以解决现有技术难以克服的问题,还可能开启全新的应用场景或行业变革。

但是,说起来简单,做起来太难了。算法创新,尤其是底层逻辑的创新,那基本都是天才才能做到的事情,不过李开复博士也给了我们宽慰。“我们千万不要认为落后六个月是很羞耻的事情,或者一定要追赶。”

“因为很多美国朋友都认为中国会远远落后,也有美国朋友认为,人家十万张GPU等,我们要被甩掉三年、五年甚至十年都有可能,现在从零一万物证明,不会落后这么多,这次LMSYS榜单也有两家其他中国公司表现不错,不是只有我们一家在做。”

“不落后超过六个月,我觉得是可能。”所以,李开复那些美国朋友被打脸了。

数字进化岛
洞察科技产业,透视全球真相。
 最新文章