央视《对话》报道钛媒体T-EDGE:中外专家热议大模型卷不动了吗?

创业   2025-01-08 16:54   北京  


扩展定律到底有没有失效?



钛媒体注:央视《对话》始终关注人工智能技术的发展动态。在2024年12月6日-7日举办的钛媒体T-Edge创新大会上,央视《对话》也采访到了一些国内国外的行业大咖,共同探讨:扩展定律到底有没有失效?以下为央视《对话》报道全文:





近期,又一个话题点燃了科技圈的争论,那就是:扩展定律是否正在走向失效?


扩展定律,又叫Scaling Law,是人工智能近五年来非常热门的一个话题,也是这次大模型浪潮的一个非常重要的驱动力。它的主要思想就是我们可以通过把模型参数持续变大,让模型能够容纳更多的知识,从而具备更强的能力。


2024年下半年,业内发现,由于数据和算力达到了一个相对的瓶颈,开始有人担心,扩展定律是不是触到了天花板。彭博社2024年 11 月的报道称,OpenAI 的下一代模型Orion进步不明显,谷歌Gemini 能力未达预期,Anthropic 的 Claude 3.5 Opus 也推迟发布,接踵而来的消息引发科技界对扩展定律即将失效的担忧。OpenAI 联合创始人 Ilya Sutskever 接受路透社采访时更是直言,超大规模语言模型的投资回报率大幅降低,AI 实验室面临的挑战愈发复杂,进一步加深了人们对扩展定律当前困境的思考。


扩展定律到底有没有失效?行业又对此怎么看呢?在钛媒体T-Edge创新大会上,我们采访了一些国内国外的行业大咖,听听他们怎么说。


扩展定律要终结了吗?




DeepAI创始人兼CEO Kevin Baragona:我认为目前尚未有证据表明扩展定律是无效的,它仍然在起作用。放缓的原因可能在于,互联网上所有容易获取的数据都已经被抓取并录入到这些模型中了。扩展定律所预测的是一种数学层面的东西,会产生所谓的精度损失。对于推理模型的训练,你不会将在互联网上找到的一般性数据输入给它,而是输入与推理相关的特定类型的数据。所以扩展定律背后的数学原理仍然有效,但由于数据匮乏,收益可能会递减。


中国工程院院士、之江实验室主任王坚:我觉得Scaling Law一定会失效的,规模到一定程度的时候,它一定会失效,或者它一定会有新的方法出来。但是今天Scaling Law就在失效,可能我就带来一个很大的怀疑。用一个不太恰当的比喻,如果你没有到100万张卡的时候,你先不要说它会失效。你不能说我往太空走了100公里,就宇宙到了尽头了。我想我们对这个事情的边界可能还没有探索到。


面壁智能创始人刘知远:在我看来,这个问题的回答是:既是也不是。现有的数据和计算资源已经不足以支持模型再像过去五年那样,几百倍甚至上千倍地进行模型参数规模的增长了。Scaling law 一定还会持续地发挥作用,但是它会按照一种全新的曲线增长,追求的是用更小参数的模型,去容纳更多模型智能能力,从而让模型能在更多的终端设备上跑得动、跑得快,让大模型能够尽可能地被放在离每个人最近的地方。


大模型下一步卷的是什么?




中国工程院院士、之江实验室主任王坚:我不知道,如果那么简单这个事情也不会是今天这个样子。大模型从来不只是在Scaling Law上,从来都是在不同的领域里边在探索。所以我想今天可能最好的一个事情就是,大家都在探索不同的方法。


面壁智能创始人刘知远:高质量将会是一个非常重要的关键词。我们最近这半年探索了一条新的技术路径,我们把它称为 Densing Law,也叫大模型的能力密度定律。因为过去五年的时间,我们看到了同样的模型能力可以被放到一个更小的参数规模里,这表明模型的知识密度在不断增强。这点跟过去 80 年芯片的摩尔定律所预言的类似:每隔一段时间,单位面积芯片上的电路密度会增加一倍,从而带来计算设备的小型化。每隔一段时间,模型知识密度的增加,也能在算力有限的情况下让更多人能用得上、用得起(大模型)。


DeepAI创始人兼CEO Kevin Baragona:人们最看重的是人工智能的推理能力,下一代模型将不仅仅会是大型语言模型(LLMs),它们会朝着推理方向进行定制化打造。在美国,我们几乎在各个地方都在部署人工智能。人们每天都在使用人工智能,孩子们也在用,每天都在跟人工智能对话。当聪明的人形机器人进入社会,下一代年轻人在某种意义上会将它们当作真正的人来对待。他们或许会试图赋予这些机器人权利之类的东西。这可能会变得非常有意思。


在2024T-EDGE上,波士顿动力机器人创始人Marc Raibert:人形机器人这一概念颇为复杂,仅仅是制造出有着两条胳膊、两条腿,有时还有个头的机器人,并不能让它与人类有多相像。这些机器人还不具备人类的智力,它们需要被告知需要做些什么,它们甚至不具备人类那样的身体能力,也没有其他那些让人之所以成为人的特质,比如道德准则、雄心壮志以及人们对家人的爱。那些基于语言模型做的训练、机器人的物理特性,和人类执行任务之间仍存在很大差距,比如我们能让大脑主动灵活地使用双手。我认为未来懂得将强化学习与传统技术相结合的人,才能极大地提升机器人的能力。


本文授权转载自CCTV对话

(cctv-duihua)



热点视频推荐

经济学家洪灏称要想中国股市今年表现更好,首先房地产要止跌,过去几年房价下跌削弱了人们对经济的信心。


点赞关注钛媒体视频号,观看更多精彩视频
*温馨提示:喜欢钛媒体公众号的小伙伴注意啦!根据公众号推送新规,请将钛媒体设为“星标”,这样才能第一时间收到推送消息,已设置的小伙伴还需要重新设置“星标”


-----------华丽的分割线------------


下载钛媒体App,打开科技,打开财富。

万水千山总是情,点个在看行不行

钛媒体
新鲜犀利的财经见闻,放眼国际的前沿技术,还有罕见披露的内幕消息。钛媒体(www.tmtpost.com),引领未来商业与生活新知,一个投资者与创新者酷爱聚集的地方。还可下载钛媒体App,24小时不间断更新和互动。
 最新文章