今年,三位AI专家横扫了2024诺贝尔物理学奖和化学奖,这是诺奖第一次认可计算机科学,表彰三位专家在使用人工神经网络进行机器学习的基础性发现和发明。从学术界到产业界再到人们的生活,AI大模型已成为一年来当仁不让的科技圈顶流。伴随着大模型的加速进步,一些话题也引起热议:多模态大模型多久能迎来爆发?AGI时代是否会出现硅基智能新物种?近日,在2024联想创投CEO年会上,多位科研、产业专家,以及创新企业家代表一起探讨大模型向AGI演进的未来之路。
在以《大模型新纪元,迎接人类硅基智能新物种大爆发》为主题的科技圆桌Panel环节,联想集团副总裁、联想创投合伙人宋春雨作为主持人,与联想集团高级副总裁、商用产品中心及全球中小企业业务总经理于海,北京智源人工智能研究院院长王仲远,香港科技大学电子及计算机工程学系讲座教授、ACM/IEEE/AAAS Fellow谢源,阶跃星辰创始人、CEO姜大昕,OpenCSG创始人、CEO陈冉展开了深度讨论,嘉宾们一致认为,模型能力的快速进步带来了第四次工业革命的曙光,AI大模型将端到端地重新定义数字世界和物理世界,引领硅基智能新物种大爆发。
宋春雨:首先想探讨的是中国AGI的创新之路是什么?请王仲远院长从大模型技术原始创新和技术创新的角度讲一下AGI大模型创新发展有哪些关键问题需要未来重点解决?
王仲远:中国人常讲以史为鉴,可以知兴替。从1943 年神经网络的诞生开始计算,人工智能发展至今有八十年的历史,至少有三大流派:符号主义、连接主义和行为主义,分别对应知识图谱、神经网络、智能体。
大模型背后本质上是神经网络的分支,GPT-o1是将深度学习和强化学习进行了结合。回顾神经网络的发展历程:2006年,Geoffrey Hinton教授提出了关于深度学习的训练方法,使神经网络越来越深,技术路径逐渐收敛;2017年,Transformer的提出,允许神经网络在处理数据时进行并行计算,使得大规模训练神经网络成为可能;2018年第一代GPT,基于海量的互联网文本数据,通过Decoder-Only的架构进行大模型训练。
从人工智能技术发展脉络可以看到,整个神经网络包括大模型的发展都是有迹可循的。
现阶段大模型的发展是一个系统性工程,不仅仅是算法,还包括数据、算力,创新体制机制与场景应用。对于中国人工智能产业发展的需要的算力资源配置,人才储备以及潜在的场景落地,我持一个谨慎乐观的态度。
目前,多模态模型的技术路线还未收敛,依然需要做创新。10月21日,智源研究院发布了原生多模态世界模型Emu3,第一次实现了多模态的统一理解与生成。我们认为大模型未来一定会从数字世界进入物理世界,赋能生命科学研究,这些都是未来巨大的产业机会。
宋春雨:请姜大昕总分享一下:大模型发展路径和格局将会怎样?中国的互联网大厂和创业企业在大模型创新上的差异化是怎么样的
姜大昕:对于AGI演进路线,我们可以参考OpenAI流传出来的路线图。整个路线像自动驾驶一样分成了五级,第一级就是Chatbots,聊天机器人,第二级是Reasoners推理能力,第三级就是Agents智能体,第四级是Innovators创新者,最后一级叫Organizations,就是可以做整个组织的事情,它不是一个单智能体,可能是多智能体合作。
我们的发展思路,是要做到先跟跑,再卡位,再结合应用做创新的策略。追赶并不丢人,追赶也是创新,也要自己探索。而且我们追赶的速度其实是很快的。以阶跃星辰为例,我们Step系列大模型全家桶,从千亿参数模型到万亿参数模型,从语言模型到多模态模型,从多模理解到多模生成,所有的模型都是过去16个月训练完成的。
和OpenAI一致,我们判断下一阶段重点也一定是智能体。什么是智能体?它的突出特点是能自行完成一系列的动作。除了数字世界的智能体,物理世界也有智能体,最有代表性的就是自动驾驶和机器人。目前这两个行业也在快速发展。
要实现智能体,除了要有强大的推理能力,最大的挑战还是多模态。目前多模态大模型,不管是理解还是生成,与人类的水平还有相当大的差距。我说的卡位,瞄准的就是这个重要的方向,尤其是视觉的理解生成一体化难题, 它是计算机视觉研究几十年的根本问题,我们觉得现在到了爆发的前夜,这个问题一旦有所突破,智能体的时代就会全面到来。
实现智能体还有一点非常关键,就是技术发展一定要和应用场景紧密结合、相互推动,这恰恰是联想的强项也是中国的强项,我们希望有机会和联想一起合作,在AIPC上做出智能体交互体验,一起来推动技术和应用创新。
相较于大厂和创业公司,我认为大厂在资源方面比较优秀;创业公司的特点是小快灵,我们敢于押注一些方向,并且敢于快速地试错。
宋春雨:下一个问题请谢源博士分享一下,中国的AI算力格局会和美国一样吗?在AI芯片、AI infra、AI超算集群方面,未来的发展趋势和创新技术是什么?
谢源:我简单把芯片产业做一个比喻,它就像写书、印书、装订书这样的过程,芯片行业需要整个产业链一起努力。
同时,我还想强调三个观点,一是摩尔定律,其实是指制造工艺领域每两年就有一个新的节点;二是Intel的tik-tock model,通过一年架构上的变化,一年工艺上的变化,每两年间接往前走,实现新的有竞争力的产品出现,在这种情况下,工艺很重要,但架构的设计也非常重要;第三是 “黄式定律”,就是每年GPU的算力都增加一倍,在过去的十年里面2的10次方就是1000倍,单靠摩尔定律没办法做到,而是系统地综合算法、软件、架构和工艺来实现。
开源大模型与企业级模型
相互促进,共同提高
宋春雨:大家一直非常关注开闭源之争,到底开源大模型会赢还是闭源大模型会赢,他们各自的优势和定位会是什么样?
陈冉:这是一个开放的话题,开源和闭源之争,其实是两种经济体或者商业模式的竞争,可以提高到实体经济和互联网经济的竞争。在美国,开源在技术创新中起到了非常大的作用。开源和闭源没有谁赢或者谁输的答案,但是它们永远会存在一个核心的目标,就是解决成本、劳动力、创新三大问题。开源能够实现成本共担、结果共享,并解决目标一致性问题。开源闭源的讨论不应仅限于代码贡献,而应上升到产业链和经济商业模式的问题,包括供需平衡。
可以确定的是,开源模式将在国内形成万人共创、更多企业参与的局面。这是因为大模型创业的成本和门槛都非常高。我们在社区分享时,老贺提出:“中国是否会由如今的百模大战变成千模大战?”,我的回答是绝对会。目前社区中已有超过30万的模型,这些模型的增长基于数据,一个模型利用数据产出另一个模型,增长是指数级的。
开源在国内解决万人共创的前提是将企业大模型的能力通过开源加固。但许多人无法自主可控且缺乏资金,例如拥有万卡资源的人数非常有限。因此,许多垂直领域的模型将由企业级开源模型产生。
开源与企业级模型是相互促进、共同提高的。最终,企业通过开源基础设施获得赋能。回顾历史,我们可以看到云计算时代AWS Cloud之后出现了OpenStack,通过开源实现了混合云。在AI领域,产业云、政务云、私有云的出现也是历史的重复,这个时代正在以开源的形式重新到来。
联想以全栈AI战略与产业机遇
AI大模型开启产业智能化新工业革命
引领硅基智能新物种大爆发
宋春雨:大家看到生成AI过去20个月的快速发展,这会是一次新工业革命的开始吗?前三次工业革命都是代替人类的体力,这次实际上是代替人类独有的智能,大家对此有何期待?