迈向AGI时代,AI大模型引领硅基智能新物种大爆发|2024联想创投CEO年会

科技   科技   2024-11-05 21:25   北京  


今年,三位AI专家横扫了2024诺贝尔物理学奖和化学奖,这是诺奖第一次认可计算机科学,表彰三位专家在使用人工神经网络进行机器学习的基础性发现和发明。从学术界到产业界再到人们的生活,AI大模型已成为一年来当仁不让的科技圈顶流。伴随着大模型的加速进步,一些话题也引起热议:多模态大模型多久能迎来爆发?AGI时代是否会出现硅基智能新物种?近日,在2024联想创投CEO年会上,多位科研、产业专家,以及创新企业家代表一起探讨大模型向AGI演进的未来之路。

在以《大模型新纪元,迎接人类硅基智能新物种大爆发》为主题的科技圆桌Panel环节,联想集团副总裁、联想创投合伙人宋春雨作为主持人,与联想集团高级副总裁、商用产品中心及全球中小企业业务总经理于海,北京智源人工智能研究院院长王仲远,香港科技大学电子及计算机工程学系讲座教授、ACM/IEEE/AAAS Fellow谢源,阶跃星辰创始人、CEO姜大昕,OpenCSG创始人、CEO陈冉展开了深度讨论,嘉宾们一致认为,模型能力的快速进步带来了第四次工业革命的曙光,AI大模型将端到端地重新定义数字世界和物理世界,引领硅基智能新物种大爆发。

科技圆桌:大模型新纪元,迎接人类硅基智能新物种大爆发


以下为现场内容实录:

01

中国大模型的未来
关键在自主创新全栈AI能力

宋春雨:首先想探讨的是中国AGI的创新之路是什么?请王仲远院长从大模型技术原始创新和技术创新的角度讲一下AGI大模型创新发展有哪些关键问题需要未来重点解决?

王仲远:中国人常讲以史为鉴,可以知兴替。从1943 年神经网络的诞生开始计算,人工智能发展至今有八十年的历史,至少有三大流派:符号主义、连接主义和行为主义,分别对应知识图谱、神经网络、智能体。

大模型背后本质上是神经网络的分支,GPT-o1是将深度学习和强化学习进行了结合。回顾神经网络的发展历程:2006年,Geoffrey Hinton教授提出了关于深度学习的训练方法,使神经网络越来越深,技术路径逐渐收敛;2017年,Transformer的提出,允许神经网络在处理数据时进行并行计算,使得大规模训练神经网络成为可能;2018年第一代GPT,基于海量的互联网文本数据,通过Decoder-Only的架构进行大模型训练。

从人工智能技术发展脉络可以看到,整个神经网络包括大模型的发展都是有迹可循的。

现阶段大模型的发展是一个系统性工程,不仅仅是算法,还包括数据、算力,创新体制机制与场景应用。对于中国人工智能产业发展的需要的算力资源配置,人才储备以及潜在的场景落地,我持一个谨慎乐观的态度。

目前,多模态模型的技术路线还未收敛,依然需要做创新。10月21日,智源研究院发布了原生多模态世界模型Emu3,第一次实现了多模态的统一理解与生成。我们认为大模型未来一定会从数字世界进入物理世界,赋能生命科学研究,这些都是未来巨大的产业机会。

宋春雨:请姜大昕总分享一下:大模型发展路径和格局将会怎样?中国的互联网大厂和创业企业在大模型创新上的差异化是怎么样的

姜大昕:对于AGI演进路线,我们可以参考OpenAI流传出来的路线图。整个路线像自动驾驶一样分成了五级,第一级就是Chatbots,聊天机器人,第二级是Reasoners推理能力,第三级就是Agents智能体,第四级是Innovators创新者,最后一级叫Organizations,就是可以做整个组织的事情,它不是一个单智能体,可能是多智能体合作。

我们的发展思路,是要做到先跟跑,再卡位,再结合应用做创新的策略。追赶并不丢人,追赶也是创新,也要自己探索。而且我们追赶的速度其实是很快的。以阶跃星辰为例,我们Step系列大模型全家桶,从千亿参数模型到万亿参数模型,从语言模型到多模态模型,从多模理解到多模生成,所有的模型都是过去16个月训练完成的。

OpenAI一致,我们判断下一阶段重点也一定是智能体。什么是智能体?它的突出特点是能自行完成一系列的动作。除了数字世界的智能体物理世界也有智能体最有代表性的就是自动驾驶和机器人。目前这两个行业也在快速发展。

要实现智能体,除了要有强大的推理能力,最大的挑战还是多模态。目前多模态大模型,不管是理解还是生成,与人类的水平还有相当大的差距。我说的卡位,瞄准的就是这个重要的方向,尤其是视觉的理解生成一体化难题, 它是计算机视觉研究几十年的根本问题,我们觉得现在到了爆发的前夜,这个问题一旦有所突破,智能体的时代就会全面到来。

实现智能体还有一点非常关键,就是技术发展一定要和应用场景紧密结合、相互推动,这恰恰是联想的强项也是中国的强项,我们希望有机会和联想一起合作,在AIPC上做出智能体交互体验,一起来推动技术和应用创新。

相较于大厂和创业公司,我认为大厂在资源方面比较优秀;创业公司的特点是小快灵,我们敢于押注一些方向,并且敢于快速地试错。

宋春雨:下一个问题请谢源博士分享一下,中国的AI算力格局会和美国一样吗?在AI芯片、AI infra、AI超算集群方面,未来的发展趋势和创新技术是什么?

谢源:我简单把芯片产业做一个比喻,它就像写书、印书、装订书这样的过程,芯片行业需要整个产业链一起努力。

同时,我还想强调三个观点,一是摩尔定律,其实是指制造工艺领域每两年就有一个新的节点;二是Intel的tik-tock model,通过一年架构上的变化,一年工艺上的变化,每两年间接往前走,实现新的有竞争力的产品出现,在这种情况下,工艺很重要,但架构的设计也非常重要;第三是 “黄式定律”,就是每年GPU的算力都增加一倍,在过去的十年里面2的10次方就是1000倍,单靠摩尔定律没办法做到,而是系统地综合算法、软件、架构和工艺来实现。

02

开源大模型与企业级模型

相互促进,共同提高

宋春雨:大家一直非常关注开闭源之争,到底开源大模型会赢还是闭源大模型会赢,他们各自的优势和定位会是什么样?

陈冉:这是一个开放的话题,开源和闭源之争,其实是两种经济体或者商业模式的竞争,可以提高到实体经济和互联网经济的竞争。在美国,开源在技术创新中起到了非常大的作用。开源和闭源没有谁赢或者谁输的答案,但是它们永远会存在一个核心的目标,就是解决成本、劳动力、创新三大问题。开源能够实现成本共担、结果共享,并解决目标一致性问题。开源闭源的讨论不应仅限于代码贡献,而应上升到产业链和经济商业模式的问题,包括供需平衡。

可以确定的是,开源模式将在国内形成万人共创、更多企业参与的局面。这是因为大模型创业的成本和门槛都非常高。我们在社区分享时,老贺提出:“中国是否会由如今的百模大战变成千模大战?”,我的回答是绝对会。目前社区中已有超过30万的模型,这些模型的增长基于数据,一个模型利用数据产出另一个模型,增长是指数级的。

开源在国内解决万人共创的前提是将企业大模型的能力通过开源加固。但许多人无法自主可控且缺乏资金,例如拥有万卡资源的人数非常有限。因此,许多垂直领域的模型将由企业级开源模型产生。

开源与企业级模型是相互促进、共同提高的。最终,企业通过开源基础设施获得赋能。回顾历史,我们可以看到云计算时代AWS Cloud之后出现了OpenStack,通过开源实现了混合云。在AI领域,产业云、政务云、私有云的出现也是历史的重复,这个时代正在以开源的形式重新到来。

03

联想以全栈AI战略与产业机遇

推动AI赋能千行百业
宋春雨:今年Tech World上,联想发布了“全栈AI”战略。作为联想AIPC负责人之一,请您分享下联想如何看待大模型在中国的产业机会?联想又是如何战略布局的?
于海:我认为,AI是一个巨大的时代机遇,正逐步深入到各行各业和千家万户。中国在发展人工智能方面具备独特优势:产业覆盖全面、应用场景丰富。相信人工智能及大模型在我国的应用前景广阔,发展潜力巨大。
作为产品团队,我们肩负的责任是持续推动技术创新,AI产品和解决方案为核心,助力“全栈AI”战略的快速落地和蓬勃发展。推动AI产业和生态的繁荣发展,需要大家的齐心协力。目前,我们也在多个维度和领域与创投伙伴展开AI方面的技术突破和深度合作。
例如,在算力方面,我们和创投伙伴共同推动dNPU 的算力提升,有望大幅优化端侧AI的推理能力和效率;另外,在端侧模型的微调和开发方面,如何基于现有算力,让端侧的模型发挥更好的效能,也很重要,我们也在这方面与被投企业一起展开技术探索和开发。未来,我相信还有更多合作机会亟待我们共同发掘与开拓,也很期待和大家携手共同创造卓越的AI产品、应用和服务,为产业发展注入持续活力。

04

AI大模型开启产业智能化新工业革命

引领硅基智能新物种大爆发

宋春雨:大家看到生成AI过去20个月的快速发展,这会是一次新工业革命的开始吗?前三次工业革命都是代替人类的体力,这次实际上是代替人类独有的智能,大家对此有何期待?

姜大昕:我相信大模型一定会带来产业的变革。之所以选择创业,就是怕失去亲自参与这场变革的机会。
我做了16年的搜索引擎,最难解的就是常识和推理两个问题。本来以为这两个问题要几十年后才能解决,但大模型的出现提供了非常好的解题途径。
自然语言理解和生成的突破带来了许多应用。搜索已经发生了变化,不再是传统的给一个查询返回10个链接,而是提供答案。大模型不仅掌握了人类的语言,还掌握了机器的语言,即写代码,未来每个人都可以成为程序员。
我们也看到大模型带来内容生产门槛的大幅降低,随着Sora这样模型的出现,每个人都可以变成导演,将自己脑海中的创意拍成电影。大模型可以复刻专家的知识和技能,缓解教育和医疗资源的紧缺。还有很多例子,我不一一列举了。现在有一个新的说法,即新的图灵测试,以前的图灵测试是与机器对话,现在则是把一个模型放在网上,看它自己能否赚100万美金。
所以,我相信会有新一代物种在各行各业出现。硅谷有一个非常积极的预测,到2030年,大模型有能力完成现有人类工作的50%。
宋春雨:王院长,我们也想听听您的预测。您如何看待大模型技术?它会是一次全新的工业革命吗?它将如何重新定义行业价值和大模型的举措?
王仲远: ChatGPT的出现给我带来了两大震撼:理解和逻辑推理能力。自然语言处理中最难的是理解,而ChatGPT极大地提升了这一能力。GPT-4之后,逻辑推理能力又有了巨大的进度。
今年6月北京智源大会上,智源对人工智能技术发展做出了判断,2023年之前是弱人工智能时代,2023年之后开始进入通用人工智能时代。两者最大的区别在于,弱人工智能针对特定场景、特定任务收集特定的数据解决特定的问题,而通用人工智能越来越像人脑,未来有望进入各行各业,解决所有人类能解决的问题。
我们可以关注一些指标,比如,模型参数。根据生物学家的估算,人类大脑的参数是100万亿到1000万亿的神经突触。2018年的Bert模型,参数量在1亿左右,与人类大脑参数差100万倍。2020年GPT-3的参数量达到1750亿,与人脑参数相差1000倍。GPT4是1.8万亿参数,与人脑参数相差100倍。未来几年,我们可能会看到与人类大脑参数量相当的大模型。
另一个指标是数据。互联网文本数据已基本被被使用完毕,但仍有大量的多模态数据。随着算法的进一步突破,多模态数据将继续提升大模型的智能化水平,推动AI发展。
就模型智能化而言,GPT-4已能解决许多问题,现阶段的智能化水平作为TO B类辅助工具较为实际。我对未来发展趋势持乐观态度,未来五年可能出现C端的超级应用,但目前技术上还需进一步突破。
所以,我的判断是,大模型对于产业的影响,是一次类似于PC互联网或者移动互联网时代的机会,但是它的上限有可能是第四次工业化革命,这个周期更长,可能是三四十年的时间。
宋春雨:最后,于海能否分享一下联想的Smarter AI For All战略,以及联想在个人智能体和企业智能体领域的布局,还有联想如何探讨整个产业链的商业价值的快速飞跃?
于海:大模型正在推动大规模的产业变革。我们认为 “混合式人工智能”才是AI实现普及普惠,走向千家万户、千行百业的必由之路。个人智能体,可以被看作是每个人的数字延伸。个人计算正在转变为由人工智能赋能的个性化计算。通过用户行为数据的积累,个人智能体可以更好地理解用户意图,利用用户个人知识库中的相关信息,为用户提供个性化答案,准确分解任务、制定计划并驱动执行。我们推出的联想小天就是为个人用户打造的个人AI智能体,它已经应用在联想AI PC上。小天也将应用在其他众多的联想智能设备上,比如AI平板、AI 手机、AI配件等,借助“一体多端”策略,实现跨设备、跨平台的无缝应用,在确保个人数据和隐私安全的同时,连接开放的AI生态,小天智能体将满足用户更多样化的需求,更好的为用户服务
而企业智能体可以提供安全、高效、定制化的人工智能服务。利用企业长期积累的数据和知识,以及从企业内部的智能设备、智能边缘和私有云上的数据,通过学习、训练、推理和优化,支持企业在经营中实现更安全、更高效的决策和执行。联想提供的“擎天智能体”解决方案,已经在帮助众多企事业客户跨过AI应用的门槛、提升业务的效率,实现智能化的转型。
我们会持续推动AI技术的普及和应用,通过个人智能体企业智能体,赋能各个行业,惠及每位用户,实现“Smarter AI for All”的愿景。在创造巨大用户价值的同时,也必将创造巨大的商业价值。
宋春雨:感谢各位嘉宾的精彩分享。我简单总结下今天的三大研判:
第一,中国AGI发展关键在于中国自主创新的全栈AI能力。我们在算力、算法和数据方面未来五年还是有迎头赶上的机会。
第二,大模型能力的快速进步带来了第四次工业革命的曙光。“智力”代表人最终核心的差异化,真正的数智人的时代会到来,大模型的商业化将对全球和国家GDP作出增量贡献。
第三,AI大模型将端到端地重新定义数字世界和物理世界,引领硅基智能新物种大爆发。




推荐阅读




























联想创投
联想集团旗下的全球科技产业基金,专注于面向未来的科技产业投资,已投出上百家优秀企业,包括美团点评、宁德时代、蔚来汽车、旷视科技等;同时还孵化出拥有全球18亿用户的茄子快传,以及联想大数据、平安联想智慧医疗等10家优质子公司和创新业务。
 最新文章