万字长文 | 计算与AI (阿里云王坚最新演讲)

科技   2024-11-30 21:20   北京  

2024年11月27日,中国工程院院士、阿里云创始人王坚在阿里云香港峰会上发表题为《无尽的计算:AI和研究范式变革(2024)》的演讲。

以下是王坚的主要观点:讲述了计算科学时代的到来以及云计算和AI在未来研究中的重要作用。

  1. 计算科学时代的到来:

    • 新时代特征:王坚认为,目前人类已经进入计算科学时代,这个时代以计算能力和AI技术为核心,正在深刻改变科学研究、行业发展和经济创新。

    • 计算能力的重要性:计算能力成为衡量业务成功、创新和经济的标准,类似于上一代工业革命中的电力。

  2. 云计算与AI的融合发展:

    • 云计算作为计算基础设施:云计算等于计算基础设施,它提供了大规模的计算能力,是AI时代不可或缺的支撑。

    • AI扩展人类创造力:通过计算能力,AI能够扩展人类的创造力,进一步探索世界。王坚强调,创造力远远超出了智能的范畴,计算技术可以帮助人类实现更多可能性。

  3. AI技术的广泛应用与影响:

    • 改变研究方式:AI技术正在改变科学研究的方式,包括计算科学、材料科学等多个领域。

    • AI for Science人们通常所说的第五范式,即AI for Science,强调数据规模、模型规模以及计算规模,推动了科学研究的新发展。

  4. 技术伦理与安全挑战:

    • 整体系统看待AI:王坚提出,应将AI视为一个整体系统,包括其能力、机遇和风险,在推动技术发展的同时,也要关注伦理、安全和责任问题。

    • 确保AI福祉:通过技术和政策手段,确保AI的发展是为了人类的福祉,避免潜在的负面影响。

  5. 技术创新与规模效应:

    • 创新实例:王坚通过举例说明了技术创新如何改变行业,如NVIDIA的GPU在AI计算中的应用,以及AlexNet等深度学习模型的突破。

    • 规模改变根本:他强调,规模不仅仅是数量上的增长,而是改变了根本性的东西。数据规模、模型规模以及计算规模的增长推动了AI技术的快速发展。

  6. 云计算在AI时代的角色:

    • 解决算力规模问题:云计算是解决计算规模问题的最佳方法,它提供了灵活、可扩展的计算资源,满足了AI技术对算力的巨大需求。

    • 推动AI技术普及:云计算降低了AI技术的门槛,使得更多企业和研究机构能够利用AI技术进行创新和研发。

  7. 未来展望:

    • 计算与AI的无限可能:王坚认为,计算将为用户提供对未来AI无限想象的空间,推动人类社会向更加智能化、数字化的方向发展。

    • 主动拥抱变化:面对技术变革,我们应该主动拥抱变化,积极适应新技术带来的挑战和机遇。

总结:王坚院士在演讲中强调了计算科学时代的到来以及云计算和AI在未来研究中的重要作用。他认为,通过计算能力和AI技术,我们可以扩展人类的创造力,推动科学研究、行业发展和经济创新。同时,他也提出了技术伦理与安全挑战等问题,并呼吁我们在推动技术发展的同时,也要关注这些问题。最后,他展望了未来计算与AI的无限可能,并鼓励我们主动拥抱变化,迎接更加智能化、数字化的未来。


以下是王坚院士演讲全文:

孙教授、各位尊贵的嘉宾以及阿里云的朋友。

非常高兴能够在阿里云香港地区服务十周年之际与大家见面。今天,我想分享一下当前这个云计算与人工智能并存的时代有多么令人振奋,尤其是在科学研究领域方面。当我谈论研究时,这不仅仅局限于大学或研究机构的研究,而是涵盖整个行业的研究。

基本上,凭借我们今天拥有的技术,我们改变了做事的方式。几周前,我去了纽约参加今年的联合国大会。今年的主题是关于世界的未来,所以他们称之为“未来峰会”。

今年的会议通过了两份非常重要的文件。第一份是关于数字化转型。我们称之为《全球数字契约》。它关乎世界范围内的数字化及其重要性。

我个人参与了关于人工智能的文件,该文件名为《为了人类的人工智能治理》。这是该文件的第一句话。从这份文件中可以清楚地看出,人工智能实际上正在改变我们的世界。同时,人工智能也在改变我们进行研究的方式。

此外,该文件还提到计算能力。有趣的是,大家都意识到,如今计算能力仍然是我们进行人工智能工作最大的障碍。

而且,这份文件中提到的一个非常有趣的观点是,实际上,对于大多数人来说,他们是通过云来访问计算基础设施的。我想再次强调,从这个意义上说,实际上,云计算等于计算基础设施。今天,我们拥有大规模的云计算基础设施,这是一件非常好的事情。

随着AI和计算基础设施变得越来越重要,这就是为什么阿里云实际上可以在AI时代发挥重要作用的原因。

在峰会期间,实际上有来自世界各地的20人聚集在一起,虽然不是作为联合国会议的一部分,但我们确实使用了联合国大楼的会议室。我们在会上思考还能讨论些什么,还能向世界其他地区传达什么意识。

在Yoshua Bengio(图灵奖得主,Mila-Quebec AI Institute 创始人兼科学主任)的主持下,我们整个下午聚集在一起,制定了《曼哈顿宣言》。

我们希望确保世界对AI有一个共同的理解。我们在宣言中添加的内容是,AI的能力、机遇和风险应该在一个系统中被考虑。今天,我们经常谈论AI的安全性、AI的风险以及AI的伦理挑战。

但作为一名技术专家,我必须说,我们应该将AI视为一个整体系统,包括其能力、机遇和风险。特别是对于非洲的人们来说,他们面临的最大风险其实是建立这方面的能力。

您可以在Mila的网站上找到这份文件,读起来非常有趣。很多事情在几年内发生了变化。两年前,当我在B20担任数字转型组的联合主席时,我为那份文件写了另一篇序言。

在那之前,我说过,最终数字经济将通过你消耗的计算能力和耗电来衡量。电力更像是上一代工业革命中衡量业务成功的方式。但在数字经济中,随着所有AI技术的发展,最终计算能力将成为衡量您的业务成功、创新和经济的标准。

这一切发生得如此迅速,即使我在两年前就说过,但它来得太快了。因此,发生的变化不仅限于行业和经济,甚至对一些组织也是如此。我个人非常荣幸能作为奥林匹克AI议程工作组的一员参与其中。巴赫主席非常明确地指出,AI将改变奥运体育。

因此,AI不仅仅是一项帮助奥运会的技术,实际上,它是改变奥运体育的技术。当我们与巴赫主席讨论时,他非常明确地表示,现在是你主动改变还是被动被改变的时候了。国际奥委会决定积极主动地改变,而不是被动地接受改变。所以这不是一个选择的问题,而是你必须这样做。

这就是为什么当我们宣布奥林匹克AI议程时,实际上改变了奥运会。你可以看到,几个月前举行的巴黎奥运会中的运动员,从赛事的组织到帮助运动员的方式都发生了变化。

因此,由于技术,特别是计算和AI,世界正在发生变化。然后回到研究。研究是一个变化非常迅速的领域。当人们谈论某个领域可能发生的变化时,我认为技术创新是会被技术改变的领域。

这是科学杂志首次宣布今年诺贝尔物理学奖得主时的头条新闻。他说,出乎意料的是,事情发生得如此之快。第二点是关于AI先驱者的。如果你查看大西洋杂志网站上的文章,会很有趣,因为他发表了一个非常有趣的声明。

他说,这是AI的青霉素和X射线时刻。因此,当我们谈论伦理挑战和安全问题时,作者提出了非常有趣的观点。他基本上说,诺贝尔奖是授予那些为人类带来益处的人。

对我们来说,这是一个诺贝尔奖,它真正告诉我们AI对人类是有益的,AI对世界是有益的。所以这不仅仅是一个诺贝尔奖得主的故事。我真的喜欢他说的话,特别是关于X射线最初看起来非常危险,但今天它在健康方面帮助了我们。这是一个很好的例子,告诉我们如何确保AI是为了人们的福祉而工作的。

从技术的角度来看,这也是非常有趣的。你可能知道我实际上是心理学专业出身。但从今天的诺贝尔奖来看,我感到非常自豪,因为当《财富》杂志介绍获奖者杰弗里·辛顿教授时,杂志首先将他介绍为认知心理学家,然后才是计算机科学家。

我告诉了一些媒体朋友,我说他们基本上可以写一篇题为“心理学家赢得诺贝尔物理学奖”的文章。这是真的。我知道有一个人尝试问ChatGPT杰弗里·辛顿的研究工作是否真的是关于物理学的。他从未得到肯定的答案。这很难。

所以这是一个非常有趣的时期,让我们思考研究的面貌。这非常有趣。如果你看看媒体和他们获得诺贝尔奖的原因——因为AI——“AI”这个词从未出现在句子中。他们描述了工作,这就是为什么他们获得了诺贝尔奖。所以所有的媒体都在谈论AI的工作。但是如果我们看看诺贝尔奖委员会的说法,他们从未提及AI。

这是一个对我们目前所做的事情非常有趣的看法,但这基本上意味着这是一个新时代。仍然需要时间来了解发生了什么,它是什么。所有这些工作都要追溯到一篇几乎70年前由图灵发表的文章。每个人都知道图灵。但这个人非常有趣,这篇文章发表在一本心理学杂志上。

这是世界上第一篇讨论机器与智能之间关系的文章。首先,它提出了一个关于机器思维的问题。如果你看看文章中的一些词语,特别是这里特别强调的“数字计算机”和“人类计算机”,你可能对“数字计算机”这个词比较熟悉。你可能不熟悉“人类计算机”这个词。

但说实话,那时的电脑并不意味着一台计算机。所以计算机和上个世纪50年代,它实际上意味着一个人做计算。所以当时的人们,他们最终拥有机器的图灵和视觉可以做人类可以做的事情。这就是他所说的数字计算机。

但说实话,在那个时候,“计算机”并不指代计算机器。所以在20世纪50年代,计算机实际上指的是进行计算的人。当时的人们和图灵设想机器最终能否完成人类可以完成的任务。这就是他所说的“数字计算机”。

再次说明,在那个时代,“计算机”确实指的是人而不是机器。这就是为什么美国计算机协会实际上被称为ACM——American Computing Machinery。因此,“计算机”在20世纪50年代是一个新词。

在这个意义上,我总是说,AI有着悠久的过去,但它的历史却很短暂。因为早在20世纪50年代初,“AI”这个词就是在20世纪50年代末创造出来的。这是一个可以看到AI历史的时间段——我非常喜欢这一点,因为它停止在2020年,即ChatGPT发布之前。

这很有趣,你可以从它追溯到50年代初的时候看到,你也可以看到在2017年,一个叫做GPT的东西,你知道的。看起来不错,但从未忘记,在50年代初的一开始,AI并不是真正关于GPT的。那时没有人知道AI的真正含义,因为在50年代后期,还有一个词非常流行,他们称之为控制论。

有趣的是,你可以看到,当时间回溯到20世纪50年代初,你也可以看到在2017年出现了一种称为GPT的东西。但不要忘记,在20世纪50年代初,AI并不是真正关于GPT的。因此,当时没有人真正知道AI到底是什么意思,因为在20世纪50年代末,另一个词非常流行,那就是“控制论”(cybernetics)。

当时,“控制论”实际上就是指AI。因此,一群年轻人想要摆脱一个叫维纳(Noebert Wiener)的大人物,他是控制论的创始人,并去了叫做达特茅斯的小地方,并在研讨会上创造了“人工智能”(Artificial Intelligence)这个词。

如果你回顾AI的历史,你会发现“控制论”(cybernetics)这个词的频率与“AI”这个词的频率基本反映了哪个领域或AI是如何参与的,是控制论的思想占主导,还是最初的AI思想占主导。这非常有趣。

我个人非常幸运。我曾经听到过赫伯特·西蒙(Herbert Simon)的讲课。在我大学三年级的时候,赫伯特·西蒙来到我的学校,在我的系里做了一场关于AI的讲座。

想想看,作为一个20世纪80年代初期的三年级学生,有人告诉你,AI将在未来10年内成为大事,作为一个年轻的学生,我非常激动。但我当时等了10年,什么都没有发生。

将近40年后,又有人说AI在未来10年内将非常重要,我们将看到会发生什么。但这次,我相信会有重要的事情发生。原因是2017年发生了一些非常重要的事情,这与我们之前讨论的任何AI都不同。

再次强调,我现在谈论的AI是2017年之后的AI,而不是之前的。那之后发生了什么?每个人都知道这篇论文。它实际上是关于Transformer的。这篇论文发明了称为Transformer的技术。对我来说,不得不说,今天的AI等同于Transformer,而不是其他任何东西。他们之所以称这项技术为Transformer,是因为第一作者喜欢电影《变形金刚》(Transformers)。

很遗憾地说,即使是今天,我们也没有Transformer的中文翻译,因为很难翻译。问问欧洲的人,他们在德语中也没有Transformer的翻译。所以很难翻译,只是因为第一作者喜欢电影《变形金刚》。不过无论如何,这仍然是个好名字。

他们还发明了一个词叫做“Token”。Token是我们第一次能够测量数据量的概念。在此之前,我们知道如何用比特来衡量信息,但不知道如何衡量数据。但现在我们有了一个概念叫做 Token,所以我们知道如何衡量数据。再次强调,这就是为什么你按token付费给ChatGPT。但在此之前我们没有这个概念。同样,对于这个非常关键的词“token”,也没有翻译。

我们在中文中直接使用token这个词。所以这非常有趣——此外,这篇论文是在会议提交截止时间前2小时提交的。论文的标题看起来不太科学——《注意力就是你所需要的》(Attention Is All You Need)。而且这个标题之所以简单,是因为这篇论文的第三作者喜欢一首歌,叫做《你所需要的只有爱》(All You Need is Love)。听起来不太技术化。

但无论如何,他们写出了这篇具有里程碑意义的论文,改变了AI的格局。

更有趣的是,我会说,这篇论文发明了一家公司叫OpenAI。很不幸,当时所有这些人都在谷歌工作。但谷歌并没有发明像GPT这样的东西,实际上是OpenAI做到了这一点。所以我想说,这篇论文发明了OpenAI。这是一个非常令人兴奋的时刻。

尽管这个原始想法是在一家大公司内部产生的,但谷歌并没有从中受益,反而是初创公司受益了。这就是为什么它令人兴奋。大公司并不意味着你能做一切事情。当你有一个好主意时,个人也能做出伟大的事情。

这就是为什么当ChatGPT问世时,黄仁勋(Jensen Huang)说这是人工智能的iPhone时刻。

我想强调的是,iPhone并不是一部手机。打电话是iPhone最不重要的功能。所以从这个意义上说,人工智能已经不再是传统意义上的AI了。它变成了Transformer。

再次强调,iPhone并不是一部电话。从这个意义上说,AI也不再是传统意义上的AI了。所以,现在实际上是一个行业发生巨大变化的时刻。

回到研究,你可能听说过X射线时刻和iPhone时刻,但当AlphaFold首次出现时,他的研究被称为生物学家的ImageNet运动。因此,你可以想象,由于技术的发展,研究正在经历巨大的变化。什么是ImageNet?ImageNet实际上是关于数据的。这也是2012年由杰弗里·辛顿(Geoffrey Hinton)的两名学生发表的一篇开创性论文。

他们的工作称为AlexNet,以第一作者的名字命名。但我一直在追踪Alex的去向,但没有人知道他在哪里。所以从这个意义上说,第一作者并不是那么重要。第二作者可能是你熟悉的,第二作者是OpenAI的前首席科学家。第三作者是杰弗里·辛顿( Jeff Hinton),他刚刚获得了诺贝尔奖。

但这篇论文非常有趣。他们结合了三件事。这三件事在当时都不是新的。ImageNet在当时也不是全新的,它是由李飞飞创建的。CNN在当时也不是新算法,它已经存在很长时间了。

GPU也不是新的,因为当时人们用GPU玩游戏。但当他们把这三件事结合在一起时,神奇的事情发生了。当时,杰弗里·辛顿正在寻找相当于10000个CPU的算力。

想想2012年,对于一位教授来说,获得10000个CPU是非常困难的。他们得到了两张GPU卡,基本上获得了相当于10000个CPU的计算能力。这太不可思议了。这些GPU也并不是很昂贵的GPU,它们是你用来玩游戏的GPU,对每个人都是可用的。

但无论如何,当他们把这三件事结合在一起时,他们改变了世界。所以2012年之后,GPU成为了机器学习的标准。而在2012年这篇论文之后,NVIDIA将GPU作为行业标准。

所以我总是开玩笑说,NVIDIA并不是制定标准的公司,他们只是等待标准的到来。这也非常有趣。我总是说,NVIDIA并不是一家真正相信AI的公司,NVIDIA是一家相信计算能力的公司。最终,AI来了。所以当你思考创新时,两个学生和一位教授在大学里创造了一个行业的标准。

这就是我所相信的。他们也改变了我们对数据的看法。因此,数据将改变你对模型的看法。

然后回到有趣的事情,以及如何实际改变研究的方式。

你可以看到,这是我们改变研究方式的方法。你的问题是,我们从高性能计算硬件开始,我们有所谓的计算科学、材料科学等许多领域的工作。

在2000年代的某个时候,我们有所谓的数据驱动科学。今天,我们有一个新的领域,称为AI for  Science。这就是人们通常所说的第五范式。我对此思考了很久。计算科学和数据驱动科学到底意味着什么。

今天,我们谈论的是AI for  Science。我使用这张幻灯片是因为这两个词非常有趣,当你谈论这个问题时,他们强调的是规模。所以规模很重要。这不是指缩放定律,而是规模。当我们谈论使用数据来帮助解决问题时,这一点也非常有趣。

即使是高性能计算之父,Gordon Bell仍然认为最终高性能计算将演变成某种形式的云计算。 这就是云计算解决算力规模问题的方法。所以你可以考虑云计算是解决计算规模的最佳方法。

这是为了纪念Jim Gray出版的一本书。实际上,Jim Gray创造了“第四范式”这个词。但如果你阅读这本书,你会意识到这个范式从未成熟。数据只是数据。我们没有一个概念叫做token来衡量数据。这只是另一种思考如何帮助我们塑造科学研究后的方式。

但无论如何,是时候重新思考这一点了。再次强调,对于研究来说,规模很重要。规模的重要性不仅仅在于规模本身。

这是我从PASCAL语言的发明者那里得到的一句引言。PASCAL是我的第一门编程语言。

他基本上说,当任何东西乘以数千时,情况就会发生变化,不再仅仅是数量上的增长。规模不仅仅是规模,规模改变了根本性的东西。今天,为什么2012年杰弗里·辛顿的论文如此令人兴奋?这是因为一切都与规模有关——数据规模、模型规模以及计算规模。

基本上,我们正处于一个规模化的领域。因此,缩放定律只是大型语言模型中规模的一个应用。就是这样,一切都与规模有关。为了让你了解过去50年计算能力的增长情况,想想看,英特尔发明的第一个通用处理器单元CPU只有2000多个晶体管。

如果你将晶体管的数量视为计算能力的等价物,那么50年前只有2000个晶体管。但今天,如果你看看NVIDIA的处理器,它有超过2000 多亿个晶体管。这是一个巨大的数字。所以想想过去50年,仅在一个芯片上,我们基本上将计算能力提高了2000多亿倍。

还不提今天我们谈论GPU卡时,至少需要10,000张GPU卡来完成某些任务。所以基本上,这超过了2000亿倍。计算规模的增长是惊人的。但我要说的是,模型的复杂性和数据规模的增长基本上也是相同数量级的。

一个理论上的改变,改变了我们对世界的看法。

当我们谈论数据驱动研究时,我们之前做的研究是什么驱动呢?我会称之为假设驱动。所以人们根据自己的知识提出假设,然后进行研究。

我想用一个非常简单的例子来展示为什么数据改变了我们看待世界的方式。这两张图片是从阿波罗8号和阿波罗17号任务中获取的。实际上,第一位拍摄地球照片的宇航员名叫Bill Anders。

他有一句非常有趣的话,“我们来探索月球,但实际上我们发现了地球。”

右边的图片被称为“蓝色大理石”。这是人们第一次知道地球的样子,改变了我们看待地球母亲的方式。当Bill Anders说他们来探索月球时,这是假设驱动的。我们想着去月球了解月球的样子。

所以今天,我们有很多机会思考这些问题。但当你查看数据时,你会发现之前的假设完全错了。我们所想的与实际情况不同。这是我们告诉自己的。

但这个想法并不是新的。在登月计划之前,人们早就有了这种想法。当我们可以从全球视角看待世界时,这将改变我们对世界的看法。

再次强调,这张“蓝色大理石”的图片真正推动了地球系统科学这一重要研究领域的发展。“蓝色大理石”图片在地球系统科学中扮演了至关重要的角色,它改变了我们对地球的认识。

今天,如果你阅读地球科学教科书,你会发现这两张图片一起列出了它们是如何改变我们对世界的认识的。

还有更多类似的例子。人们熟知哈勃望远镜。但当哈勃拍摄一张照片时,这与我们用iPhone拍照是非常不同的。我相信,当你用iPhone拍照时,你知道那里有什么东西,你只是想捕捉它们。 

但对于哈勃来说,当我们谈论哈勃拍摄照片时,基本上它是在拍摄空白以发现未知的事物。今天,数据基本上告诉你,我们不知道里面有什么。我们要去发现一些东西。这很有趣。我们生活在一个世界中,可以做一些我们称之为数据的东西,但我们不知道数据里有什么。

但通过计算和AI技术,我们可以发现以前从未知道的事物。因此,用哈勃望远镜拍照与用iPhone拍照完全不同,因为用iPhone拍照时你知道那里有什么,但用哈勃望远镜拍照时,你不知道那里有什么,但因为你拍了那张照片,所以你发现了某些东西。

不管你信不信,所有哈勃的照片实际上都不是真正的照片。它们是通过计算能力合成的。原本并不存在这样的照片格式。

然后回到这张幻灯片。你可以看到,这些是科学中的第三个和第四个AI应用。实际上,它们都与计算密集型、数据驱动和基于模型的研究相关。这三个关键词,都与计算有关。

我会说,我们现在真正处于第三个范式的时代,我称之为计算科学。它是一种计算密集型、数据驱动和基于模型的协同。这是一个令人兴奋的时代。

然后我们回过头来看,我们正处于计算范式的早期阶段。这就是为什么云计算在未来的研究中可以发挥重要作用的原因。今年的诺贝尔奖基本上告诉我们,这个时代已经到来。

再次强调,AI并不是要取代人类——这是我坚信的。当你阅读科学杂志或自然杂志上的文章时,我得出一个结论:通过计算能力,我们可以利用AI扩展人类的创造力。

再次强调,创造力远远超出了智能的范畴。但计算技术可以帮助我们扩展人类的创造力,使我们能够探索周围的世界。

接下来的10年将会非常令人兴奋,我认为,计算将为你提供对未来AI无限想象的空间。

感谢您的关注。感谢您的时间。

来源:来源智能超参数、数字菁英网整理
编辑数据管理圈

审核:全域数字化转型高研院

声明:转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考,如有侵权或违反公众平台运营规范,请联系feedback@digitalelite.cn删除。

报名,请联系数字菁英,索取资料

电话:13366880230微信同


数字菁英网为百万数字中国的设计者和建设者服务,下有数据x全域数字化转型、全域数字化转型、数字菁英社、首席数据官GovCDO、数据管理圈GovCDO、数据质量万里行等,服务公共数据、数字政府、智慧城市、智慧社区、数字乡村等新生态。


点击阅读原文,即进入下载

数据x全域数字化转型
数字菁英网服务。智慧城市是发展数字经济的重要载体,推进城市全域数字化转型、数字政府、数据要素化治理以及公共数据开发应用等。数字菁英下有数据要素x全域数字化转型、数字菁英社、GOVCDO首席数据官、数据管理圈、全域数字化转型高研院
 最新文章