全程图文|诺奖得主哈萨比斯在梵蒂冈科学院演讲:AGI是人类理解宇宙的终极通用工具

文摘   2024-11-25 19:21   浙江  

👇关注公众号后设🌟标,掌握第一手AI新动态

本文内容整理自Demis Hassabis在梵蒂冈宗座科学院的演讲,公开发表于2024年11月12日。原始内容参考:https://www.youtube.com/watch?v=UX8uIW9oIZk

Demis Hassabis在梵蒂冈宗座科学院的演讲

内容导读

德米斯·哈萨比斯在演讲中主要阐述了以下观点:

  1. 人工智能加速科学发现: DeepMind致力于构建人工通用智能 (AGI),并将其作为工具加速科学发现。他提出了选择科学问题的三个标准:可描述为对巨大组合空间的搜索;明确的目标函数;可访问大量数据或高效模拟器。
  2. AlphaGo 及其对人工智能发展的贡献: AlphaGo 的成功证明了深度学习在解决复杂问题上的能力,其自我学习机制为现代人工智能发展奠定了基础。AlphaGo 不仅战胜了围棋世界冠军,还展现了创造性。
  3. AlphaFold 的成功及影响: AlphaFold2 成功解决了蛋白质折叠问题,预测精度极高,对药物发现和生物学研究产生巨大影响,其开源数据库已被广泛使用。AlphaFold3 进一步发展,能够预测蛋白质间的相互作用,为构建虚拟细胞奠定基础。
  4. 人工智能在其他科学领域的应用:  DeepMind 将 AI 应用于气候变化研究(天气预报、聚变反应堆控制)、新材料设计以及医学诊断等领域。
  5. 生成式人工智能和多模态基础模型:  DeepMind 在图像、视频和音乐生成方面取得了突破,并开发了多模态基础模型 Gemini,能够理解和处理多种模态信息,展现了更强大的通用性。
  6. Astra 项目和基于代理的系统: Astra 项目是通用 AI 助手原型,展示了 AI 在日常生活中协助完成任务的能力。未来,基于代理的系统将更主动地为用户处理事务,并结合世界模型进行规划和推理。
  7. 经典计算的潜力与量子计算的挑战: 哈萨比斯对经典计算的潜力表达了乐观态度,认为通过学习算法可以有效地建模大多数自然系统,这可能对复杂性理论和基础物理学产生影响。他认为,模拟量子系统并不一定需要“蛮力”计算。
  8. 人工智能发展的责任和伦理:  哈萨比斯强调人工智能发展需要负责任和安全,避免快速发展带来的风险,并倡导运用科学方法,谨慎而大胆地发挥人工智能的潜力,造福全人类。 他最终的梦想是将 AGI 作为理解宇宙的终极工具。

Demis Hassabis简介

德米斯·哈萨比斯(Demis Hassabis)是一位杰出的英国人工智能(AI)科学家和企业家。他因创立并领导DeepMind公司而闻名于世,DeepMind在2014年被谷歌收购。

哈萨比斯从小就展现出非凡的天赋,在国际象棋方面取得了令人瞩目的成就,成为一名国际象棋大师。 之后他攻读了剑桥大学的计算机科学学位,并获得了认知神经科学的博士学位。他的研究结合了人工智能、神经科学和游戏设计,致力于创造能够像人类一样学习和思考的智能机器。

DeepMind在哈萨比斯的领导下取得了一系列突破性的成就。最广为人知的是AlphaGo,它在2016年击败了世界围棋冠军李世石,标志着人工智能发展史上的一个里程碑。此后,DeepMind又研发出AlphaZero,能够通过自我学习掌握围棋、国际象棋和日本将棋等多种游戏,其算法的通用性和效率令人惊叹。DeepMind的技术不仅仅局限于游戏领域,还在医疗、气候变化等诸多领域展现出巨大的潜力,例如运用AI辅助医疗诊断和药物研发。

哈萨比斯被认为是当代人工智能领域的领军人物之一,他对于人工智能的未来发展有着深刻的思考,并积极倡导负责任地发展人工智能技术。 他的贡献不仅体现在技术突破上,更在于他将科学探索与商业实践巧妙地结合,推动了人工智能技术在现实世界中的应用。

2024年,哈萨比斯和John M. Jumper因在蛋白质结构预测方面的卓越贡献,共同获得了诺贝尔化学奖。

宗座科学院

宗座科学院(Pontifical Academy of Sciences)是梵蒂冈教廷设立的一个学术机构,致力于促进科学发展和科学与信仰的对话。它汇集了来自世界各地的杰出科学家,涵盖了众多科学领域,定期举办学术会议和研讨会,发表研究报告,对全球性科学问题进行探讨。其宗旨并非直接参与宗教教义的阐释,而是探索科学发现与宗教信仰之间的关系,促进理性与信仰的和谐统一。

演讲内容

德米斯·哈萨比斯:  非常感谢。能来到这里是我的荣幸。我将尽力在今天涵盖尽可能多的内容。我还准备了一张幻灯片放在最后,内容比较有争议,是关于量子和人工智能之间可能的关系。但我们看看是否来得及讲到它。

我的演讲主题是使用人工智能加速科学发现。DeepMind成立于2010年,正如大家所知,它是一项类似“阿波罗计划”的努力,旨在构建人工通用智能,我们称之为AGI。这意味着构建能够展现普通人类所有认知能力的通用人工智能系统。我认为这将是人工智能研究领域的一个巨大里程碑。DeepMind,现在是Google DeepMind,的使命是以负责任的方式构建人工智能,造福全人类。我们最初是从游戏入手的,许多人都知道。我们在2015年和2016年取得了第一个重大突破,那就是我们的程序AlphaGo,它是一个通过自我学习掌握围棋游戏的学习系统,并启发了我们今天看到的许多现代人工智能工作。

为什么围棋如此重要?你们大多数人都知道,深蓝在90年代击败了加里·卡斯帕罗夫,但这之后又花了20年才破解围棋。原因是围棋比国际象棋复杂得多。复杂性的一种体现是围棋有10的170次方种可能的棋局,这当然远多于宇宙中的原子数。因此,不可能枚举所有可能性来确定特定游戏中最佳的落子。事实上,人们认为围棋如此复杂,至少还需要十年甚至更长时间,围棋程序才能击败职业棋手,更不用说世界冠军了。2016年,我们在韩国首尔进行了一场著名的百万美元挑战赛,全球超过2亿人观看了这场比赛。AlphaGo以4比1的比分赢得了比赛,它不仅赢得了比赛,而且还采取了一些以前从未见过的创造性新招数和策略,即使人类已经玩围棋超过3000年,专业玩围棋也有几百年了。

现在我将快速概述AlphaGo的工作原理,因为这对于我谈论当今人工智能前沿的未来非常重要。我们训练AlphaGo及其后续版本(我们称之为AlphaZero)的方法是,从一个随机初始化的神经网络开始,让它与自己进行10万场游戏。这创建了一个数据集,用于训练系统的第二个版本。第二个版本的目标是预测第一个版本在特定情况下会采取哪些行动,以及最终各方获胜的概率。

通过预测这两个方面,我们可以将巨大的搜索空间限制在合理的时间范围内可以处理的范围内。在用第一个版本的数据训练第二个版本后,如果它显示出具有统计意义的改进——在本例中,胜率为55%——我们将用第二个版本替换第一个版本,并重复此过程。这个自我学习系统经过了17次迭代,从随机游戏进化到在围棋游戏中比历史上任何实体都要强大,所有这些都只用了现代计算机不到8个小时的时间。实时观察这种进化过程非常令人难以置信。

我们使用游戏作为试验场,因为它们非常适合快速演示算法思想和评估进度。它们有明确的指标,例如赢得比赛或获得分数。然而,游戏只是手段,我们的最终目标是开发可以应用于现实世界问题的通用算法,而不仅仅是在游戏中表现出色。我们在各种游戏中取得了里程碑式的成果,从简单的Atari游戏到复杂的即时战略游戏。像AlphaZero这样的程序不仅可以玩围棋或国际象棋,还可以玩任何两人完美信息游戏,其水平都超过了世界冠军级别。

在这些突破之后,特别是在2016年到2017年左右,我们开始将注意力转向更严肃的问题,并使用我们在游戏中学习的技术。我一直热衷于将人工智能作为一种工具来帮助我们加速科学发现。在选择适合这些方法的问题时,我通常会寻找三个标准:能够将问题描述为对巨大组合空间的搜索;一个明确的目标函数来优化;以及能够访问大量数据或一个准确且高效的模拟器来从正确的分布中生成合成数据。许多科学问题都可以这样表述。

我在20多年来一直关注的一个突出的生物学挑战是蛋白质折叠问题。这涉及到仅根据氨基酸序列预测蛋白质的三维结构。大多数生物学家都知道这一点,但对于不熟悉的人来说,你从一个序列(蛋白质的基因序列)开始,目标是预测其复杂的3D形状,这揭示了关于其功能的大量信息。解决这个问题可能会对药物发现和我们对生物机制的基本理解产生重大影响。

2020年,我们推出了AlphaFold2,专家们称其为对这一长期存在的计算生物学问题的解决方案。我们对大多数蛋白质的预测平均误差小于一个埃。这种精度至关重要,因为它需要与实验误差相竞争,这使得它对生物学家非常有用。

因此,我们继续研究,并在接下来的几年里,由于这个系统不仅准确,而且速度非常快,我们最终折叠了目前科学界已知的全部2亿个蛋白质。我们继续折叠每年发现的所有新的基因序列,并将它们添加到一个开源数据库中,供所有人免费使用,我的几位同事在欧洲的EMBL EBI维护着这个数据库。超过200万名生物研究人员和医学专家使用了这些预测结果,到目前为止,它已被引用超过25000次。因此,它对结构生物学领域产生了巨大的影响。

我们还在某些项目上进行了合作,屏幕上列出了一些。我尤其为我们与被忽视疾病合作而感到自豪,特别是与世界卫生组织(WHO)的一部分——药物发现与开发倡议(DNDI)的合作。在这个倡议中,我们关注的是世界较贫穷地区,特别是全球南方被忽视的疾病,我们可以通过提供病毒或细菌中蛋白质的结构来加速药物发现。这使得研究人员能够直接在大型制药公司没有投资的领域进行药物发现。

看到科学家们将这些预测和底层模型用于各种各样的应用,这让我非常欣慰。我们仍在不断改进这些系统;我们在今年早些时候发布了AlphaFold3。我们现在试图认识到生物学不是一个静态系统。AlphaFold2提供了这些蛋白质结构的静态快照,但生物学是动态的。

真正重要的是这些结构和分子如何相互作用。AlphaFold3代表了我们朝着理解这一点迈出的下一步,它可以预测蛋白质之间、蛋白质与小分子(包括药物分子)之间以及蛋白质与RNA或DNA之间的成对相互作用。这项工作使我们能够开始考虑在未来十年内构建虚拟细胞,甚至模拟虚拟细胞的可能性。

我们还做了很多比人工智能与生物学更广泛的工作。这里只是我们从事的一些科学和数学工作以及医学工作的选择,例如根据视网膜扫描诊断视网膜疾病。我们还做了很多有助于应对气候变化的工作,包括与洛桑联邦理工学院(EPFL)合作,在控制等离子体和聚变反应堆方面开展工作,以及天气预报。我们有一个最先进的天气预报系统,称为GraphCast,它比传统的Navier-Stokes方法更准确、更快速地预测10天天气。我们还在做一些事情,例如设计具有新特性的新材料,并试图提前预测这些特性。

这就是我们在人工智能用于科学方面所做的工作。还有一个分支,那就是通往AGI的道路,以及用于创造力和生产力的工具。我们也一直在研究所有这些类型的工具。当然,你们都会熟悉生成式人工智能模型。我们在图像生成、视频生成和音乐生成方面都有我们自己最先进的模型。

我们现在都已经习惯了,但回过头看五到十年前,你会觉得这仍然令人难以置信:AI系统仅凭文本提示就能生成逼真的图片、视频和其他创意作品,例如音乐。当然,现在很多关注点都集中在我们所说的多模态基础模型上。基础模型比大型语言模型更通用,我相信你们都使用过并与之交互过,例如聊天机器人。这是下一代技术,我们的Gemini项目就是其中最强大的代表之一。

Gemini不仅可以对文本进行推理,还可以对图像、音频、视频和代码进行多模态推理。它将我们人类交互使用的所有这些不同模态整合在一起。我认为,要使一个系统真正有用,它必须理解我们所处的完整语境。

我们今年启动的一个原型项目,也是一个非常令人兴奋的原型项目,就是我们所说的Astra项目。这个项目体现了通用AI助手的理念,它可以帮助我们处理日常生活,协助完成推荐商品或处理你不愿处理的行政事务等任务。此外,它甚至可以作为科学研究助手。

这里我有一个简短的2分钟视频演示它的效果。这是一个非常早期的原型,展示了基于Gemini构建的Astra项目系统在现实世界中能够展现的各种能力。

Gemini:   让我们做一些测试。看到发出声音的东西时告诉我。我看到一个扬声器,它会发出声音。扬声器的那个部分叫什么?那是高音喇叭。它发出高频声音。给我一个关于这些的创意叠字。创意蜡笔快乐地着色。它们当然能制作出五彩缤纷的创作。

这段代码的功能是什么?这段代码定义了加密和解密函数。它似乎使用AES-CBC加密根据密钥和初始化向量(IV)对数据进行编码和解码。没错。你认为我在哪个街区?这似乎是伦敦国王十字区。伦敦。它以其火车站和交通连接而闻名。

你还记得你在哪里看到我的眼镜吗?是的,我记得。你的眼镜在桌子上的红苹果旁边。我可以在这里添加什么来加快这个系统的速度?在服务器和数据库之间添加缓存可以提高速度。这让你想起了什么?

德米斯·哈萨比斯:  你可以看到,这仅仅是一个完全理解你语境的助手所能帮助你的开始。所以这就是开始,现在它有点有趣。但是你可以想象一下,这可能会成为你在日常生活中在玻璃或某种外形上使用的工具,它会一直陪伴着你。

那么,未来的发展方向是什么呢?我认为,未来一两年内你将看到下一个重大突破,我们正在为此努力工作,那就是我们所说的基于代理的系统。这些系统不仅可以进行问答,被动地回应你的问题,还可以主动为你处理实际事务。这些系统可以进行规划和推理,它们可以在现实世界中行动,并且可以为你执行任务或解决目标。

我们真正需要的是将我一开始向你们展示的AlphaGo系统和目前的Gemini模型结合起来。这就是我们正在努力的方向:将这些规划系统的优势与Gemini这样的世界模型相结合。你不再是在游戏模型上进行规划,而是在语言和这个多模态模型上进行规划。

现在,让我们在最后几分钟回顾一下,或许可以稍微有点挑衅性,当然是对上一节中发表精彩演讲的量子计算领域的同事们表示极大的尊重,我一直思考——实际上从AlphaGo开始就一直在思考——我们到底在做什么,经典系统的极限在哪里?我认为可以公平地说,经典图灵机能够做到的事情比我们之前想象的要多得多

这让我思考这个问题,我认为我们有点像图灵的捍卫者,你知道的,挑战着经典系统——由图灵机体现——所能做到的极限。教授Block提到的某件事让我想起了许多量子计算人员看待经典计算的方式,似乎存在一种看似合理,但在我看来有点过时的观点,即模拟量子系统需要天真地蛮力计算。

实际上,我认为可以通过对现有底层结构进行建模来更优雅地实现这一点。除非,当然,你可能处于没有底层结构的情况,然后你只能枚举所有状态。如果所有状态都确实是独立的或随机的,那么就没有结构可学习。我的推测是,大多数自然系统,或者也许所有,但我认为几乎所有,以及自然界中出现的模式都具有一些潜在的结构,这些结构可以通过经典算法或学习算法有效地发现和建模。

如果这是真的,我认为这可能对复杂性理论产生重大影响,包括P=NP问题,甚至是一些基础物理学以及信息和熵的定义等。这在接下来的咖啡休息时间讨论一下可能会很有趣。复杂性理论家们忽略的一件事是在测试时寻求解决方案之前进行大量的预先计算。

这实际上就是这些神经网络模型的工作方式:我们在预先进行大量的预计算,训练模型,然后在测试时以非常有效的方式使用模型来回答新颖的问题。我认为这使我们能够克服人们对传统计算系统的一些传统看法。

然后,我将以责任问题结束,我们在昨天的讨论中多次谈到这个问题。我认为人工智能具有帮助解决人类面临的重大挑战(从医疗到气候)的巨大潜力。但当然,它必须以负责任和安全的方式构建,并用于造福所有人。正如我昨天提到的,对于昨天参加演讲的各位,我认为我们不应该快速行动并破坏人工智能。我认为这太重要了,这是一项太深刻的技术。相反,我们应该非常依赖科学方法。我认为像AGI这样的变革性技术需要特别的谨慎,几乎是对其能力的敬畏,但我们也需要大胆地发挥其潜力,以便我们能够获得社会迫切需要的全部好处,以应对我们面临的一些最大挑战。所以,我认为我们需要大胆且负责任。最后,从最终目标来看,我的梦想一直是,如果我们构建了AGI,那么你可以把它看作是帮助我们理解宇宙的终极通用工具。谢谢。

参考资料: https://www.youtube.com/watch?v=UX8uIW9oIZk,公开发表于2024-11-12

关注公众号后设🌟标,掌握第一手AI新动态

往期精选

  1. 黄仁勋专访:OpenAI在大模型混战中达到“逃逸速度”
  2. 李飞飞与Justin深度解读空间智能:数字世界需要三维表征,才能与现实世界融合
  3. PayPal创始人彼得·蒂尔:人类科技停滞源于原子方面的进展远慢于比特
  4. 谷歌联合创始人布林:巨头们打造的“上帝模型”几乎可以理解一切
  5. 马斯克:AI将使商品和服务的成本趋近于零
  6. Karpathy最新专访:人形机器人、特斯拉、数据墙与合成数据


瓜哥AI新知
紧追AI业界一手观点、访谈、动态,点滴构建AI底层认知
 最新文章