(关注公众号并设为🌟标,获取最新人工智能资讯和产品)
全文约5,000 字,阅读约需10 分钟
在一次近期的技术峰会上,Google DeepMind首席执行官兼新晋诺贝尔化学奖获得者Demis Hassabis接受泰晤士报的采访。Hassabis对人工智能的发展前景充满信心,当然无可厚非也保持着谨慎的态度。
"从现在开始,我们还需要两到三个重大的创新,才能真正实现通用人工智能(AGI)。"Hassabis表示,"这也是为什么我倾向于给出10年的时间框架。尽管我的一些同行认为可能会更快,但我认为10年是一个更为合理的预估。"
Hassabis回顾了人工智能的发展历程,从90年代的"AI冬天"谈起。那时,主流的AI系统是基于逻辑的专家系统,如著名的"深蓝"战胜国际象棋大师卡斯帕罗夫。然而,这些系统本质上是脆弱且有限的,无法学习或发现新事物,这也导致了AI发展的停滞。2010年,DeepMind的成立标志着AI发展的新纪元。Hassabis解释道:"我们的想法是结合深度学习和强化学习,构建一个自我学习的通用系统。同时,我们也利用了GPU等硬件加速技术,推动了AI的快速发展。"
未来的AI应用场景:"想象一下,你只需用相机指向某个物体,AI就能理解你周围的环境,识别物体,甚至记住重要物品的位置。未来的AI助理不仅能回答问题,还能在现实世界中执行任务,如帮你计划假期、安排旅行、订票等。" 为了实现这一愿景,Hassabis强调了几个关键的发展方向:"我们需要提升AI的规划、推理和行动能力,同时改进其记忆功能,使其能够记住用户的偏好,提供个性化服务。这些技术都还需要进一步的突破和发展。"
视频时间轴
2:46 回顾2010年
3:40 专门的人工智能模型
7:41 多模态
11:37 Astra 和通用助手
14:48 迈向 AGI 的步骤
19:32 希望与炒作
22:39 未来愿景
文稿整理
泰晤士报记者: 我的意思是,我想在座的几乎每个人都知道 DeepMind 以及它现在在做什么。
40年AI发展历程
泰晤士报记者:让我们从你的故事开始吧。有趣的是,你大概在 2010 年左右开始了这个项目。在那之前,我们经历了 40 年的 AI 冬天,人工智能并没有发生太多进展。作为一名科学记者,我并不经常考虑人工智能这一领域。那么,你认为当时为什么 DeepMind 会出现?时代精神对你有利吗?
嘉宾Demis Hassabis: 嗯,我实际上已经从事人工智能研究超过 30 年了。最开始我是在游戏和模拟游戏中制作 AI,然后我学习了计算机科学和神经科学。我一直在关注人工智能领域的发展。在 90 年代,正如你所说的 AI 冬天,那个时候的主流是逻辑系统,通常被称为专家系统。你们中的许多人可能还记得 Deep Blue 击败国际象棋大师卡斯帕罗夫的事件。这些所谓的 AI 系统其实并不智能,基本上是程序员和系统设计者通过预先编程的规则来解决问题。计算机只是机械地执行这些预设的启发式方法和规则,导致它们非常脆弱,无法学习任何新的事物,当然也无法发现任何新事物。它们受限于设计者或程序员事先知道的东西。所以在整个 90 年代,在剑桥和麻省理工学院学习时,逻辑系统被广泛认为是人工智能的发展方向。我认为这也是 AI 冬天出现的原因之一,因为这些系统本质上是脆弱且有限的。
泰晤士报记者: 听起来你对这些早期的系统持批判态度。那么,DeepMind 的想法是如何在 2010 年萌芽的?
Demis Hassabis: 2010 年 DeepMind 的想法是,我们可以利用当时刚刚在学术界出现的深度学习技术,再加上强化学习——这是一种我们从大脑和多巴胺系统中了解到的学习机制。包括人类在内的动物正是通过强化学习来学习的。所以对我来说很明显,我们需要构建一个自我学习的通用学习系统。这就是 DeepMind 的起源。此外,GPU 和硬件加速的技术也在那时兴起,我很早就意识到可以利用 GPU 来处理计算任务。世界上的一切都可以通过矩阵运算来实现,而 GPU 正是为此设计的。所以,我们很快地开始了这项工作,把所有这些新兴的技术和概念整合起来,我们觉得这就像阿波罗计划一样,是一个重大的努力,我们也确实快速取得了进展。
泰晤士报记者: 当你在 2010 年有了这个愿景时,你有想过 15 年后,你会站在这里,向满屋子的听众讲述人工智能的巨大成就吗?比如,我们已经解决了蛋白质折叠问题?
Demis Hassabis: 是的,这确实是我们早期的计划。我们在 2010 年开始时,认为大概需要 20 年才能实现通用人工智能(AGI)。当然,过程中有一些小插曲和意想不到的挑战,但总体上我们一直朝着这个方向前进。蛋白质折叠是我一直想要解决的科学问题,它位列我的研究目标清单之首。我认为这将是变革性的突破。
AlphaFold获得化学奖
泰晤士报记者: 听起来非常令人兴奋。我们稍后可以深入谈谈 AGI,因为这的确是个引人入胜的话题。自从 ChatGPT 出现以来,我们作为一个社会一直在热议人工智能。但实际上,这与你一直在研究的人工智能有很大不同。到目前为止,你的人工智能更多的是具体的应用,作为一个观察者,这显得有些奇怪。你最开始做的事情,比如在电脑游戏上表现出色,似乎有些“不务正业”。虽然我不会说这些事情毫无意义,但它们更像是为了娱乐,对吧?
Demis Hassabis: 是的,我们确实从游戏开始。这部分是因为我有制作游戏和下棋的背景,非常认真地对待这些事。不过,我也看到游戏与人工智能的关系源远流长。从图灵时代到人工智能的黎明,再到香农,许多伟大的人工智能先驱都从国际象棋程序入手。国际象棋被认为是 AI 系统的试验场,就像果蝇是生物学实验中的典型研究对象一样。对于我们来说,游戏一直是一个测试场地。我们可以快速验证算法的进展,并通过比赛结果来基准测试你所处的水平。比如,如果你能击败世界冠军或最好的计算机,那就说明你的算法做得很好。但关键是,游戏只是一个手段,而不是最终目的。我们的目标一直是发展通用的人工智能,而不仅仅是击败围棋或国际象棋的世界冠军。我们希望这种通用性能够扩展到其他领域,尤其是科学和商业应用。
我们在 AlphaGo 上的工作,以及后来的 AlphaFold,都是基于这种通用的深度强化学习系统。即便是今天,我们仍然在使用这些技术。当你看到 AlphaFold 解决了蛋白质折叠的问题时,真正让人感兴趣的不是具体的解决方案,而是结果本身。如果我们找到了一种治愈癌症的方法,没人会在乎这个方法是如何实现的,大家只关心它是否有效。所以,在研究这些问题时,我们会使用所有的通用技术作为基线,然后根据具体领域的需求进行定制优化,这也是我们如何开发出像 AlphaFold 这样的突破性项目的方式。但最终,DeepMind 的目标依然是我们最初设定的目标——那就是开发出一个通用的人工智能系统,这种系统能够像人类一样完成任何认知任务。正如艾伦·图灵在 1950 年代所设想的通用图灵机,它能够计算任何可计算的事物,这也是人工智能的最初目标。
作为一个领域,这就是 DeepMind 的目标。当然,最近你也看到了一些类似语言模型的技术,显然 ChatGPT 已经在大众市场上掀起了巨大的波澜,几乎每个人都知道它并且在使用它。然而,所有顶级实验室,包括 Google 和 DeepMind,实际上都在研究语言模型。我们有自己的内部平台,叫做 Claude,Google 也有他们的系统,所有这些都基于 Transformers 架构——这是 Google Research 发明的架构。目前所有的模型都是基于这个架构的。这是一个激动人心的时刻,因为语言显然是一种通用的功能,这也是为什么大家对聊天机器人感到如此兴奋。很有趣,也有点出乎意料,这项技术已经发展到如此强大,并且能够扩展。因此,我认为我们比以往任何时候都更接近构建一个通用系统。然而,现在你仍然需要专门的系统来完成某些特定领域中的顶尖任务,距离实现通用人工智能(General Intelligence)还有一定距离。
对我来说,像 LLM(大型语言模型)这种系统已经更接近于与人类互动的体验,而这正是我对 GI 的理解。但我认为,如今单用 LLM 这个词已经不太合适了,因为它们不仅仅是大型语言模型,它们是多模态的系统。比如,我们的 Gemini 模型从一开始就是多模态的,能够处理各种输入,包括视觉、音频、视频、代码和文本。所以,我认为这些多模态能力将是构建 GI 系统的关键组成部分,但它们本身可能还不足以完全实现 GI。我认为,从现在开始,我们还需要两到三个重大的创新,才能真正实现 GI。这也是为什么我倾向于给出 10 年的时间框架。尽管我的一些同事和竞争对手认为时间可能会更短,但我认为 10 年是更合理的预估。
泰晤士报记者: 这也许反映了 DeepMind 内部的一些紧张关系。我记得在早期,你提到 DeepMind 类似于世界上资金最雄厚的大学实验室之一,像是贝尔实验室,或者其他伟大的商业研究机构之一。但如今,你们做的事情非常有实际意义。你提到了蛋白质折叠,你们也在研究天气预报,还在国际数学奥林匹克竞赛中获得了银牌。
Demis Hassabis: 我确信如果我自己去参加,可能会拿到金牌(笑)。但确实,我们的系统获得了银牌。我们现在正致力于多个不同的领域,包括科学、数学和医学,以及其他一些应用科学领域。此外,我们还在生产力和商业应用上投入了大量精力,比如聊天机器人、重新设计工作流程、处理电子邮件等。这些都处于非常初期的阶段,但它们展现了巨大的潜力。我们现在做的事情正如你所提到的,类似于谷歌的引擎室。谷歌拥有 15 亿用户,而人工智能是推动这些服务和产品的核心技术。所以,我们现在所经历的这段时间非常激动人心,技术已经非常成熟,可以应用于各种场景。我们在 DeepMind 开发的一些技术一直在推出新功能。这真的是件很棒的事情,因为你现在需要的产品技术类型,实际上大约有 90% 类似于我们正在进行的 GI 研究。因此,很多东西已经融合在一起了。如果是在 5 年前或者 10 年前,如果你想把人工智能构建到一个产品中,你必须依赖逻辑网络和专家系统,因为通用系统和学习系统还不够强大。
泰晤士报记者: 确实,那时候的 AI 系统非常有限,比如 Alexa 那样的语音助手,它们还是基于旧的技术架构,这就是为什么它们看起来很脆弱,无法泛化,使用起来也不太便利。
Demis Hassabis: 没错。而基于这些学习系统的新一代助手将会更加强大,这让人感到非常兴奋。我认为像 Gemini 这样的多模态助手,或者我们自己未来的多模态助手 Astra,都是通向 HGI 系统的重要一步,因为这些助手将推动研究走向那个方向。
谷歌文生视频产品Astra
泰晤士报记者: 哦,听起来非常有趣。你提到有一个 Astra 工作的视频可以展示给我们看吗?
Demis Hassabis: 我们有一段 Astra 工作的视频,不过我们现在可以先做一些测试,看看它的表现如何。告诉我,当你看到发出声音的东西时,你会联想到什么?
【视频展示】
泰晤士报记者: 哇,看起来真是不可思议。
Demis Hassabis: 你看,这就是我们所谓的“开始”——一个基本上通用的助手,它可以在日常生活中帮助你完成各种任务。我们可以在这里暂停视频,这样你也能看到这个系统会有不同的外形尺寸,比如它可以在手机上显示,或者像你知道的那样,在智能眼镜上显示。想象一下如果五年前有人告诉你,未来的技术会发展到这种程度——你只需要用相机指向某个物体,它就能够理解你周围的环境。这种技术的进步真是让人感叹,它已经具备了某种概念性的理解,知道物体是什么,甚至能从窗外的随机视角识别出我们所在的社区。比如,它还能够记住你把某些重要物品放在哪里。
泰晤士报记者: 这真的很实用,特别是在日常生活中。
Demis Hassabis: 对,一个个性化助手可以做很多事情,这就是我所说的“下一代通用助手”。它可以伴随你出现在不同的设备上,无论是帮你玩游戏、在桌面上工作,还是在手机上滑动屏幕。无论你在哪儿,都是同一个助手。
泰晤士报记者: 你认为这与我们距离实现一般智能还有多远?
Demis Hassabis: 我认为这是通向一般智能(GI)的一步。有人可能会说,我们还有一些核心技术没有突破,比如那些无法用现有方法解决的问题。我们现在可能完成了 70%,然后又到了 80%,甚至 90%,但还需要解决最后的难题。很多聊天工具还很被动,通常只能问答。现有的系统仍然大多数是问答系统。这些系统在回答问题、做一些研究、总结文本方面非常有用,类似的任务它们都能胜任。但我们接下来想要的是更多基于代理的系统,能够实现你给它设定的目标或任务。这显然是一个有用的AI助理应该能够做到的事情,比如帮你计划假期、安排城市旅行、为你订票等。它们不仅要回答问题,还要能在现实世界中行动并执行任务。
所以我们需要具备“规划、推理、行动”的能力。我们还需要更好的记忆功能,能够记住你告诉它的内容,了解你的偏好,并根据这些信息为你提供个性化服务。所有这些技术现在都需要进一步发展。我们在一些游戏程序中已经具备了这些功能,比如 AlphaGo,它在围棋这个狭窄领域中有规划和推理能力,并且成为了世界冠军。现在,我们需要把这些技术应用到像 Gemini 这样的多模态模型上。Gemini 基本上是一个能够理解周围世界的“世界模型”,但我们需要解决的问题是,如何在现实世界的复杂环境中进行规划,而不是像游戏那样的干净设置。
通用性AI助手
泰晤士报记者: 所以你认为这会是下一个重大突破吗?你们的助手系统是否也能够达到像 AlphaGo 在棋局中那样的水平?
Demis Hassabis:是的,确切地说,我们的目标是实现类似的水平,并将其应用到更广泛的领域,比如蛋白质折叠、科学研究等。目前关于如何实现这一目标有两种可能的途径,这是我们内部和研究界正在进行的一个非常有趣的辩论。其中一件关键的事情是代理系统应该具备的能力之一是“工具使用”。这些工具可以是软件,也可以是硬件,比如机器人或其他物理世界中的设备。这些工具当然也可以是其他软件,比如像计算器这样的工具,它们也可以是其他人工智能系统。所以你可以想象一个通用的人工智能系统,比如说像“大脑”一样,然后调用像 AlphaFold 或 AlphaGo 这样的系统来玩围棋或折叠蛋白质。因为一切都是数字化的,所以你可以将这种能力整合到 Gemini 这样的通用大脑中。
但这样做需要权衡,因为如果你把过多专门的信息融入到系统中,比如说加载了太多的国际象棋数据,这可能会导致语言能力下降。所以你必须考虑是否要将某些任务拆分成工具,或者让通用 AI 在特定情况下使用这些 AI 工具,还是要把它们直接集成到主系统中。对于某些任务,比如编码和数学,直接集成到主系统中实际上能让它在所有方面表现得更好。
泰晤士报记者: 听起来很复杂,你提到了关于学习和儿童发展理论的研究,这似乎也与这一问题相关。
Demis Hassabis: 确实有许多关于学习和儿童发展的研究在探讨什么样的任务在主系统中表现得更好,而不是作为外围工具。我们依然是一个科研导向的组织。虽然我们有越来越多的产品应用组,但 Google DeepMind 的核心始终是基础研究。Google 的其他部门也试图保护我们的基础研究,这样我们可以从长远的角度思考问题,而不仅仅是被产品路线图所引导。
泰晤士报记者: 那你个人是如何跟上这些快速发展的研究领域的呢?
Demis Hassabis: 我尽量保持我的节奏。以前我总是在晚上工作,直到大约 18 个月前,我的习惯是把午夜到凌晨 3 点的时间保留给自己,用来思考、阅读论文、提出想法。现在我的团队大部分在加利福尼亚,所以很多时间被会议占用了,我不得不重新安排我的时间。
泰晤士报记者: 看起来你已经适应了这种改变。那么,你如何看待未来?我记得你签署了一封公开信,警告关于人工智能的潜在生存风险。
Demis Hassabis: 确实如此。我从很小的时候就相信人工智能会对世界产生巨大的积极影响。正是这种信念驱动了我这么多年的努力。我相信人工智能可以治愈所有疾病,帮助应对气候变化,发明新的材料和能源技术。它也能够提高我们的生产力,自动处理繁琐的日常事务,使我们的生活更加丰富。但是,人工智能系统也有风险。我们正在开发非常强大的新技术,而我从 AlphaGo 的开发中看到了它的力量。就像下棋一样,AlphaZero 在早上开始时完全是随机的,到了午餐时间,它已经能够击败世界冠军,到了下午,它就已经比最好的硬编码国际象棋计算机还要强,仅仅在八个小时内达到了这一水平。
泰晤士报记者: 这真是太令人惊讶了。
Demis Hassabis:这只是一个游戏,范围很窄。但我不认为有任何理由认为这种能力不能扩展到更通用的系统,比如语言模型或世界模型。我相信,这种能力将在不久的将来被广泛应用。这项技术将会非常强大,但必须谨慎处理。我认为我们现在还不完全了解它的潜在风险,这也是我签署那封公开信的原因之一。我只是想让大家更加重视这个问题。并不是说没有什么可担心的,实际上确实存在一些未知的风险。我们需要时间来解决这些问题,我认为我们还有时间,但 10 年的时间并不算多,尤其是对即将到来的变化来说。因此,我们需要做更多的研究,比如在可控性方面,了解这些系统在理论层面上的作用。我们需要弄清楚如何定义系统的目标和价值,以及如何确保这些系统遵守这些规则。这些都是当前新兴技术中的未知数。
所以,我想说我是一个谨慎的乐观主义者。我相信我们会解决这些问题,只要我们采取行动,并且是全球性的行动,把所有最优秀的头脑集中起来。我很高兴看到英国和美国现在已经设立了人工智能安全研究所,我们是这方面的积极倡导者,也在测试最新的模型。但我们需要更多这样的举措,我只是希望这真的能够发生。我相信只要有足够的时间和足够的聪明才智,我们能够做到。我相信人类的智慧会帮助我们解决这个问题。但我们必须认识到其中的风险,我们不能偷工减料。我们需要以尊重和近乎敬畏的态度来对待这项技术,因为它值得被这样对待。
工作和人类价值
泰晤士报记者: 听起来有些让人不安。你提到国际象棋的例子很有意思,但如果我每天都靠国际象棋谋生,那这可能会让我失去工作。你提到的系统是否会消除几乎所有人类价值?
Demis Hassabis: 我不这么认为。我觉得接下来会出现一些非常重要的哲学讨论,比如我们如何重新分配资源和财富。我们可能进入一个稀缺性减少的时代,如果一个通用智能系统(GI)能够充分发挥作用,那么能源和资源就不应该再稀缺。这确实会改变经济的动态。这就是我所说的长期发展方向。所以,我们现在需要开始考虑,如何为此做准备。比如,我们要如何分配那些额外的财富和资源?是不是应该有某种形式的普遍基本收入?这些问题现在应该由经济学家来研究和讨论。
泰晤士报记者: 太棒了,非常感谢你,Demis。很高兴你能来这里,非常感谢。
Demis Hassabis: 谢谢你,很高兴和你聊这些。
原视频链接:https://x.com/GoogleDeepMind/status/1846974292963066199
对了,喜欢就别忘了点赞、收藏、转发支持一下!期待在评论区听到你的观点和看法!
往期回顾
1、[对话2024化学奖得主谷歌Demis Hassabis:利用AI设计蛋白质,人工智能被证明是未来各领域的关键技术]
3、[演讲视频:2024年第65届国际奥数大会上,陶哲轩再次表示当前AI进展惊人,智能水平已与人类相当]
3、[诺奖现场采访2024物理学得主Hinton:当前AI革命堪比工业革命,且将在智力上全面超越人类]
我们旨在将 AI 科技与创新想法完美融合!
想要掌握人工智能,但不知从何开始?告诉我们你的需求,学习AI让你抓住这波浪潮
告别昂贵服务和缺人烦恼,再见漫长交付周期
无限创意,分分钟生成专业级产品
感受 AI 带来的全新工作体验!
欢迎各大品牌方、媒体、企业和个人等
请联系负责人微信:Milo-1101
--END--