李飞飞最新访谈:AI十年,她所看见的世界

学术   2024-10-21 22:47   浙江  
 Datawhale干货 
访谈:CHM Live,编辑:Datawhale

在日前近日 CHM Live 的节目中,“AI教母”李飞飞教授接受了一场名为《Fei-Fei Li's AI Journey》的访谈,深入探讨了人工智能的历史、现状及未来发展方向。
在不改变原意的情况下,Datawhale 进行了如下翻译和整理。

AI的发展:从人工智能奠基到现代革命

李飞飞将对话聚焦在人工智能的历史时间线上,
从 1956 年的达特茅斯夏季会议开始,人工智能这个术语就是在那里诞生的。
李飞飞:他们讨论了如何解决这个问题,重点关注推理、演绎,并试图让机器像人类一样思考、回答问题和做决策,这是一段长达70年的旅程,我们经历了起伏。
从那以后,经历了许多炒作周期,
例如在 70 年代,杂志封面就在谈论机器人接管世界。
但到了 90 年代,该领域内正在发生一场悄然的革命,
由统计建模推动,与计算机编程相结合,变成了机器学习。它开启了自然语言处理、计算机视觉、语音识别等领域。
当李飞飞在 2000 年代初在加州理工学院攻读博士学位时,发生了两件事,定义了她这一代的 AI 研究人员:
统计机器学习和互联网。
李飞飞的 ImageNet 项目是一个里程碑 —— 接下来就到了 AI 近期的历史了。
通过将庞大的 ImageNet 数据集开源,李飞飞和她的同事们推动了人工智能研究。
李飞飞:AlexNet 对人工智能世界具有象征意义,因为现代人工智能的三个基本要素第一次汇聚在一起,第一个要素是神经网络,第二个要素是大数据,即使用 ImageNet,第三个要素是 GPU 计算。在 ImageNet 之前,人们并不相信数据的重要性...
当时,人们使用少量的数据进行研究,而这种范式转变,摒弃了所有这些,推动了人工智能的高容量模型和泛化。
李飞飞:所以这个是一个非常激进的想法,我们要抛弃这一切,用数据来填充模型,通过数据驱动的方法来推动高容量模型。
但她的坚持和热情得到了回报。大门开始向先驱者和科技公司敞开。
李飞飞认为,自 2010 年或 2012 年左右以来,我们一直处于人工智能现代复兴的时代。
2016 年 1 月,当一个人工智能在复杂的围棋游戏中击败人类时,公众开始意识到机器能够在一些独有的任务中强大到足以挑战人类。
李飞飞:AlphaGo 和 ChatGPT 在公众意识上的区别不仅仅在于影响的人数。这是第一次人工智能如此紧密地掌握在个人用户手中,AlphaGo 除了围棋大师之外,没有任何用户能够使用,而 ChatGPT 触手可及。
这十年里,公众看到的是一些离散的事件,而我们则看到这一切是一个连续的过程。

AI与社会:人工智能的发展与技术前景

在 2016 年大选和剑桥分析公司丑闻后,科技遭到强烈反对的同时,大型科技公司和企业家对人工智能进行了更多投资。

在社会中,我们开始讨论机器学习的偏见和其他的一些担忧。

然后,在 2022 年 10 月,ChatGPT 出现了

这对所有人来说都是一个觉醒性的时刻,因为任何人都可以轻松使用 AI。

突然之间,人们可以看到人工智能有很强的学习模式和进行预测的能力。

它也有一定程度的推理能力 —— 它可以解释 “为什么”。

李飞飞认为,未来三到五年将是令人兴奋的,因为人工智能开始被用于各种领域来解决问题。

李飞飞:首先,我从根本上相信,在人类历史的每一个时刻,技术和科学都是有限的,我们总是可以向前推进边界,就我个人而言,我对超越语言的空间智能感到非常兴奋。

李飞飞认为 AI 将带着新数据进入新领域。

她个人觉得人工智能发展空间智能的潜力很大。空间智能,让 AI 理解现实世界。

李飞飞:如果你看人类和动物的智能,语言只是智能的一个部分,人类文明的建立是基于超越语言的许多内容。从金字塔的建造到第一次工业革命的复杂机械设计,再到DNA结构的发现,再到电影制作的创造,所有这些很多都是建立在超越语言的空间智能之上

那么,空间智能是 AGI 的开始吗?

早期人工智能先驱者的梦想,是开发出能够像人类一样真正思考的计算机。

从科学的角度来看,李飞飞将这个梦想视为追求的目标,

但她并不认为 AI 能够成为拥有与人类相同的智能、像人类一样复杂而精细的存在

AI与人类:以人为本的人工智能计划

“AI 将以深远的方式影响我们的生活、商业和世界,这种意识让我不寒而栗,想到一项工具可以如此强大是令人恐惧的.

我们最好考虑其影响,这种深刻的影响必须扎根于人类的影响,所以我们需要用以人为本的框架来接触人工智能。”

李飞飞认为,斯坦福大学以人为本的人工智能研究所的工作提供了一个关键的框架,让我们思考这项技术以及它将如何影响人们的生活。

李飞飞有一个以人为本的人工智能框架。

李飞飞:现在,在斯坦福HAI,我们从三个同心圆的角度考虑人工智能对人类的影响:个人、社区和社会

人工智能对人类有深刻的影响 —— 既有积极的也有消极的。

当各领域的专家们寻求将 AI 应用于他们特定的领域时,可以探索无数积极的用例。

李飞飞:对在校学生来说,要拥抱这种跨学科性放眼未来,人工智能是计算的新语言,我曾经说过,只要有芯片的地方,就会有或将会有人工智能,像灯泡那样小的设备都会有人工智能,所以不要害怕,从你的角度去拥抱它,并利用它来做出积极的改变

尽管她对将 AI 与各个领域相结合的多学科和跨学科的潜力充满 passion!

但她也说 AI 有很多风险。

李飞飞认为对 AI 的无知是最大的风险。

李飞飞:如果对这项技术过于无知,我们就会错过利用它为我们带来好处的机会,如果我们对这项技术无知,就无法识别实际风险,如果我们传播无知的信息,我们也在误导公众和决策者。

李飞飞说,任何说人工智能全是好处的人都是对过去无知

李飞飞:我们看人类与工具的历史,每种工具都被以有害的方式使用,所以我们必须认识到,如果你所使用的数据集是有偏见的,你将对公平性产生非常糟糕的影响。

但是,人工智能也是一个存在于数据中心并与人类社会紧密相连的物理系统。

创造和维持一个健康的人工智能生态系统取决于我们。这包括学术界、创业领域、大型科技公司和小型科技公司,尤其是公共部门的投资和支持。因为公共部门投资的最佳成果不是它帮助开发的技术,而是人。

访谈题外话

Tom:那么Jeffery Hinton是什么时候开始研究人工神经网络的?

李飞飞:差不多也得十年了,他在卡内基梅隆大学,甚至更早。你提到的那些都是来自公共部门的例子,在接下来的三到五年,我们谈论科学发现时,会看到激动人心的成果,很多将来自公共部门,而且来自公共部门学术界的最佳成果,猜猜是什么,人就是这些成果的来源,因此,我们需要投资公共部门。

Tom:好极了,我们有一群非常聪明的听众,我相信你们会提出很多好的问题,比如,有一个问题是关于你们新公司的,问你们将如何收集足够的数据来构建世界的空间地图,以支持实时定位。你可能想要先讨论一下这个问题的前提,但显然数据是你们在空间智能领域取得进展的关键,没有数据就不可能做到,所以也许你可以谈谈这个。

李飞飞:我们现在还没有公开讨论细节,因为还没有准备好,当我们准备好时会进行讨论,我有点好奇这个人怎么会知道我们正在构建什么,这是他们的版本故事,我对此不做评论,但你是对的,人工智能是由数据驱动的,这一点非常重要,我们公司的空间智能绝对是基于像素的,因此大量的像素数据将推动这项技术的发展。

Tom:对,这里有一个来自Amy的好问题,这与您曾参与的“人人享有人工智能”项目有关,她说:“我是一名12岁的中学生,我们可以做些什么来鼓励更多女孩学习人工智能,为人工智能时代做好更好的准备?”

李飞飞:好问题,每个12岁的小孩都应该被鼓励去接受这个,不论你是女孩还是男孩,生活在乡村还是硅谷,如果你热爱它,就去拥抱它。对于Amy说的,我在12岁时也在思考,那个时候并没有人工智能,至少我不知道有人工智能,我喜欢数学,喜欢物理,今天我感激我父母和老师为我做的事情,我会对Amy和所有学生说,追随你的热情,追随你的好奇心,并且要有韧性,如果有消极的声音,就把它们排除在外,你周围有很多人,从父母到老师再到朋友,再到榜样,都在支持你,继续努力,继续前进。

Tom:除了做早餐之外,空间智能可以解决的最重要的人类问题是什么?

李飞飞:空间智能确实可以驱动很多事情,从创造到设计,你们有多少人想要一个应用程序,可以想象所有家具的重新排列,从机器人到增强现实(AR)、虚拟现实(VR),以及特定领域,比如教学、学习、医疗、工厂制造等等,这都是一种深具普遍性的横向技术,能够影响所有这些领域。

Tom:我们有一个关于小模型和AR眼镜结合的问题,你考虑过这样的事情吗?

李飞飞:我对新媒体确实感到兴奋,我们在硅谷,我相信你们中很多人熬夜购买Vision Pro,所以我实际上非常兴奋,苹果称之为空间计算,因为那时我已经思考空间智能多年,我想是的,因为空间计算需要空间智能,但眼镜这一形式对我来说很令人兴奋,小型计算或边缘计算也非常有趣,但小模型不仅对眼镜和头戴设备有用,实际上它在边缘计算方面非常强大,无论是智能设备、机器人,尤其是家用机器人,你现在可以在后备厢里携带一台服务器,所以小模型有很多应用。

Tom:我对多模态模型和智能眼镜在劳动力发展中的作用非常感兴趣,我们没有足够的电工,所以你可以想象,耳塞AI、智能眼镜可以作为学徒培训项目的一部分提供及时、适量的培训,我们能做什么,研究界能做什么,公司能做什么来解决其他语言在这一领域代表性不足的问题?

李飞飞:这是个好问题,这涉及到数据偏见等等。首先,当我说公共部门对AI的投资时,每个国家都应该在AI方面进行公共部门投资,这与当地文化、语言有关,从这个角度来看,个人研究者很重要,关注这些问题,但政府和能够部署大量资源的大型组织也很重要。英语确实占主导地位,我们应当意识到这一点,这回到我之前提到的公共部门投资,甚至在这个国家,我相信我们有许多优秀的研究者和学生在思考其他语言,但目前他们缺乏数据集和计算资源,我们需要解决这个问题。

Tom:观众中有一些哲学性的问题,“我想知道你在斯坦福大学做了哪些努力来与人文学科和社会科学的人接触,有什么例子是他们能够提供的洞见,让你作为计算机科学家感到有趣的?”

李飞飞:实际上,这是我过去五年中最有趣的部分,建立和共同运营这个研究所,确实是与整个校园接触,斯坦福大学特别有大约八个学院,从法学院、商学院、医学院到现在的可持续发展学院、人文学科、自然科学学院、工程学院,和同事们交谈,接触校园内的学生、研究人员和学者是极其有趣和启发性的。我学到了什么?与人文学科同事的交谈真正开阔了我对人类表达和创造力的理解,这意味着我们如何思考AI与深具创造力的人的关系,尤其是当ChatGPT和Sora在好莱坞作家罢工后出现时,涉及到艺术家的声音、个人版权,以及艺术家如何在拥抱这一工具的前沿。

这确实非常复杂,我没有接受过正式教育来理解这一切,他们教我思考这一点,与这个观众交流,可能是非常专业的技术人员,技术专家倾听并接触人文和社会科学家是非常重要的,而且在你自己的工作环境中,无论是法律、产品、市场营销或其他职能,因为技术并不是在真空中存在的,技术需要复杂的人类努力来使其对社会有益,以谦逊和尊重的态度去接纳对方,并给予他们应有的尊严,这是我们建立这些桥梁所能做的最基本的事情。

Tom:你认为我们在可解释和可理解的 AI 领域取得进展有多重要?

李飞飞:总体上这是重要的,但在这个问题上,我们需要更细致一些,例如,甚至可解释性有不同的层次,大家都知道泰诺对发烧和头痛是有效的,但给我解释一下泰诺的分子途径,事实上,即使今天,科学家也不知道所有的细节,但你不会说泰诺是一种不可解释的药物,因为围绕药物开发、监管措施和药物批准过程有足够的解释,让你和大多数公众感到信任。

另一种可解释性是,例如,特别是你从拉法叶开车过来的,这里的谷歌,如果你在谷歌地图中输入,它会给你路线选择,你可能会选择一条快四分钟的路,但老实说,这并没有向你解释从A点到B点的算法,但作为一个人类用户,你会感到在选择上有足够的可解释性。再回到医学,我们中几乎没有人能理解治疗,然而你的医生会用某种人类语言向你解释这种治疗,我举这个例子,是为了和你分享思考用例的重要性,思考可解释性的定义也很重要,而这种定义与特定用例之间的匹配是必要的。

有时我们并不需要机械分子途径级别的可解释性,有时我们需要不同类型的可解释性。因此,回答你的问题,这是重要的,但取决于用例,在不同的情况下,它的重要性各不相同。

Tom:你提到除了学习 AI 外,你还学习了神经科学,有些人对“AI 能从神经科学中学到什么”这个问题感兴趣,卷积神经网络在某种程度上是受人类视觉系统启发的,人们研究了多巴胺奖励回路,这也是强化学习的灵感来源。还有哪些领域你认为神经科学与 AI 之间有潜在的合作?

李飞飞:完全正确,这个房间里的灯泡就是20瓦,因此,当我们成立斯坦福 AI 时,三个主要研究支柱之一就是神经科学,跨学科的合作对我们领域的进步以及两个领域的未来都是基础,我很幸运能和 SG Gully、Mike Frank 和 Noah Goodman 等同事合作,斯坦福的很多同事都在这个跨学科研究的前沿。例如幼儿的发展,年轻的孩子,尤其是在早期阶段,会进行大量好奇心驱动的学习,这如何转化为 AI 系统?这是一个灵感来源,我们也知道背景只是我们大脑中两个神经元之间发生的事情的一个非常简化的翻译,除了突触连接,还有许多树突连接,这实际上是非常电气化、化学化和复杂的,今天没有任何机器学习算法考虑到这些复杂而有趣的突触和神经元通信通道。

原视频:CHM Live | Fei-Fei Li's AI Journey,https://www.youtube.com/watch?v=JgQ1FJ_wow8

李飞飞原话翻译来自 Z Potientials,仅作学术分享使用

一起“三连

Datawhale
一个专注于AI领域的开源组织,汇聚了众多优秀学习者,使命-for the learner,和学习者一起成长。
 最新文章