首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

AI教母李飞飞最新演讲！AI的潜力，令人如此着迷！

教育 2024-09-02 20:56 北京

动动手指，获取新知

▲▲▲

九年前，李飞飞站在TED舞台上，发表了一个关于计算机视觉的早期进展报告，这是人工智能的一个子领域。

当时，有三股强大的力量首次汇聚在一起：被称为神经网络的算法家族，被称为GPU的快速专用硬件，以及像她的实验室花费多年时间策划的包含5000万张照片的图像集（ImageNet）这样的大数据。

当这些因素结合在一起时，不仅使计算机的视觉能力，达到了前所未有的高度，还开启了现代人工智能的时代。

在未来，我们能将整个世界以数字形式捕捉下来，能够模拟世界的丰富和细微差别，就像大自然在我们个人思维中潜移默化地做的一样。

随着空间智能的发展加速，这一良性循环的新时代正在我们眼前上演。空间智能技术使机器能够与人，以及真实或想象中的三维世界进行互动。

智能的产生

李飞飞：我今天来这里是想和大家分享一些令我激动的关于人工智能的最新进展。

我演讲的题目是“从看见到行动：向计算机和机器人‘教授’空间智能”。真正让我兴奋的是，在座的各位都是像素达人，而像素真的让我很兴奋。

所以让我先给大家展示一些东西。好吧，除了这个logo，其实我什么也没展示给你们。

这就是5.4亿年前的世界，纯粹、无尽的黑暗。黑暗并不是因为缺乏光线，而是因为缺乏视觉。

实际上，阳光可以透过一千米的海洋表面，而热液喷口的光也能渗透到海底。尽管这里充满了生命，但在这些古老的水域中找不到任何一只眼睛，没有视网膜、没有角膜、没有晶状体。

所以，所有这些光、所有这些生命都是看不见的。

曾经有一段时间，“看见”这一概念尚未存在，它只是一种从未有过的东西，直到我们开始了解它。

三叶虫，第一个能感知光线的器官出现了。它们是我们认为的现实世界的第一批居民，也是第一个发现这个世界上还有许多其他自我的生物。

人们认为，这种视觉能力帮助开启了一个叫做寒武纪大爆发的时期，在这一时期，有大量不同种类的动物物种化石记录。

最初是被动的体验——单纯的光线进入，随后变得更加丰富和活跃。神经系统开始进化，视力转变为洞察力，看见变成了理解，理解引导了行动，所有这些都促成了智能的产生。

因此，在5亿年后的今天，我们不再满足于仅仅拥有自然赋予我们的视觉智能。

我们的好奇心促使我们创造出能像我们一样聪明，甚至比我们更聪明的机器。

图片来源：Figma

空间智能的发展

李飞飞：神经网络算法的速度和准确性逐年迅速提高。由我的实验室主导的年度ImageNet挑战赛评估了这些算法的表现，每年提交的数据都在刷新纪录，你们可以从这幅图中可以看到一些模型、里程碑模型的年度进展。

我们还进一步开发了能够分割物体的模型，甚至能够识别视频中物体之间的动态关系，而不仅仅是标记物体。

但还有更多事情要做。

我记得，大约10年前，我展示了第一个可以用人类自然语言描述图像和照片的计算机视觉算法，这是一种自动撰写字幕的方法，这是与我出色的前学生Andrej Karpathy共同完成的。

那时，我想试试运气，让Andrej操作计算机做相反的事情，根据口头描述创建图像。

Andrej说这是不可能的。

然而，正如你最近在这条推文中看到的，在短短几年内，不可能的事情变成了可能，这要归功于最近在生成式AI中使用的扩散模型的发展。

现在，AI程序可以根据任何人类输入的句子创建全新的照片或视频。

你们中的许多人已经看到了Sora OpenAI的成果，即使没有大量的GPU也可以实现。

我的学生和我们的合作者在Sora之前几个月就创造了一个名为Volt的生成模型。这只是部分成果。

当然，我们还有成长的空间，我们也会犯错误。比如，看看猫眼是如何潜入波浪之下而不被弄湿的，真是个灾难。

但你们已经克服了这些，我们将从这些错误中学习，创造我们想象中的未来。在未来，我们希望充分利用AI的所有潜力。

多年来，我一直在说，拍一张照片并不等于看到和理解它。

现在我想补充一点，单单看到是不够的，看到是为了做和学习。

当我们在三维时空中行动时，我们就会学习，学习如何看和做得更好。大自然创造了这种由空间智能驱动的'看'与'做'的良性循环。

让我们来看看这张照片，如果这张照片让你想做点什么，请举手，如果这种情况在现实生活中真的发生过，请继续举手。

在瞬间，你的大脑会看着玻璃杯的几何形状，它在三维空间中的位置，它与桌子、盖子及周围所有物体的关系，然后你预测接下来会发生什么。

不仅如此，你的大脑已经计算出了让你冲向那个玻璃杯从而拯救你的地毯的动作。

对于具有空间智能的生物，这种行动的冲动是与生俱来的，空间智能将感知与行动联系在一起。

因此，要推进人工智能的发展，就必须超越它的能力。

今天，我们需要的不仅仅是能看或能说的人工智能，我们需要能做的人工智能，就像大自然赋予我们的那样。

实际上，我们在这方面正取得令人兴奋的进展，我们在空间智能方面的最新里程碑正在催化这个良性循环，即教会计算机看、做、学，然后看得更好、做得更好。

这并不容易。

动物花了数百万年的时间进化出空间智能，这依赖于眼睛使用光线将二维图像投射到视网膜上，再由大脑将这些图像翻译成三维。

直到最近，谷歌的一组计算机视觉研究人员才做到这一点。

他们创建了一种算法，可以仅通过一组照片将数据转化为三维形状。以下是他们工作的更多成果。

同时，我在斯坦福的学生和同事更进一步，创建了一种仅需一张图像就能生成三维形状的算法。以下是我们工作的一些成果。

回想一下，我们之前用文本输入来生成视频。密歇根大学的一组研究人员想出了如何将一行文本转化为三维空间布局。

这为室内设计和规划设计的提供了可能性。

与此同时，我在斯坦福的同事和学生们开发了一种算法，可以将一幅图像生成无限可能的空间供观众探索，或者说像进入一个完全不同的世界，这些原型是未来可能性的第一个萌芽迹象。

在未来，我们将整个世界以数字形式捕捉下来，能够模拟我们世界的丰富和细微差别，就像大自然在我们个人思维中潜移默化地做的一样。

随着空间智能的发展加速，这一良性循环的新时代正在我们眼前上演。

空间智能的未来展望

李飞飞：这种反反复复的学习正在推动机器人学习，这是任何需要直接理解三维世界并与之互动的智能系统的关键组成部分。

十年前，我的实验室利用图像技术建立了一个拥有数百万张高质量图像的数据库，帮助计算机观看学习。

现在，我们正在通过行为和动作来教会计算机如何在三维世界中行动。

我们不再手动创建训练示例，而是利用由3D空间模型驱动的仿真环境，提供无限的变化和互动。

你现在看到的只是在仿真环境中训练机器人的无限可能性中的一小部分示例。这是我实验室开发的一个名为Behavior的项目。

此外，基于大语言模型的输入，机器人语言智能也取得了令人激动的进展。

我的学生和合作者们是首批展示机器臂能够根据口头指令执行广泛任务的团队之一，比如，“你能打开顶层抽屉并小心花瓶吗？”，或者“可以拔掉充满电的手机吗？”或者“你能让机器人做一个三明治并为人们放上餐巾纸吗？”通常我想我的三明治上有更多配料，但这不是一个坏的开始。

在5.4亿年前的原始海洋中，能够看到并感知周围环境的能力引发了寒武纪大爆发，引发了其他生命形式的互动。

今天，这束光正在数字智能中开始传播，就像它曾经影响我们的祖先一样。

空间智能技术使机器能够与人，以及真实或想象中的三维世界进行互动。

我们可以想象这将对许多人的生活产生深远的影响。

以医疗保健为例。在过去的十年中，我的实验室与斯坦福医学院的学生和同事以及合作医院一起，率先应用AI技术解决影响患者治疗效果和医护人员工作疲劳率的挑战。

我们正在试验智能传感器，这些传感器可以检测临床医生是否正确洗手进入患者房间的情况，跟踪手术中的器械，并在患者面临跌倒风险时提醒护理团队。我们认为这种技术是环境智能的一种形式，而这些额外的“眼睛”确实产生了影响。

但我希望看到更多技术来帮助患者、临床医生和护理人员，他们也急需额外的帮手。

想象一下，自主机器人运输医疗用品，这样护理人员就能有更多时间陪伴病人；想象一下，增强现实技术可以引导外科医生进行更安全、更高效、创伤更小的手术；想象一下，严重瘫痪的病人可以用脑电波控制机器人。因此，它们可以完成我们日常中的任务。

事实上，在我的实验室的一项试验研究中，我们已经看到了这种未来的曙光，正如你在这段视频中看到的，一个机器人手臂正在通过非侵入性采集的脑电信号控制烹饪日式寿喜烧。

因此，5亿年前，视觉的出现不仅扭转了黑暗的世界，还开启了最深刻的进化过程，即动物世界的智能发展。

AI在过去十年中取得的惊人进步同样令人震惊，但真正的数字“寒武纪大爆发”要等到计算机和机器人发展出大自然赋予我们所有人的那种空间智能，才能充分发挥其潜力。

现在还不是训练我们的数字伙伴学会如何推理和与我们称之为家的这个的三维空间互动，以及为我们所有人创造许多新世界的时候。

实现这一未来并非易事。

这需要我们采取深思熟虑的措施，开发以人为本的技术。

如果方法得当，由空间智能驱动的计算机和机器人将不仅是有用的工具，还将成为值得信赖的伙伴，在尊重我们个人尊严和提升我们集体繁荣的同时，增强和提高我们的生产力。

因此，最让我兴奋的是，在未来，随着人工智能的感知力、洞察力和空间意识不断增强，它将与我们一起追求更好的方式，满足我们的好奇心，从而创造一个更美好的世界，谢谢！

图片来源：Figma

原视频：Config 2024: Math is clean, but humans are messy (Dr. Fei Fei Li) | Figma

https://www.youtube.com/watch?v=wYXP6SivTD0

编译：焦慧茹

推荐阅读👇

让孩子看见未来

▼点击左下角的「阅读原文」即可订阅 2024《少年时》第十辑（109－120）

http://mp.weixin.qq.com/s?__biz=MjM5ODU3MTUxMg==&mid=2669913349&idx=1&sn=cbf00838971843fd2ae0d99b2d32110e

面向未来的国际化优才成长平台，以前瞻、探究、明辨为原则，与国际顶尖的阅读和教育资源接轨，致力于同时培养青少年科学和人文素养，促进人的全面发展，为未来提供更多的可能性。

最新文章

豆瓣高分！中秋假期，如果只选一部动画在家看，就它！

回国后终于见识到了烟卡，一场有预谋的飞车抢夺让人背后发凉….

女儿在北大六院确诊抑郁后，我亲手把她从坑底拉了上来......

2025新刊特惠征订！开学必备！20万高知妈妈“疯狂”种草，让孩子AI时代领先一步！

从《黑神话：悟空》主创背景看，如何让孩子更有创造力？

10年655座城市20万孩子阅读《少年时》，他们长大后变成了什么样？

开眼界！围观哈佛、剑桥学霸up主的社交平台后，我们发现了10条学习秘诀

10年烧了7.5亿，全球最不务正业图书馆，是什么样子？煮饭、租房、唱K……无所不能！

一代中国孩子正在掉入“低欲望陷阱”：斯坦福博士考公，985高分报二本警校…

2025新刊特惠征订！开学必备！20万高知妈妈“疯狂”种草，让孩子AI时代领先一步！

提升孩子学习力，关键在几岁？耶鲁大学专家给出的回答，切记切记！

【重要通知】《少年时》2025续订盛宴，即将盛大启幕！准备好迎接新一轮“思维风暴”了吗？

养男孩累？我们是否一直在伤害男孩？

AI教母李飞飞最新演讲！AI的潜力，令人如此着迷！

严重被低估的纪录片！让孩子爱上表达，新学期开局稳赢！

211硕士在火锅店做保洁，5年存款不足五千，她们却说：当个“废物”也挺好……

追踪一个男孩的十年：剑桥本科、MIT博士、25岁成为哈佛助理教授，他经历了什么？

30年前的海淀小升初，我妈带我上了8个奥数班，点招人大附，现在……

“黑悟空”背后的2000万网瘾少年：有人成亿万富翁，有人差点被毁了人生…

怎样让孩子，生活得更幸福？观察8000个家庭后的发现...

我们挖出7部物理纪录片，豆瓣9分+，比课本有趣多了

一针见血！AI专家指出，教育的问题不是太内卷，而是“过拟合”，一下子打开新思路

警惕！“隐形霸凌”正在小学悄悄流行，不动手的霸凌更残忍

学习上瘾的孩子，都是“宠”出来的

奥数金牌得主被AI秒杀，丘成桐的数学教育警示成真了

从不教孩子社交能力后患无穷，看看这位高情商爸爸如何“对症下药”

美育收藏！七部豆瓣高分纪录片推荐：艺术不是锦上添花，而是雪中送炭

比尔盖茨暑假书单透露的信息，打开了AI养娃的新思路

北大教授刘云杉：这群中国教育制度下的优胜者，正在被成功学反噬

盘点巴黎奥运会之“最”，哪个瞬间最让你热血沸腾？

豆瓣9.2！斯坦福AI教母的逆袭人生，什么样的教育成就了她？

10年了，为什么我们还是偏爱「爸爸去哪儿」的王诗龄？

这8部高分数学纪录片，让孩子一个暑期就爱上数学！

美国同龄人最火的暑假书单：每天15分钟就能「弯道超车」

数学老师教体育?! 把9名校队选手送进了巴黎奥运会

如何拯救孩子的“暑假拖延症”？这是我听过最科学的解释和方案

创造历史！郑钦文奥运金牌的背后，父母豪赌2000万的体育鸡娃之路赢了！

全红婵“拿捏”巴黎站上奥运最高领奖台，农民父母的精神“富养”成就了她

这8部高分运动探险纪录片，搭配奥运观看效果更佳

如何应对“暑期滑坡”？送你一份横跨100+门学科108本书的高效阅读清单！

首日摘金，为中国队创下纪录，最小的才11岁...这届奥运会上的小孩哥小孩姐有点厉害！

是奥运冠军，又是名校博士：中产养育女儿的天花板就是江旻憓吧！

斯坦福51人，伯克利49人，哈佛13人…美国队“名校含量”激起了多少爸妈“体育爬藤”的信心

Sora和ChatGPT之后，教育怎么办？

青春期的“隐秘烦恼”怎么解？B站9.9分神作，这群儿科医生给家长提了醒

哈佛大学研究：运动，是对孩子大脑最好的投资！

从乡村到哈佛，他的故事让鸡娃的中产沉默了

李飞飞的父母，做到了什么？

赶在开幕式之前读完这篇，才能真正看懂奥运

可汗学院创始人：在美国，AI颠覆教育的最前沿尝试是怎样的？

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉