李飞飞创业后的首个专访:空间智能是下一个“北极星”

文摘   2024-09-24 11:44   江苏  



AI的新独角兽:World Labs


李飞飞最快独角兽诞生了。


近日,英国《金融时报》披露一则信息——著名计算机科学家李飞飞最近重回工业界,携手高徒Justin Johnson(李飞飞学生,加州理工本硕博,深度学习和计算机视觉专家,图像生成和3D视觉大佬)创办AI公司 World Labs,该企业已宣布成功获得2.3亿美元融资,AMD、英伟达等一众科技巨头参与其中。

如今,这家还不到一岁的空间智能创企估值已超10亿美元,毫无疑问地成为“AI独角兽”。

李飞飞官宣World Labs推文,来源:X平台



空间智能:AI的下一个前沿



近日,李飞飞在接受外媒采访时回忆到项目筹资经历,并对“空间智能”技术的研究及应用价值展开了进一步探讨。

李飞飞介绍,“人类拥有空间智能。这实际上是一种非常古老的能力。我们经过数百万年的进化,发展出了理解、推理、生成甚至与三维世界互动的能力。无论是欣赏一朵美丽的花,还是试图触摸一只蝴蝶,或者建造一座城市,这些都是空间智能能力的一部分。简而言之,‘空间智能’是人类拥有的一种能力,这种能力包括理解、推理、生成、以及在3D世界进行交互。当前正在攻克如何让计算机拥有这种能力。


她认为,“空间智能”是AI领域的下一个前沿技术方向,将对机器人、制造业、VR/AR(虚拟现实)等众多领域产生深远影响。


谈及项目是如何吸引众多大佬赶来投资的,李飞飞表示,“多数人是昔日同事、老友、或学生,选择投资是因为与我有相同的信念,并相信这里已经聚集了最适合解决这个问题的人才。”


来源:a16z

a16z podcast链接:https://a16z.simplecast.com/episodes/the-frontier-of-spatial-intelligence-with-fei-fei-li-K8rfsVXI



从ImageNet到空间智能:李飞飞的新赌注



从早期AI寒冬到深度学习兴起以及多模态AI快速扩张的历程,从ImageNet等基础性进步到空间智能的前沿领域,李飞飞在和Johnson在a16z的采访中,分享了塑造AI格局的突破性进展,并首次系统性揭示了World Labs未来的创新方向
  1. 空间智能的时代已经到来

  • 计算能力、数据理解和算法的进步为空间智能的发展奠定了基础。

  • 空间智能与语言智能同等重要,甚至更加基础,是人工智能发展的必然趋势。

  1. 空间智能与语言模型的区别

  • 语言模型基于一维数据结构,而空间智能需要处理三维空间和时间信息。

  • 语言是人类创造的信号,而三维世界遵循物理法则,具有固有的结构和属性。

  • 空间智能更侧重于机器对物理世界的感知、推理和交互能力。

  1. World Labs的目标和愿景

  • World Labs致力于构建能够实现空间智能的模型和平台。

  • 公司的目标是将空间智能应用于多个领域,包括虚拟世界生成、增强现实和机器人技术。

  1. 空间智能的应用场景

  • 虚拟世界生成:  为游戏、教育、虚拟摄影等领域创造高度逼真、可交互的三维虚拟世界。

  • 增强现实:  将虚拟信息与现实世界无缝融合,增强用户在工作、生活和娱乐中的体验。

  • 机器人技术:  赋予机器人更强大的环境感知、导航和操作能力,使其能够更好地服务于人类。

  1. World Labs的核心竞争力

  • 创始团队由世界顶级的AI和计算机图形学专家组成。

  • 公司汇聚了来自系统工程、机器学习、数据处理等多个领域的顶尖人才。


此外,在今年4月的一次TED演讲上,李飞飞也现身分享了她对于空间智能的思考:视觉能力引发了寒武纪大爆发,神经系统的进化带来了智能。

李飞飞Ted演讲链接:https://www.ted.com/talks/fei_fei_li_with_spatial_intelligence_ai_will_understand_the_real_world/transcript

“我们想要的不仅仅是能看会说的人工智能,我们想要的是能做的人工智能。”在李飞飞看来,空间智能是“解决人工智能难题的关键拼图”。


为此,她展示一张猫咪伸出爪子要把玻璃杯推向桌子边缘的照片。她进一步解释称,人类大脑在这一瞬间可以评估玻璃杯的几何形状、在3D世界中的位置、与桌子和猫的关系,并且能预测接下来会发生什么,采取行动制止。“大自然创造了观察与行动的良性循环,这得益于空间智能。”


李飞飞表示,用空间智能和语言智能为具身智能赋能,将开启令人兴奋的可能性。在具身智能领域,她带领的研究团队曾在2023年推出一项新成果VoxPoser,利用大型语言模型(LLMs)和视觉语言模型(VLMs)来驱动机器人,并展示了根据口头指令让机械臂执行各种任务的演示视频,包括打开抽屉但要小心花瓶、拔掉充满电的手机、制作三明治等。
在与a16z的交流中,李飞飞提到了ImageNet与空间智能的关联,指出ImageNet是像素空间研究的里程碑,而空间智能则是将这一研究推向三维领域的新篇章。当被问及为什么选择在这个时候创办 World Labs 时,李飞飞的回答充满了远见和使命感:
“这是我生命中的延续。就像 ImageNet 是我 15 年前在计算机视觉领域的一个重大赌注一样,我相信空间智能是我和我的团队的下一个北极星问题,它将改变 AI 的进程。”
李飞飞强调,空间智能不仅代表着技术的演进,更是对人工智能本质的一次深刻反思和拓展。它将使我们的机器能够以一种全新的方式感知世界,与世界互动,并在真实与虚拟的交汇处创造无限可能。随着World Labs的快速成长,我们有理由相信,空间智能将成为推动未来技术创新的核心力量。
World Labs创始团队,从左至右:Ben Mildenhall、Justin Johnson、Christoph Lassner、李飞飞,来源:李飞飞X平台社媒账号)


槿墨AI
产品服务

结合大模型通用知识及在交通、社会治理、安全生产、自然资源等行业领域的知识,深入业务场景,精确捕获用户意图,为用户提供智能问答、数据分析、报表生成、工作任务理解与执行等一系列服务

📞若您有相关需求,欢迎点击下方链接与我们沟通洽谈

🗨️也可以在公众号后台给我们留言


参考资料:

1.https://mp.weixin.qq.com/s/ZJJM7uwNjXbLw4A-WMaDFA
2.https://mp.weixin.qq.com/s/Mb0Iv8MWvqddTgkGj9H7JA
3.https://mp.weixin.qq.com/s/8d02KAPxfOuw8w236QJ8gA
4.https://mp.weixin.qq.com/s/K2i8U7dtKuIeYpGl-UrVGg
5.https://mp.weixin.qq.com/s/nUTWnhbO3Bsjg9ajy9yheA
6.https://www.ted.com/talks/fei_fei_li_with_spatial_intelligence_ai_will_understand_the_real_world/transcript
7.https://a16z.simplecast.com/episodes/the-frontier-of-spatial-intelligence-with-fei-fei-li-K8rfsVXI

槿墨AI
开启探索人类未来命运的旅程,拥抱如槿似墨的无限可能。
 最新文章