李飞飞空间智能首秀：AI靠单图生成3D世界，可探索，遵循基本物理几何规则

科技 2024-12-03 22:00 北京

文章来源于公众号：量子位

ID：QbitAI

就在今天，李飞飞空间智能首个项目突然发布：

仅凭借1张图，就能生成一个3D游戏世界的AI系统！

重点在于，生成的3D世界具有交互性。

能够像玩游戏那样，自由地移动相机来探索这个3D世界，浅景深、希区柯克变焦等操作均可行。

随便输入一张图：

除了这张图本体，可探索的3D世界里，所有东西都是AI生成的：

这些场景在浏览器中实时渲染，配备了可控的摄像机效果和可调节的模拟景深（DoF）。

你甚至可以改变其中物体颜色，动态调整背景光影，在场景中插入其他对象。

此外，之前大多数生成模型预测的是像素，而这个AI系统直接预测3D场景。

所以场景在你移开视线再回来时不会发生变化，并且遵循基本的3D几何物理规则。

网友们直接炸开锅，评论区“难以置信”一词直接刷屏。

其中不乏Shopify创始人Tobi Lutke等知名人士点赞：

还有不少网友认为这直接为VR打开了新世界。

官方则表示“这仅仅是3D原生生成AI未来的一个缩影”：

我们正在努力尽快将这项技术交到用户手中！

李飞飞本人也第一时间分享了这项成果并表示：

无论怎么理论化这个想法，用语言很难描述通过一张照片或一句话生成的3D场景互动的体验，希望大家喜欢。

目前候补名单申请已开启，有内容创作者已经用上了。

羡慕的口水不争气地从眼角落了下来。

Beyond the input image

官方博文表示，今天，World labs迈出了通往空间智能的第一步：

发布一个从单张图片生成3D世界的AI系统。
Beyond the input image, all is generated。

而且是输入任何图片。

而且是能够互动的3D世界——用户可以通过W/A/S/D键来控制上下左右视角，或者用鼠标拖动画面来逛这个生成的世界。

官网博文中放了很多个可以试玩的demo。

这次真的推荐大家都去试玩一下，上手体验和看视频or动图的感受非常的不一样。

（直通车按惯例，放在文末）

好，问题来了，这个AI系统生成的3D世界还有什么值得探究的细节之处？

>摄影机效果

World Labs表示，一旦生成，这个3D世界就会在浏览器中实时渲染，给人的感觉跟在看一个虚拟摄像头似的。

而且，用户能够精准地控制这个摄像头。

所谓“精准控制”，有2种玩法，

一是能够模拟景深效果，也就是只能清晰对焦距离相机一定距离的物体。

二是能模拟滑动变焦（Dolly Zoom），也就是电影拍摄技巧中非常经典的希区柯克变焦。

它的特点是“镜头中的主体大小不变，而背景大小改变”。

很多驴友去西藏、新疆玩儿的时候都希望用希区柯克变焦拍视频，有很强的视觉冲击力。

在World Labs展示中，效果如下（不过在这个玩法里，没办法控制视角）：

>3D效果

World Labs表示，大多数生成模型预测的都是像素，与它们不同，咱这个AI预测的是3D场景。

官方博文罗列了三点好处：

第一，持久现实。

一旦生成一个世界，它就会一直存在。

不会因为你看向别的视角，再看回来，原视角的场景就会改变了。

第二，实时控制。

生成场景后，用户可以通过键盘或鼠标控制，实时在这个3D世界畅游移动。

你甚至可以仔细观察一朵花的细节，或者在某个地方暗中观察，用上帝视角注意这个世界的一举一动。

第三，遵循正确的几何规则。

这个AI系统生成的世界，是遵守3D集合物理基本规则的。

某些AI生成的视频，虽然效果很梦核，但可没有咱的这种深度的真实感哟（doge）。

官方博文中还写道，创造一个可视化3D场景，最简单的办法是绘制深度图。

图中每个像素的颜色，都是由它和摄像头的距离来决定的。

当然了，用户可以使用3D场景结构来构建互动效果——

单击就能与场景互了，包括但不限于突然给场景打个聚光灯。

动画效果？

那也是so easy啦。

>走进绘画世界

团队还玩儿了一把，以“全新的方式”体验一些经典的艺术作品。

全新，不仅在于可互动的交互方式，还在于就靠输入进去的那一张图，就能补全原画里没有的部分。

然后变成3D世界。

这是梵高的《夜晚露天咖啡座》：

这是爱德华·霍普的《夜行者》：

创造性的工作流

团队表示，3D世界生成可以非常自然地和其它AI工具相‍结合。

这让创作者们可以用他们已经用顺手的工具感受新的工作流体验。

举个栗子：

可以先用文生图模型，从文本世界来到图像世界。

因为不同模型有各自擅长的风格特点，3D世界可以把这些风格迁徙、继承过来。

在同一prompt下，输入不同风格的文生图模型生成的图片，可以诞生不同的3D世界：

一个充满活力的卡通风格青少年卧室，床上铺着五彩斑斓的毯子，桌子上杂乱地摆放着电脑，墙上挂着海报，散落着运动器材。一把吉他靠在墙上，中间铺着一块舒适的花纹地毯。窗户透进的光线给房间增添了一丝温暖和青春的气息。

World Labs和空间智能

“World Labs”公司，由斯坦福大学教授、AI教母李飞飞在今年4月创立。

这也是她被曝出的首次创业。

而她的创业方向是一个新概念——空间智能，即：

视觉化为洞察；看见成为理解；理解导致行动。

在李飞飞看来，这是“解决人工智能难题的关键拼图”。

只用了3个月时间，公司就突破了10亿美元估值，成为新晋独角兽。

公开资料显示，a16z、NEA和Radical Ventures是领投方，Adobe、AMD、Databricks，以及老黄的英伟达也都在投资者之列。

个人投资者中也不乏大佬：Karpathy、Jeff Dean、Hinton……

今年5月，李飞飞有一场公开的15分钟TED演讲。

她洋洋洒洒，分享了对于空间智能的更多思考，要点包括：

视觉能力被认为引发了寒武纪大爆发——一个动物物种大量进入化石记录的时期。最初是被动体验，简单让光线进入的定位，很快变得更加主动，神经系统开始进化……这些变化催生了智能。
多年来，我一直在说拍照和理解不是一回事。今天，我想再补充一点：仅仅看是不够的。看，是为了行动和学习。
如果我们想让AI超越当前能力，我们不仅想要能够看到和说话的AI，我们还想要能够行动的AI。空间智能的最新里程碑是，教计算机看到、学习、行动，并学习看到和行动得更好。
随着空间智能的加速进步，一个新时代在这个良性循环中正在我们眼前展开。这种循环正在催化机器人学习，这是任何需要理解和与3D世界互动的具身智能系统的关键组成部分。

据报道，该公司的目标客户包括视频游戏开发商和电影制片厂。除了互动场景之外，World Labs还计划开发一些对艺术家、设计师、开发人员、电影制作人和工程师等专业人士有用的工具。

如今伴随着空间智能首个项目的发布，他们要做的事也逐渐具象化了起来。

但World Labs表示，目前发布的只是一个“早期预览”：

我们正在努力改进我们生成的世界的规模和逼真度，并尝试新的方式让用户与之互动。

参考链接：

[1]https://www.worldlabs.ai/blog

[2]https://mp.weixin.qq.com/s/3MWUv3Qs7l-Eg9A9_3SnOA?token=965382502&lang=zh_CN

[3]https://x.com/theworldlabs/status/1863617989549109328

酷玩实验室经授权转载

如需转载，请联系原作者

插上手柄就能玩

酷玩实验室

关注中国科技发展与产业升级！

最新文章

黑神话登上《新闻联播》，美国人高兴不起来了

关税降到了0 之后！阿根廷牛肉，零售价大跌！

穿它只有0次和无数次……

终极预测：未来十年，谁将主宰科技巅峰？

为啥你拼命存的资源，最后又不想点开了？

车企倒闭潮到来，600万烂尾车主怎么办？

“国际重奢”大牌鹅绒服，官方旗舰店在售高端款！清仓狂甩卖！

OpenAI o3震撼觉醒，AGI今夜降临？血洗o1，破解陶哲轩最难数学题

比高铁出口更强大的，竟然是中国“暖气”！欧洲人过冬必备

科技快讯 | 广电总局要求加强微短剧片名审核；极越公关负责人徐继业确认离职，微博发长文细数“业绩”...

XBOX怎么不行了？

一位CEO杀手，成为美国第一巴图鲁

提前过年！HBN年底大促，3折！！！

应季清仓！和北面、猛犸象齐名的国际户外大牌，千元冲锋裤，1折扫货

科技快讯 | 小红书客服回应集中封号；华为快充自动充电机器人亮相...

万万没想到，AI卷得最狠的是奶茶

1200 一罐的贵妇眼霜，实验室复刻，成本可以压到多少？

“抽象”变迁史：从亚文化到年度关键词

丝滑如豆腐，却很暖！完了，彻底沦陷在这毛衣里了，我要穿到80岁~

科技快讯 | 百万粉丝博主恶意差评赔款5 万元；消息称苹果与腾讯、字节跳动谈判...

中文互联网，为什么成为短视频解说的绝对王者？

血亏93亿卖银泰的阿里，其实可能赚到了？

电商内卷，299的真皮女鞋配置拉到天花板！

华为鸿蒙智联品牌又杀疯了！把保温杯设计成“智能管家”，两位数清仓，还送咖啡杯!

科技快讯 | 微信公众号新增“作者朗读音色”功能；宁德时代计划明年落地 1000 座换电站...

搞黄色才是第一生产力？我们可能都误会OnlyFans了

巴黎圣母院时隔五年重生，育碧究竟算几等功臣？

中国人为什么要读诗？这位百岁老人一语中的！

全球消费遇冷！米其林高评价雷司令，只卖几十块！

科技快讯 | 百度回应进军短剧领域；保时捷称中国区裁员传闻不属实；俄罗斯进口奶粉产地在安徽...

董浩叔叔的评论区，怎么成了90后的赛博哭墙？

应季清仓！和北面、猛犸象齐名的国际户外大牌，千元冲锋裤，1折扫货

微短剧的霸总，率先被裁

曾经五百一个的「小众钛杯」，被中国制造卷成了平民级，比不锈钢杯还便宜！

科技快讯 | 小米9999元精英驾驶培训满员；苹果或将推出可折叠iPad...

洛城盛产真人GTA，观众痴迷警匪追击直播

万元高定的衣服，确实……有点好看！？

国内球星卷向NBA，国外球星卷向淘宝直播间

一年只卖10天！圣诞限量发售！法国进口圣诞树白葡萄酒，节日氛围拉满！

大家白嫖十多年的运费险，开始塌房了。

“黄金大劫案”频发，金价上涨是福还是祸？

有什么东西看似平平无奇，但一用过就会被惊艳？

汽车换芯片，到底贵在哪里？

科技快讯 | 极越售后或由吉利领克负责；联创人回应黑神话悟空TGA获奖...

最快倒闭的新势力！只剩24小时的极越能否起死回生？车主又该何去何从？

跌落神坛的「传奇女包」：巅峰时一包难求，如今沦落低价清货！

Google 发布了「虚拟现实」版 Android，想让你把熟悉的应用「戴在头上」

5折！一夜刷屏的故宫口红，限时破价闪促（售罄删文）

科技快讯 | 百度、吉利发布“关于极越汽车的联合声明”；字节跳动与北京大学成立豆包大模型联合实验室...

中国第一批新能源车主，要花1.6万亿元换电池

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉