某 AI 行业科技公司刚刚推出了第一个项目:仅通过一张图片像就生成一个完整 3D 世界的 AI 系统。 一键生成中世纪小镇丨World Labs 介绍博客里这样写道:“输入任何图像后,可以以 3D 方式探索它”——给它一张图,它能将图中场景三维化,还不是静态的“2D 转 3D”,你能像游戏里的第一人称一样控制视角,探索场景。 五花八门的场景丨World Labs 他们们管这叫“大型世界模型”(Large World Model, LWM),他们也称自己为空间智能 AI 公司。 完整系统还在邀请内测阶段,该公司在官网开放了即时演示,用户不仅可以看,还可以在浏览器直接操控视角转换,感受它塑造的世界。 大震撼。
“一图一世界”
这个系统同之前英伟达曾开发过的“2D 转 3D”模型 Instant NeRF 完全不同—— Instant NeRF 的视角没有深度变化、受阻没有物理碰撞,甚至会发生直接穿越;而新的这一工具生成的场景符合基本空间原理和物理定律。 英伟达的 2D 图片转 3D 场景的大模型 Instant NeRF 就有物理问题丨Instant NeRF 这更不会像上个月推出的 AI 即时生成 3D 可交互游戏 Oasis里面的“鬼打墙”——切换个视角再回来,世界就成了另外一番样子那般诡异。该科技公司的这个系统生成的是完整三维场景而非像素,克服了像素层面生成不具备一致性和稳定性的缺陷。 看得人都晕 3D 了丨World Labs 在它生成的场景里,你可以用“前后左右”在生成的空间内移动,用鼠标转换视角,并能调节场景、添加动效,比如光影、景深、色调,效果能直接在浏览器里实时渲染出来。 当你让树叶“沙沙作响”,为街角小巷营造出不同光影,让水面泛起涟漪,能感受到系统并非简单的动效添加,而是识别出了场景里的实体。 希区柯克变焦丨World Labs 想象一下,与其他工具结合或随着这个系统功能变多,你可以“化身”舞台置景,控制这一场景的布光和色调,甚至插入一个角色进入场景,改变画面的运镜,比如利用系统里自带的滑动变焦(俗称希区柯克变焦,算法算好了摄影机的位置和景深,用户直接拖动就能实现该效果),就能实现那股“诡异”的感觉。