3个月估值10亿，李飞飞空间智能首个模型诞生！一张图生成3D世界，视频游戏要变天

科技 2024-12-03 21:03 河北

李飞飞的World Labs首个「空间智能」模型，刚刚诞生了！一张图生成一个3D世界，网友惊呼：太疯狂了，我们进入了下一轮革命，这就是视频游戏、电影的未来。

AI生成3D世界成真了！

就在刚刚，AI教母李飞飞创立的World Labs首次官宣「空间智能」模型，一张图，即可生成一个3D世界。

用李飞飞的话说，「无论怎样理论化这个想法，都很难用语言描述一张照片或一句话生成3D场景的互动体验。」

这是迈向空间智能的第一步。

交互传送门：

https://www.worldlabs.ai/blog#footnote1

所有场景都能在浏览器中实时渲染，还能实现可控的相机效果、可调节的模拟景深。

未来，游戏NPC的虚拟世界可以随意切换，都是分分钟生成的事情。

英伟达高级研究科学家、李飞飞高徒Jim Fan总结道，「GenAI正在创造越来越高维度的人类体验快照。Stable Diffusion是2D快照；Sora是2D+时间维度的快照；而World Labs是3D、完全沉浸式的快照」。

今年4月，李飞飞被曝出开始自创业，专注于空间智能，新公司私下融资直接晋升10亿美元独角兽。

直到9月，这家名为World Lab正式亮相，并在新一轮融资2.3亿美金，得到了AI大牛Geoffrey Hinton、Jeff Dean、谷歌前CEO Eric Schmidt等人的鼎力支持。

World Labs创始人团队，左起依次为Ben Mildenhall、Justin Johnson、Christoph Lassner和李飞飞

如今酝酿半年多，空间智能终见雏形。

网友们激动地表示，太疯狂了，我们即将迎来一个像是80年代、90年代那样的革命。这将让许多人实现他们的创意，有望降低开发成本，帮助工作室的新知识产权更大胆冒险。

这就是视频游戏、电影的未来。

VR从此有了更多可能性。

探索一个新世界

不论是Midjourney、FLUX，还是Runway、DreamMachine，我们熟知的大多数GenAI工具仅能制作图像/视频2D内容。

若是实现了在3D中生成，视频的控制性、一致性能得到极大的改善。

这也就意味着，制作电影、游戏、模拟器等其他物理世界的数字表现形式，将会发生翻天覆地的变化。

World Labs成立开始的初衷便是，空间智能的AI对世界进行建模，还能3D时空中物体/地点/交互进行推理。

这次，他们首次展示了这个3D生成的世界。

如下，是在浏览器中进行的实时渲染演示（注：AI图像均由FLUX 1.1 pro/Ideogram/Midjourney生成）。

输入一张AI生成的古色古香的村庄图像，然后就可以得到一个3D的世界。

提示：这是一个古色古香的村庄，鹅卵石铺就的街道，茅草屋顶的小木屋，中央广场上有一口石井，周围是花坛

一座富丽堂皇的宫殿，AI把光与影都展现得淋漓尽致。

一幅AI生成的折纸类图片，立刻活灵活现了起来。

又或者输入一张博物馆取景照片，谁又能想到这周围是什么样子的呢？

AI帮你设想出了一切，出入门，下一间相邻的展馆、展品.....

再比如这张实景图，AI也能想象出周围的世界。

相机效果

你还可以体现不同相机效果，场景生成后，会使用虚拟相机在浏览器中进行实时渲染。

通过对这个相机的精准控制，便可以实现艺术摄影特效。

比如模拟不同的景深，让只有在相机特定距离范围内的物体保持清晰：

还可以模拟滑动变焦（dolly zoom），通过同时调整相机的位置和视场角来实现这一效果：

<左右滑动查看>

3D特效

大多数生成式模型都是预测像素的。而预测3D场景有很多好处：

- 场景持久性：一旦生成了一个世界，它就会稳定存在。即使你转开视线后再次观看，场景也不会在你看不见时发生变化。

- 实时控制：生成场景后，你可以在其中实时移动。你可以仔细观察花朵的细节，或是探头查看角落后面有什么。

- 几何精确性：这个生成的世界遵循基本的3D几何物理规则。它们具有真实的立体感和空间深度，与某些AI生成视频的虚幻效果形成鲜明对比。

可视化3D场景最简单的方法是，就是使用深度图（depth map）。在深度图中，每个像素都会根据其到相机的距离来着色：

我们不仅可以利用3D场景结构来创建交互特效：

还可以创建自动运行的动态效果，为场景注入生命力：

<左右滑动查看>

名画中的3D世界也可实时交互了。

走进梵高的露天咖啡馆

现在，我们可以以全新的方式，体验标志性的艺术作品了！

原画中没有任何东西，是由模型生成的。

下面，就让我们走进从梵高、霍珀、修拉和康定斯基最喜欢的作品中生成的世界。

<左右滑动查看>

创意工作流

现在，3D世界生成可以十分自然地和其他AI工具组合在一起，创作者们可以使用已知的工具，获得无比丝滑的全新体验了。

首先，可以通过使用文本到图像模型生成图像，来从文本创建世界。

不同的模型都有自己的不同风格，而空间智能世界可以继承这些风格。

下面就是使用不同的文本到图像模型生成同一场景的四个变体，它们使用的都是相同的提示。

提示：一间充满朝气的动漫风格青少年卧室，床上铺着五颜六色的毯子，书桌上杂乱地摆着一台电脑，墙上贴满了海报，各种运动器材随意地散落在房间里。一把吉他斜靠在墙边，房间中央铺着一块带有精美图案的舒适地毯。窗外透进的阳光为整个房间营造出温馨活力的青春氛围。

<左右滑动查看>

现在，已经有一些创作者提前试用了。

比如Eric Solorio就使用这个模型，填补了自己创意工作流程中的空白，可以让场景中的角色可以上阵，甚至还能指导摄像机精确移动。

Brittani Natail则将World Labs技术与Midjourney、Runway、Suno、ElevenLabs、Blender和CapCut等工具相结合，在生成的世界中精心设计了摄像机路径。

因此，得以在三部短片中唤起不同的情绪。

现在，候补名单已经开放了，话不多说了，赶快去申请吧。

空间智能

计算机视觉下一个前沿

此前，李飞飞在一次活动中，首次详细揭秘了何谓「空间智能」：

视觉化为洞察，看见成为理解，理解导致行动。

她将人类智能归结为两大智能，一是语言智能，另一个便是空间智能。虽然语言智能备受关注，但空间智能将对AI产生重大的影响。

而在4月公开的TED演讲中，李飞飞也分享了自己关于空间智能的更多思考，同时预示着World Labs的目标所在。

她表示，「所有空间智能的生物所具备的行动能力，是与生俱来的。因为，它能够将感知与行动进行关联」。

「如果想让AI超越其自身当前的能力，我们需要的是，不仅仅能够看到、会说话的AI，而是一个可以行动的AI」。

就连英伟达高级计算机科学家Jim Fan称，「空间智能，是计算机视觉和实体智能体的下一个前沿」。

正如World Labs的官博所阐述的那样，人类智能包含了诸多方面。

语言智能，可以让我们通过语言与他们进行交流和联系。而其中最为基础的便是——空间智能，能够让我们理解，并与周围世界进行互动。

此外，空间智能具备了极强的创造力，可以将我们脑海中的画面，在现实中呈现。

正是有了空间智能，人类能够推理、行动和发明。从简单的沙堡到高耸的城市可视化设计，都离不开它。

在接受彭博最新采访中，李飞飞表示，人类的空间智能，实际上经过了数百万年的演化而来。

这是一种理解、推理、生成，甚至在一个3D世界中互动的能力。不论是你观赏美丽的花朵，尝试触摸蝴蝶，还是建造一座城市，所有这些皆是空间智能的一部分。

不仅是人类，动物身上也可以看到这一点。

那么，如何让计算机也能具备空间智能的能力呢？其实我们已经取得了巨大的进步，过去十年AI领域的发展相当振奋人心。

一句提示，AI生成图像、视频，真知还能讲述故事。这些模型已经以全新的方式，重塑人类的工作和生活方式。

而我们仅是看到了GenAI革命前夜的第一章。

下一步，如何超越？

需要将这些能力，如何带到3D领域。因为现实世界，就是3D的，同时人类空间智能是建立在非常「原生」的理解和操作3D的能力之上的。

如今，单个图像生成3D世界模型，让我们对空间智能有了初步的理解。

参考资料：

https://x.com/DrJimFan/status/1863646433435586903

https://x.com/drfeifei/status/1863618536318345688

>End

>>>

本文转载自“新智元”，原标题《3个月估值10亿，李飞飞空间智能首个模型诞生！一张图生成3D世界，视频游戏要变天》。

为分享前沿资讯及有价值的观点，太空与网络微信公众号转载此文，并经过编辑。

未按照规范转载及引用者，我们保留追究相应责任的权利

部分图片难以找到原始出处，故文中未加以标注，如若侵犯了您的权益，请第一时间联系我们。

HISTORY/往期推荐

商业火箭，想说爱你不容易——（一）中途夭折的商业火箭起步之旅

商业火箭，想说爱你不容易——（二）难以复制的SpaceX

商业火箭，想说爱你不容易——（三）中国商业火箭未来之路怎么走？

>>>

充满激情的新时代，

充满挑战的新疆域，

与踔厉奋发的引领者，

卓尔不群的企业家，

一起开拓，

一起体验，

一起感悟，

共同打造更真品质，

共同实现更高价值，

共同见证商业航天更大的跨越！

——《太空与网络》，观察，记录，传播，引领。

>>>

·《卫星与网络》编辑委员会

高级顾问：王国玉、刘程、童旭东、相振华、王志义、杨烈

· 《卫星与网络》创始人：刘雨菲

· 《卫星与网络》副社长：王俊峰

· 微信公众号（ID：satnetdy）团队

编辑：艳玲、哈玫，周泳、邱莉、黄榕、娜娜

主笔记者：李刚、魏兴、张雪松、霍剑、乐瑜、稻子、赵栋

策划部：杨艳、若㼆、李真子

视觉总监：董泞

专业摄影：冯小京、宋伟

设计部：顾锰、潘希峎、杨小明

行政部：姜河、林紫

业务部：王锦熙、瑾怡

原创文章转载授权、转载文章侵权、投稿等事宜，请加微信：15910858067

商务合作；展览展厅设计、企业VI/CI及室内设计、企业文化建设及品牌推广；企业口碑传播及整体营销传播等，请加微信：13811260603

杂志订阅，请加微信：wangxiaoyu9960

· 卫星与网络各分部：

成都分部负责人：沈淮

长沙分部负责人：宾鸿浦

西安分部负责人：郭朝晖

青岛分部负责人：江伟

· 卫星与网络总部负责人：农燕

· 会议活动部负责人：乔颢益、许克新、董今福

· 投融资及战略层面合作：刘雨菲

· 本平台签约设计公司：一画开天（北京）文化创意设计有限公司

· 航天加（深圳）股权投资基金管理负责人：杨艳

太空与网络

充满激情的新时代，充满挑战的新疆域，与踔厉奋发的引领者，卓尔不群的企业家，一起开拓，一起体验，一起感悟，共同打造更真品质，共同实现更高价值，共同见证商业航天更大的跨越！ ——《太空与网络》，观察，记录，传播，引领。

最新文章

欧空局：2024年遥感领域重大事件

宇宙人(1652期）星图测控开启申购，发行价格为6.92元/股；三星在英国起诉中兴通讯； xAI公布60亿美元融资部分投资者名单

美国制裁8年仍是全球第一：他打造了外媒眼中“最可怕的中国制造”

上海低空经济国资平台成立：注册资本9亿元、背后有机场集团等六大股东

宇宙人(1651期）2025载人航天飞行任务标识投票通道开启；美军事卫星在轨解体，产生50多块碎片；卫星加油站将于2027年建成

这位中国老板，掌控全球半导体关键金属，却鲜为人知

卫网君：9.24亿 “卖天” 中止，对低空经济有哪些影响？SLS重型火箭项目面临取消；未来太空发射成本会降至什么水平？

年包70万挖人、出海精准撒钱，中国公司与Sora短兵相接

也说遥感共性产品，行业需要什么样的遥感产品？

互联网低轨01组卫星上天，还有12992颗将与美星链比拼

宇宙人(1650期）嫦娥六号月球样品揭示人类首份日背古磁场信息；卫星导航位置服务系统在澳门开通；三家公司将合作推出GTO拼车服务

特斯拉皮卡入华，怎么这么难

为什么有的手机能连卫星？

特斯拉拥抱激光雷达，恐怕只是一个误会

宇宙人(1649期）谷神星一号海射型遥四运载火箭一箭四星成功发射；嫦娥六号、低轨通信卫星星座入选“2024全球十大工程成就”

全球追打英伟达

一文看懂SpaceX和我国商业航天新局

北斗规模应用亟待有个远景规划

宇宙人(1648期）神十九乘组首次出舱刷新多项纪录；星图测控拟在北交所上市；220吨级大推力补燃循环氢氧发动机首次整机试验成功

6000亿，60家，首批“推荐IPO”企业名单定了？

史上最大独角兽诞生：SpaceX估值25000亿

"中国看到了这一切，正加大投资卫星项目挑战星链"

宇宙人(1647期）星网01组轨道数据；神十九航天员近日将首次出舱；星链明年收入预计达118亿；ULA欲将上面级改为留轨作战平台

智谱又融了30亿！超200亿估值引领大模型创业赛道

中国星网，来了

“5倍声速”搭上“星链”，高超声速无人机时代拉开序幕？

宇宙人(1646期）海南商业发射场一号工位将迎长征八号首秀；中国航天商业卫星公司在津建成年产能过百颗卫星的生产线；S33静态点火

中美科技合作协定终获续签，但这些关键技术被排除其外

卫网君：嫦娥七号将携带分辨率达0.275米的高分立体相机；长光卫星应把主要精力放在应用模式开发和市场开拓上；星链的网速在变慢吗？

为什么硅谷的科技巨头们正在强势押注核能……

硅谷投资人：马斯克星舰打开太空经济赛道

10年亏掉480亿美元，AT&T甩卖有线电视

宇宙人(1645期）长二丁成功发射高速激光钻石星座试验系统；Viasat在阿联酋首次演示手机直连卫星；导航故障致机智号任务终结

欧洲新能源大败局：花200亿美元做不好一块汽车电池

美智库：实现天基核指挥、控制和通信的现代化

身家4000亿美元！马斯克，史上第一人！

宇宙人(1644期）澳大利亚“抓拍”中国资源三号卫星；科学家建议在月球建“天眼”；Orbite通过A轮融资扩大豪华太空训练

通用梦碎自动驾驶

低轨通信卫星行业产业链分析：相控阵T/R组件价值量占比高

美国对中国激光雷达忧心忡忡

宇宙人(1643期）嫦娥八号将在月球造人类第一块月壤砖；北京加快打造商业航天产业高地；火箭实验室披露为美国防部完成高超音速试验

谷歌“量子霸权”再进一步，马斯克惊呼：Wow

亚轨道远程极速重载运输系统总体设计与控制技术研究

华邮「SpaceX超能力」报道引人深思……

宇宙人(1642期）执行新型任务的长征五号B即将正式亮相；星舰一级B14进行静态点火测试；德国电信、高通和Skylo试验卫星短信

最高罚款超50亿美元，中国为何会对英伟达动手？

在太空开采阳光：从日本测试高空太阳能传输，到全球探索“卫星光伏”新时代

美国登月又推迟，马斯克能救得了吗？

宇宙人(1641期）长八甲遥一火箭装船起运明年1月首飞；嫦娥七号将携带最新最强的高分立体相机；美国拆除中国通信设备还缺30亿美元

大模型混战这一年：进化之赛、效率之争、落地之战

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉