速递｜李飞飞 World Labs 推出首个 AI 系统—— 生成从图片到可交互的 3D 场景

科技 2024-12-03 09:35 浙江

李飞飞创立的 World Labs 推出了首个项目 —— 一个能从单张照片生成类似游戏 3D 场景的 AI 系统，其独特性在于支持交互且可以修改。

World Labs 的系统能为场景提供交互效果和动画，例如更改物体的颜色和动态调整背景灯光。

该系统属于一个新兴的 AI 类别——“世界模型”（World Models），许多此类模型可以模拟游戏和 3D 环境，但通常存在伪影和一致性问题。

初创公司 Decart 的 Minecraft 模拟世界模型 Oasis 分辨率较低，并且容易“忘记”关卡布局。

World Labs 在官方博客中提到，目前的大多数生成式 AI 工具生成的是 2D 内容，比如图像或视频，而生成 3D 内容则提升了控制力和一致性。这将改变我们制作电影、游戏、模拟器以及其他物理世界数字表现形式的方式。

World Labs 的系统将图片转换为可交互和探索的 3D 场景。用户可以通过使用箭头键或 WASD 移动，然后单击并拖动鼠标来探索这些 AI 生成的场景。

这些场景在浏览器中实时渲染，并配备可调的模拟景深效果（DoF）。官网上提供了一个调节景深的滑块，景深效果越强，背景物体就越模糊。

World Labs 的方法确保了生成的场景在生成后保持不变，并遵循基本的物理规律，具有一定的实体感和深度感。

World Labs 还支持模拟推拉变焦，同时调整摄像机的位置和视野：

World Labs 还提到，大多数生成模型预测的是像素，而预测 3D 场景则具有许多优势：

持久的现实感
一旦生成了一个世界，它会保持稳定。如果你暂时离开视线，然后再回来，场景不会发生变化。这种持久性提供了更连贯的体验，避免了传统生成模型中场景不一致的情况。
实时控制
在生成场景后，用户可以实时在场景中自由移动。例如，你可以停下来仔细观察一朵花的细节，或者绕过一个角落，看看背后隐藏了什么。这种实时互动使场景更具沉浸感和探索性。
正确的几何结构
World Labs 生成的世界遵循 3D 几何的基本物理规则。这些场景具有实体感和深度感，与某些 AI 生成视频的梦幻性质形成对比，更贴近现实体验。

深度图是将 3D 场景投影到二维空间的一种方式，它通过像素的颜色深浅来表达物体的远近。

例如，离摄像机较近的像素可能被显示为亮色，而较远的像素则为暗色。这种方式直观地展示了场景的三维空间结构，为开发者和用户理解场景的深度和布局提供了重要工具。

通过这些特性，World Labs 的技术为生成式 AI 3D 场景奠定了坚实基础，并大幅提升了内容的交互性、真实性和一致性。

最后，World Labs 还展示了一条视频，作者 Brittani Natali 将 World Labs 的技术与 Midjourney、Runway、Suno、ElevenLabs、Blender 和 CapCut 等工具相结合的工作流程：

✦ 精选内容 ✦

a16z 合伙人预计，继续推动下一代模型，需要每个阶段增加 10 倍计算资源、10 倍电力和 10 倍数据

新出炉的 200+页 AI 现状报告都说了什么？AI First 初创公司营收增速比传统 SaaS 公司要快两倍！

VC 今年以来对 AI 初创公司投资达 641 亿美元，接近 2021 年峰值，但全球 AI 年收入总额也才数百亿美元

有新Newin

无限向新力。

速递｜刚刚，a16z 和 YC 投了 TikTok Shop 直播电商对手！GMV 突破 20 亿美元，估值 50 亿美元

深度｜微软总裁谈 2025 年三大 AI 愿景—— 800 亿美元基建投资、全美百万人技术普及与技术出口，未来四年拉开中美差距

速递｜刚刚，沙特阿美投了一家国内氢能公司

速递｜OpenAI 重启机器人团队！国内又有一家具身智能初创公司获得融资，计划 2025 年交付数百台人形机器人

深度｜Sam Altman 谈中美 AI 军备赛：希望中美合作避免军备赛，美国需要在芯片以及供应链方面保持领先

深度｜AI 的下个十年，藏不住了！

深度｜AI 搜索把 SEO 流量截胡了吗？这家公司希望成为 GenAI 时代的 Semrush！平台用户已超五位数

速递｜20+ 知名大模型厂商都来啦！全国首部 AI 知识产权标准即将出炉（参编征集中）

速递｜杀疯了！豆包视觉理解模型正式发布，价格狂砍 85%，火山引擎总裁谭待沉浸式演示视觉理解三大能力

独家｜小红书加码 AI 应用！原今日资本合伙人戴丽丹担任新战略负责人，风投女王徐新亲自挂帅一级业务

深度｜27 岁华裔亿万富翁 Alexandr Wang：中美 AI 技术差距在缩小，Agent 是 2025 年最大创业机会之一

速递｜比 Pro 还 Pro？苹果计划发布 18.8 寸折叠屏 iPad

速递｜扎克伯格站队马斯克！Meta 向加州总检察长发信阻止 OpenAI “营利”

速递｜YC 今年最火项目之一！超 200 家硅谷 VC 追逐的太空 AI 数据中心，刚刚完成种子轮融资，a16z 和红杉都投了

速递｜英伟达在中国逆势招人！新增数百名员工押注自动驾驶

速递｜苹果首款 AI 服务器芯片 Baltra 曝光！英伟达同款 N3P 生产工艺，预计 2026 年量产

速递｜打破语言障碍！YouTube 支持 AI 自动配音了

速递｜Speak 宣布获得 7800 万美元 C 轮融资，估值 10 亿美元！又一家 AI 应用独角兽

速递｜英伟达涉嫌违反中国反垄断法！市场监管总局决定立案调查

速递｜亚马逊向国内卖家提供 AI 工具 Project Amelia，中国产品销售数量同比增长 20%

深度｜美国国家经济研究局：AI 普及是 PC/互联网同期 2 倍！将深刻改变劳动市场和生产力

速递｜OpenAI 为筹集更多资金，计划放弃微软 “AGI” 限制条款

深度｜AI 教父 Geoffrey Hinton：数字智能会取代生物智能么？

深度｜2024 万字回顾：SaaS 不会被 AI 颠覆，而是加速鞭策

速递｜OpenAI 官宣！未来 12 天开 12 场直播

深度｜Perplexity CEO 斯坦福 MBA 创业对谈&洞察： AI 搜索的未来不是“谷歌”，而是替用户完成任务

速递｜李飞飞 World Labs 推出首个 AI 系统—— 生成从图片到可交互的 3D 场景

速递｜突发，美国对中国芯片实施新的出口管制！中芯国际等 140 家中国公司被列入实体名单

速递｜突发！马斯克已向法院申请禁令阻止 OpenAI 转型营利性组织

深度｜黄仁勋亲述，首次公开英伟达成为全球市值最高公司的奥秘

深度｜万字复盘 ProductHunt 登顶全流程！

速递｜前小米全球副总裁 Hugo Barra 联合创立的 AI Agent 操作系统获谷歌和 Index 投资，估值 5 亿美元

速递｜孙正义的软银愿景基金将追加 15 亿美元投资 OpenAI，又一批员工实现财富自由

速递｜Flux 获 a16z 新一轮 2 亿美元领投！成立不到五个月，估值超 10 亿美元

活动｜2024 AI 产品榜·年度大会暨中国 AI 年度产品颁奖仪式

活动｜中国生成式 AI 大会即将登陆上海！全解大模型、AI Infra、端侧 AI、视频生成和具身智能，30+位重磅嘉宾抢先看

深度｜Sam Altman：让 AI 和每个人对话，便可深入理解数十亿人的共识

深度｜吴恩达最新演讲——AI 四大趋势

速递｜亚马逊 40 亿美元追加投资 Anthropic！云计算大厂与 AI 深度绑定的背后

深度｜英伟达 CEO 黄仁勋香港科技大学对话沈向洋：AI 仅仅靠预训练是远远不够的，未来这三种机器人有望大规模生产

深度｜突发！美国司法部要求谷歌强拆 Chrome 浏览器和 Android 系统，OpenAI 抓住机会推出新浏览器 NLWeb

速递｜瞄准 toB Agent！法国 AI 独角兽 H 推出首款产品 Runner H，专注企业自动化与定制化场景

深度｜Rokid 打响「百镜大战」第一枪！双显AR+AI 眼镜 49g 仅 2499 元

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉