涉及20+实验室,打磨2年!华人小伙儿领衔的开源生成式物理引擎Genesis令人惊叹!

科技   2024-12-19 21:43   北京  
文丨谭梓馨
近日,除了谷歌、OpenAI等大厂在AI生成视频领域的争锋较量,下面这个可能是最酷的一项AI进展了:
一个能够生成4D动态世界的生成式物理引擎和模拟平台,而且完全开源——Genesis。

该项目核心贡献者之一、卡内基梅隆大学机器人研究所博士Zhou Xia通过社交媒体介绍:这是一个由真实物理学提供支持,包含你喜爱的生成模型的一切,是经过24个月的大规模研究合作,涉及20多个研究实验室的研究成果。
Genesis能够生成4D动态世界,由专为通用机器人和物理AI应用设计的物理模拟平台提供支持,采用纯Python开发,速度比现有的GPU加速堆栈快10-80倍,模拟速度比实时速度快约430000倍!
此外,Genesis从头开始实现了一个统一的模拟框架,集成了大量最先进的物理求解器,允许在虚拟领域中以最高的真实感模拟整个物理世界。
话不多说,直接看效果:‍

不少网友表示amazing,这个Genesis(创世纪)生出的视频看起来比谷歌Veo2还6!

AI距离真正理解物理世界的日子似乎没那么遥远了。

项目背后的人

Genesis核心成员发起人淦创教授对项目背后的一些故事进行了回顾。

淦创目前是马萨诸塞大学阿默斯特分校的教员,同时在麻省理工学院IBM Watson AI实验室任研究经理。他曾在清华大学以最高荣誉获得博士学位,指导老师是姚期智教授。
自2018年以来,淦创将研究重点从视觉转向具身人工智能,致力于创建能够与物理世界和其他具有类似人类灵活性的智能生物互动的通用代理——具身AGI。

淦创团队的核心方法是对人类心理模型进行逆向工程,并构建由生成物理引擎驱动的机器人大脑。业内许多机器人专家对这种方法持怀疑态度,指出设置模拟器和解决模拟与现实差距的困难,因此主张只专注于从现实世界的数据中学习。 
而淦创对此表示:“我理解这些担忧,但我坚信我们不能绕过物理模拟器,因为创建一个好的模拟器同样很有挑战性!” 
两年前,淦创认识了Zhou Xian(MIT-IBM AI Lab研究实习生),后来在一支由学生和其他研究人员组成的优秀团队配合下着手推进Genesis项目。
淦创推文中还表示因为Genesis项目导致Zhou Xian博士毕业推迟感到有点内疚,但付出是值得的,今天终于达成了一个重要里程碑。
4大功能和9大特点
一句话简介Genesis,这是一个专为通用机器人、具身人工智能和物理人工智能应用而设计的综合物理模拟平台。
具体来讲,它有4大功能:
从头开始重新构建的通用物理引擎,能够模拟各种材料和物理现象。
轻量级、超快、Python风格且用户友好的机器人模拟平台。
强大而快速的照片级真实感渲染系统。
能够将用户提示的自然语言描述转换为各种数据形式的生成数据引擎。
Genesis将各种物理解算器及其耦合集成到一个统一框架中,该引擎通过在更高级别运行的生成代理框架得到进一步增强。
此外,还有9大特点:
速度:Genesis提供了前所未有的模拟速度——使用单个RTX4090模拟Franka机械臂时速度超过4300万FPS(比实时快430000倍)。

跨平台:Genesis可在不同的系统(Linux、MacOS、Windows)和不同的计算后端(CPU、Nvidia GPU、AMD GPU、Apple Metal)上本地运行。
各种物理求解器的统一:Genesis开发了一个统一的模拟框架,集成了各种物理求解器,涵盖刚体、MPM、SPH、FEM、PBD、稳定流体。
支持广泛的材料模型:Genesis支持刚体和铰接体、各种类型的液体、气体现象、可变形物体、薄壳物体和颗粒材料的模拟和耦合。
支持各种各样的机器人:机器人手臂、腿式机器人、无人机、软体机器人等,并广泛支持加载不同文件类型:MJCF(.xml)、URDF、.obj、.glb、.play、.stl等。
逼真且高性能的光线追踪器:Genesis支持基于原生光线追踪的渲染。
可微分性:Genesis的设计完全兼容可微分模拟。
基于物理的触觉传感器:Genesis涉及基于物理且可微分的触觉传感器模拟模块。
用户友好性:从安装到API设计,Genesis的设计方式使使用模拟尽可能简单。

目前,他们正在开源底层物理引擎和模拟平台,期待与更多机器人和计算机图形学领域的贡献者携手并进。
有意思的典型应用展
Genesis生成框架旨在自动生成多种类别的数据,模式包括:物理准确且空间一致的视频、相机运动和参数、人类和动物角色动作、机器人操控和运动策略,可部署到现实世界、完全交互式的3D场景、开放世界铰接式物体生成、语音音频、面部动画和情感等。
例如角色动作生成:

以及各种机器人政策生成以及Sim2Real政策转移。
Genesis可利用生成式机器人代理和物理引擎自动生成不同场景下各种技能的机器人策略和演示数据,无论是机械臂、机器狗还是人型机器人,软体混合机器人等。

此外,Genesis还支持3D和完全交互式场景生成,以及开放世界铰接式物体生成:

可以说,Genesis使用模拟技术在虚拟领域中以较好的物理、视觉和感官保真度重新创建整个物理世界,这能够最大限度地减少人类在机器人和其他领域收集和生成数据方面的努力,让数据飞轮自行旋转。
这个开源项目如果不断加以扩充完善,当真有望是未来具身AGI乃至生成式AI方向很有实际意义的一块拼图。
最后,开源代码在这里:https://github.com/Genesis-Embodied-AI/Genesis
感兴趣的开发者小伙伴快去看一下吧。

如果您有什么想说的,欢迎在评论区留言讨论!
投稿或寻求报道,欢迎私信“投稿”,添加编辑微信
如果您想要获取最新的科技趋势分析、行业内部的独家见解、定期的互动讨论和知识分享、与行业专家的直接面对面交流的机会!
欢迎扫描下方二维码,加头部科技创始人、AI头号玩家俱乐部主理人晶总微信!

头部科技
头部科技是技术新世界的记录者、探索者和推动者。我们致力于普及细分场景的科技解决方案,打造科技和人才创新知识图谱。无论你身处技术公司或传统行业,在这里都可以找到智能化、数字化升级的案例和伙伴。在无限的时空中,和你共同探索科技原力是我们的荣光。
 最新文章