AI教母李飞飞提出“数字表亲”概念:数字孪生的消费降级?

科技   2024-10-15 08:30   浙江  

参数君导读:“数字表亲”是斯坦福大学李飞飞教授领导的团队提出的一个新概念,旨在为机器人训练提供一种高效且低成本的方法。与传统的数字孪生技术不同,数字表亲并不是真实物体的一比一虚拟对应,而是通过捕捉物体的几何和语义特征来生成具有相似特质的虚拟场景。

数字表亲似乎是并夕夕版的数字孪生。

不追求一比一复制:数字表亲并不追求与真实物体完全相同的虚拟复制品,而是创建具有相似几何和语义特征的虚拟对象。这意味着数字表亲不需要构建真实物体的精确虚拟副本,从而降低了成本。

增强泛化能力:数字表亲通过简单拍照即可创建,用于机器人训练,提供变化多样的训练场景,从而增强模型的泛化能力。这使得机器人在面对不同环境时能够更好地适应和学习。

支持零样本迁移:数字表亲的方法能够自动生成与真实物体相似的虚拟版本,训练出的机器人策略更稳健,并支持零样本迁移。这意味着机器人可以在没有见过具体样本的情况下进行学习和应用。

降低训练成本:数字表亲通过减少对高成本数字孪生技术的依赖,大大降低了训练成本。这种方法不仅提高了效率,还解决了传统数字孪生技术在实际应用中的高成本问题。

01.

数字表亲概念横空出世

在机器人训练领域,一直存在着诸多挑战。现实世界中训练机器人成本高昂、安全风险大且难以大规模扩展,而模拟环境虽然成本低且能获取大量训练数据,但与现实环境存在语义和物理差异。为了解决这些问题,数字孪生概念应运而生,它为真实场景构建虚拟副本,然而成本高且难以实现跨域泛化。正是在这样的背景下,AI 教母李飞飞提出了数字表亲的概念。

ACDC: Automated Creation of Digital Cousins for Robust Policy Learning

数字表亲不同于数字孪生,它并非真实物体的虚拟对应,而是具有相似的几何和语义特质和属性。这一概念的提出,旨在降低真实转模拟的成本,同时提升学习的泛化性能。通过数字表亲,仅需拍一张照片,就能将照片中的物体变成虚拟版本,且这个虚拟版本不是一比一复刻,而是存在一定变化。

这种方式既能降低生成相似虚拟环境的成本,又能通过提供相似训练场景的分布,实现更好的跨域泛化。例如,在斯坦福大学李飞飞团队的研究中,他们提出了自动数字表亲创建(ACDC)方法,可生成完全可交互的场景以及训练可零样本方式部署的机器人策略。

实验结果显示,基于数字表亲训练得到的策略在零样本虚拟→真实迁移条件下,能以 90% 的成功率胜过数字孪生的 25%。这一突破性的成果为机器人训练带来了新的希望和方向。

看来不是简单的消费降级!

02.

数字表亲与数字孪生的差异

(一)建模方式不同

数字孪生就像是一个追求极致完美的艺术家,力求对现实世界进行精确复制,每一个细节都要与真实场景一一对应,如同镜子里的影像般分毫不差。

然而,数字表亲则更像是一位善于捕捉神韵的画家,它并不苛求在所有微小细节上重建给定场景,而是专注于保留更高级别的细节,例如空间关系和语义。数字表亲通过提取关键信息,从数据库中选择相似的虚拟物品,搭建一个与现实场景 “神似” 而非 “形似” 的虚拟世界。

数字表亲并非真实物体的精确虚拟对应,而是具有相似的几何和语义特质与属性。为了实现数字表亲的自动创建,团队开发了自动数字表亲创建(ACDC)方法。

ACDC 系统工作流程大致分为三步:首先从输入的 RGB 图像中提取出物体的掩膜、深度信息等;接着根据提取的信息,从数据库中找到与现实物体最相似的数字模型,并根据物体类别和特征调整模型的尺寸和方向;最后将匹配好的数字模型组合在一起,生成一个完整的虚拟场景,并进行物理上的调整,确保场景的稳定性和合理性。

以一个厨房为例,数字孪生会努力还原每一个锅碗瓢盆的材质、光线的照射角度等细节,而数字表亲则会关注厨房里有哪些主要的家具及其大致形状和位置关系。

(二)成本与泛化能力差异

在成本方面,数字表亲具有明显优势。数字表亲不需要像数字孪生那样精确地复制现实世界,制作起来更加简单,成本也更低。根据相关研究数据显示,构建数字孪生的成本往往十分高昂,而数字表亲的制作成本则相对较低,为机器人训练提供了一种经济实惠的解决方案。在泛化能力上,数字表亲表现更为出色。一个现实物体可以有多个数字表亲,这些表亲之间存在细微的差异,这就为机器人提供了更多样化的训练数据,使其能够学习应对各种不同的情况。相比之下,数字孪生由于过于追求精确复制,难以实现跨域泛化。

例如,在斯坦福大学的实验中,用数字表亲训练的机器人在完成开门、开抽屉、放碗等任务时,成功率更高,对不同型号的家具也更适应;

而用数字孪生训练的机器人一旦遇到没见过的家具,就容易出现问题。这充分证明了数字表亲具有更强的泛化能力,能更好地帮助机器人适应复杂多变的现实世界。

03.

数字表亲对数字孪生发展的影响

(一)推动成本降低

数字表亲以其较低的制作成本为机器人训练提供了新的途径,这给数字孪生带来了巨大的压力,也促使数字孪生在降低成本方面进行改进,以提高竞争力。由于数字表亲不需要像数字孪生那样精确复制现实世界,制作成本相对较低。

例如,在一些实际应用场景中,构建数字孪生的成本可能高达数十万元甚至更高,而数字表亲的成本可能仅为其几分之一。这种成本上的差异使得数字孪生不得不重新审视自身的制作流程和技术手段,寻求更加高效、低成本的解决方案。数字孪生可能会借鉴数字表亲的一些方法,如简化建模过程、优化数据采集和处理方式等,以降低成本。同时,数字孪生也可能会与数字表亲相结合,在一些对精度要求较高的场景中使用数字孪生,而在一些对成本敏感的场景中使用数字表亲,以实现成本和精度的平衡。

(二)促进技术创新

数字表亲的出现促使数字孪生领域思考新的建模方式和训练策略,推动技术不断创新。数字表亲专注于保留更高级别的细节,如空间关系和语义,这种建模方式为数字孪生提供了新的思路。数字孪生可以借鉴数字表亲的这种方法,不再仅仅追求精确复制现实世界,而是更加注重提取关键信息和保留重要特征。

在训练策略方面,数字表亲通过提供相似训练场景的分布,实现了更好的跨域泛化能力。这也促使数字孪生思考如何改进自己的训练策略,以提高机器人在不同场景下的适应性。例如,数字孪生可以尝试引入更多的随机因素,增加训练数据的多样性,或者采用更加先进的机器学习算法,提高模型的泛化能力。

此外,数字表亲的自动数字表亲创建(ACDC)方法也为数字孪生的技术创新提供了借鉴。数字孪生可以探索类似的自动创建方法,提高建模的效率和准确性。总之,数字表亲的出现为数字孪生的发展带来了新的机遇和挑战,推动数字孪生不断进行技术创新,以适应不断变化的市场需求。(部分图片源自李飞飞论文,其余图片源自网络)

数字孪生城市
【用深度,记录数字经济时代】——BIM、GIS、CIM、建筑信息模型、物联网、城市信息模型、实景三维、激光扫描、GPT、数字孪生城市、数字孪生流域、数字孪生工程、数字孪生工厂、智慧工地、智慧城市、新型智慧城市、数字中国、元宇宙
 最新文章