中国科学院大学:通过隐式世界模型增强端到端自动驾驶

汽车   2024-07-04 22:52   上海  

来源:自动驾驶专栏 | 首图图源:网络
全文 1000+ 字,预计阅 10-15 分钟
进群交流:点此处


  • 论文链接:https://arxiv.org/pdf/2406.08481
  • 代码链接:https://github.com/BraveGroup/LAW


摘要
本文介绍了通过隐式世界模型增强端到端自动驾驶。端到端自动驾驶已经引起了广泛关注。当前的端到端方法在很大程度上依赖于感知任务的监督,例如检测、跟踪和地图分割,以辅助学习场景表示。然而,这些方法需要大量标注,这阻碍了数据的可扩展性。为了应对这一挑战,本文提出了一种新的自监督方法来增强端到端驾驶,而无需昂贵的标注成本。具体而言,本文框架LAW使用一种隐式世界模型,其基于预测的自车行为和当前帧的隐式特征来预测未来的隐式特征。该预测的隐式特征由未来实际观测到的特征来监督。该监督联合优化了隐式特征学习和行为预测,这大大提升了驾驶性能。因此,本文方法在开环和闭环基准上均实现了最先进的性能,而无需成本高昂的标注。

主要贡献
本文的主要贡献总结如下:
1)本文提出了一种用于自监督学习的隐式世界模型,其增强了端到端自动驾驶框架的训练;
2)基于潜在的世界模型,本文进一步提出了一种视图选择策略,该策略大大加快了流程的运行速度,同时使性能损失最小;
3)本文框架LAW在开环基准和闭环基准上均实现了最先进的结果,而无需人工标注。

论文图片和表格

总结
本文引入了一种新的使用隐式世界模型的自监督方法。该方法增强了端到端自动驾驶系统中场景表示的学习,而无需成本高昂的标注。尽管本文方法在当前基准上展现出具有前景的结果,但是它仍然受到所用数据量有限的限制。在今后的工作中,本文旨在通过将所提出方法应用于更大、更多样化的数据集来增强其可扩展性。本文利用大规模数据来尝试采用隐式世界模型进行预训练。
公号👇发消息“我来了”,可直接领取“10G+自动驾驶相关资料”
<-  联 系 & 声 明  ->
【声明】除文内特殊声明外,本公众号内所有文章编写或转载的目的仅用于学习和交流,不予以商用,不代表本号观点及立场。本公众号内资讯及正文引用图片均由个人公众号 ADS 智库六耳基于官网或公开信息梳理或引用。本公众号所引用及转载内容版权均归原作者所有,凡是注明来源 “ XXX ADS 智库 ” 或作者为 “ XXX 六耳、XXX ADS 智库 ” 的文章转载或引用时请注明来源 ADS 智库。若有版权或其他任何问题请联系六耳( 微信号:adas_miao ),本号将及时处理。

转发、点赞、在看
,安排一下?

ADS智库
聚焦 ADAS \x26amp; ADS 相关内容,公号发消息『我来了』免费领取 10G+ 自动驾驶资料
 最新文章