CMU | CVPR 2024 | Diffusion-ES: 基于扩散的无梯度规划，用于自动驾驶和指令引导驾驶

文摘 2024-07-08 08:13 北京

欢迎关注微信公众号“机器人EmbodiedAI”

论文题目：Diffusion-ES: Gradient-free Planning with Diffusion for Autonomous and Instruction-guided Driving

论文链接：https://openaccess.thecvf.com/content/CVPR2024/papers/Yang_Diffusion-ES_Gradient-free_Planning_with_Diffusion_for_Autonomous_and_Instruction-guided_Driving_CVPR_2024_paper.pdf

一、方法

Diffusion-ES（扩散优化策略）在建模复杂和多模态轨迹分布以支持决策和控制方面表现突出。最近提出了基于奖励梯度引导的去噪方法，用于生成既最大化可微分奖励函数又符合扩散模型捕获的数据分布概率的轨迹。奖励梯度引导的去噪方法需要一个可微的奖励函数适应于清洁样本和噪声样本，限制了其作为通用轨迹优化器的适用性。在本文中，我们提出了Diffusion-ES，一种将无梯度优化与轨迹去噪相结合的方法，用于优化黑盒非可微目标，并保持在数据流形内。Diffusion-ES通过从扩散模型中采样轨迹，并使用黑盒奖励函数对其进行评分。它通过截断扩散过程来变异高分轨迹，应用少量的噪声和去噪步骤，从而能够更有效地探索解空间。我们展示了Diffusion-ES在nuPlan上取得了最先进的性能，这是一个针对自动驾驶的建立闭环规划基准。Diffusion-ES优于现有的基于采样的规划器、反应式确定性或基于扩散的策略，以及奖励梯度引导方法。此外，我们展示了与先前的引导方法不同，我们的方法可以优化由少样本大语言模型提示生成的非可微语言形式奖励函数。在受人类教师指导并发布跟随指令的情况下，我们的方法可以生成新颖且高度复杂的行为，如激进的车道变换，这些行为在训练数据中并不存在。这使得我们能够解决超出现有轨迹优化方法和驾驶策略能力的最困难的nuPlan场景。

论文的贡献：

我们引入了Diffusion-ES，一种用于优化黑盒目标的轨迹优化方法，使用轨迹扩散模型在基于采样的搜索过程中对轨迹提案进行采样和变异。我们展示了Diffusion-ES在nuPlan闭环驾驶中与工程规划器的性能相匹配，并在优化需要灵活驾驶行为（超越车道跟随）的更复杂奖励函数时远远超过它们。据我们所知，这是首次将进化搜索与扩散模型结合使用。
我们展示了Diffusion-ES可以通过优化大语言模型（LLM）形式的奖励函数来遵循语言指令，并通过调整闭环驾驶行为来控制自动驾驶车辆，而无需任何语言和行为的训练数据。我们展示了这种指令跟随能够解决nuPlan中最具挑战性的驾驶场景。
我们展示了对我们模型进行了广泛的消融分析，根据不同的条件信息量进行了实验，清楚地揭示了在驾驶中推理速度和超出分布的泛化能力之间的权衡。

二、实验结果

三、总结

我们介绍了Diffusion-ES，一种基于黑盒奖励引导的扩散采样方法。我们展示了Diffusion-ES能够有效优化nuPlan中的驾驶和按指令跟随任务的奖励函数，并且在工程化的基于采样规划器、反应式确定性或扩散策略，以及可微分的奖励梯度引导方法方面表现优越。我们展示了我们的方法如何在没有任何语言-行动轨迹数据的情况下，仅使用大语言模型提示生成形状奖励地图来进行测试时优化按语言指令行动的能力。

我们未来的工作将探索在没有人类教师的情况下，获取适合处理长尾驾驶场景的正确奖励塑形方法。我们的实验展示了扩散策略在场景条件化过程中推理速度和超出分布泛化能力之间的权衡。我们未来的工作将探索将这类搜索结果摊销到快速反应策略上的方法，并在两个极端之间找到平衡，以便根据场景需要灵活分配计算资源。

http://mp.weixin.qq.com/s?__biz=MzA4NTAzMjIwMg==&mid=2447667957&idx=1&sn=5d847369afbf0ff39eef843765703d81

机器人EmbodiedAI

与世界交互

最新文章

CVPR 2024 | 自动驾驶 | 多模态事故视频理解数据集MM-AU

CVPR 2024 | 多智能体、多次遍历、多模态自动驾驶：开放MARS数据集

CVPR 2024 | 驾驶视频去雾技术中的非对齐正则化安全辅助

CVPR 2024 | SynFog：基于端到端成像仿真的逼真合成雾数据集

CVPR 2024 | LMDrive：利用大型语言模型的闭环端到端驾驶

浙大| Let Occ Flow: Self-Supervised 3D Occupancy Flow Prediction

CVPR 2024 | 使用证据理论对准确的训练数据进行自动驾驶中的占用地图预测

英伟达 | CVPR 2024 | VLP: 视觉语言规划用于自动驾驶

华为诺亚 | CVPR 2024 | 全面理解自动驾驶：通过注入鸟瞰视角的多模态大模型

2024 arxiv | 百度 | 探索端到端自动驾驶的因果关系

南大&英伟达 | CVPR 2024 | 开环端到端自动驾驶仅仅需要Ego Status吗？

西安交大 | CVPR 2024 | 在自动驾驶中对单目深度估计的物理3D对抗攻击

ETH | CVPR 2024 | 基于消失点引导的驾驶场景视频语义分割

CVPR 2024 | 点亮夜晚：一种用于自动驾驶中无配对低光增强的多条件扩散框架

CVPR 2024 | 压缩的端到端自动驾驶运动规划器

CVPR 2024 | AIDE: 用于自动驾驶目标检测的自动数据引擎

上海AI Lab | CVPR 2024 | PACER+：自动驾驶场景中的行人动画控制

大疆 | CVPR 2024 | 自动驾驶中单视图和多视图深度的自适应融合

CVPR 2024 | 自然数据投毒对自动驾驶轨迹预测的对抗性后门攻击

CVPR 2024 | 安全驾驶感知中的诱因自视角事故视频理解

CMU | CVPR 2024 | Diffusion-ES: 基于扩散的无梯度规划，用于自动驾驶和指令引导驾驶

华为诺亚| CVPR 2024 | CaDeT：一种用于自动驾驶中鲁棒轨迹预测的因果解缠方法

CVPR 2024 | NeuRAD: 自动驾驶场景的神经辐射场

CVPR 2024 | 利用自监督学习促进自动驾驶Radar

博士论文 | 面向自动驾驶的预训练基础大模型研究

CVPR 2024 | ChatSim：通过LLM-Agents进行自动驾驶仿真场景编辑

CVPR 2024 | DrivingGaussian：用于周围动态自动驾驶场景的复合高斯溅射

CVPR 2024 | 反馈引导的自动驾驶

毫末 | CVPR 2024 | Cam4DOcc：用于自动驾驶应用中基于摄像头的4D占据预测的基准Benchmark

面向自动驾驶的预训练基础大模型研究

CVPR 2024 | VLP：自动驾驶的视觉语言规划

CVPR 2024 | LaMPilot: 自动驾驶语言模型程序的开放基准数据集

最新 | 地平线VADv2：通过概率规划实现矢量化端到端自动驾驶

Occupancy-MAE: 基于占据栅格MAE的自动驾驶大场景点云自监督预训练

英伟达CVPR 2024 | PARA-Drive：并行架构的实时自动驾驶

CVPR 2024 | DUALAD：端到端自动驾驶中区分动态和静态世界

CVPR 2024 | GAFusion：多向导引下的适应性融合LiDAR和摄像头的3D目标检测

自动化所张兆翔组最新工作 | 端到端自动驾驶 | 世界模型 | 预训练

清华大学&鉴智鉴智机器人 CVPR2024 | 张量低秩分解用于自驾3D Occupancy预测

CVPR 2024 | 自动驾驶世界模型

CVPR 2024 | 端到端三维重建

CVPR 2024 | 像预测下一个Token进行目标识别

自监督多视角立体视觉深度估计MVSNet系列论文整理

聊聊无人驾驶汽车的发展历史(一）——从无线电控制到机器视觉

聊聊无人驾驶汽车的发展历史(二）——军方、大学和汽车公司合作研究

聊聊无人驾驶汽车的发展历史(三）——DARPA无人驾驶挑战赛

聊聊无人驾驶汽车的发展历史(四）—— Google无人驾驶发展之路

聊聊无人驾驶汽车的发展历史(五）——Tesla Autopilot进化史

三维视觉：针孔相机模型与坐标转换

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉