英伟达 | CVPR 2024 | VLP: 视觉语言规划用于自动驾驶

文摘 2024-07-20 07:51 英国

欢迎关注微信公众号“机器人EmbodiedAI”

论文题目：VLP: Vision Language Planning for Autonomous Driving

论文链接：https://openaccess.thecvf.com/content/CVPR2024/papers/Li_Driving_Everywhere_with_Large_Language_Model_Policy_Adaptation_CVPR_2024_paper.pdf

一、方法

适应新环境、习俗和法律的驾驶行为是自动驾驶长期存在的问题，这阻碍了自动驾驶车辆（AVs）的广泛部署。本文介绍了LLaDA，一个简单而强大的工具，使人类驾驶员和自动驾驶车辆能够通过调整其任务和运动计划来适应新地点的交通规则，从而实现到处都能驾驶。LLaDA利用大型语言模型（LLMs）在解释当地驾驶手册中的交通规则时展现出的强大的零-shot泛化能力来实现这一点。通过广泛的用户研究，我们展示了LLaDA的指导在澄清野外意外情况中的实用性。我们还展示了LLaDA在真实世界数据集中调整AV运动规划策略的能力；LLaDA在所有指标上表现优于基线规划方法。

我们的贡献如下：

我们提出了VLP，即视觉语言规划模型，将语言模型的推理能力整合到基于视觉的自动驾驶系统中，以增强运动规划和自动驾驶的安全性。
VLP由两个新颖的组件ALP和SLP组成，旨在分别改进自动驾驶电动车的推理和决策方面。
通过在真实世界驾驶场景中进行广泛实验，我们展示了VLP在一系列驾驶任务（包括开环规划、多对象跟踪、运动预测等）中显著且一致地优于现有的基于视觉的方法。
我们在nuScenes数据集上进行了首次新城市泛化研究，通过在不同城市进行训练和测试，展示了我们的VLP方法在零样本泛化能力上显著优于仅视觉方法。
据我们所知，这是第一项将语言模型引入自动驾驶系统多个阶段，以解决在新城市和长尾案例中的泛化能力问题的工作。

二、实验

这里展示部分结果，更多结果请参考论文。

三、总结

在这项工作中，我们提出了LLaDA，一个由LLMs驱动的框架，通过适应当地交通规则，调整人类驾驶员或AV的标称运动计划。LLaDA的模块化设计使其既适用于人类驾驶员辅助，也适用于AV计划的调整。据我们所知，LLaDA是第一个通过LLMs提出基于交通规则的适应方法。我们的研究结果显示，人类驾驶员发现LLaDA对于在新位置驾驶很有帮助，同时LLaDA也提高了AV在新位置的规划性能。

局限性：尽管LLaDA提供了多种好处，但也存在两个局限性：首先，由于LLaDA需要在控制循环中运行LLM，因此LLaDA的运行时目前尚不适合在AV规划堆栈的闭环使用 - 这一限制也适用于所有基于LLM的运动规划器。其次，正如我们之前讨论的结果，LLaDA对场景描述的质量敏感。虽然GPT-4V可以提供这样的描述，但有时不够准确。这一限制指向了需要开发一种AV特定基础模型的需求，该模型能够提供AV中心的场景描述。

更广泛的影响：作为人类驾驶员的助手，我们希望LLaDA能够减少因游客对当地交通规则不了解而引起的道路事故数量。作为AV的政策适配器，我们期望LLaDA能够为AV铺平道路，使它们能够在地理围栏以外的区域扩展运营。

未来工作：对于未来的工作，我们有多个激动人心的方向：首先，我们将探索通过在AV数据集上进行微调来改进GPT-4V的场景描述能力。其次，我们将探索开发一种意外情况检测器，这将允许我们仅在需要时使用LLaDA，从而显著减轻在控制循环中运行基于LLM模块所涉及的计算负担。最后，我们将致力于利用最近在不确定性量化和机器学习校准技术方面的发展，如符合预测和泛化理论，为LLM输出提供安全证书。

http://mp.weixin.qq.com/s?__biz=MzA4NTAzMjIwMg==&mid=2447667988&idx=1&sn=b9e1b5cbf5fada2cf262afb27d0d6b24

机器人EmbodiedAI

与世界交互

最新文章

CVPR 2024 | 自动驾驶 | 多模态事故视频理解数据集MM-AU

CVPR 2024 | 多智能体、多次遍历、多模态自动驾驶：开放MARS数据集

CVPR 2024 | 驾驶视频去雾技术中的非对齐正则化安全辅助

CVPR 2024 | SynFog：基于端到端成像仿真的逼真合成雾数据集

CVPR 2024 | LMDrive：利用大型语言模型的闭环端到端驾驶

浙大| Let Occ Flow: Self-Supervised 3D Occupancy Flow Prediction

CVPR 2024 | 使用证据理论对准确的训练数据进行自动驾驶中的占用地图预测

英伟达 | CVPR 2024 | VLP: 视觉语言规划用于自动驾驶

华为诺亚 | CVPR 2024 | 全面理解自动驾驶：通过注入鸟瞰视角的多模态大模型

2024 arxiv | 百度 | 探索端到端自动驾驶的因果关系

南大&英伟达 | CVPR 2024 | 开环端到端自动驾驶仅仅需要Ego Status吗？

西安交大 | CVPR 2024 | 在自动驾驶中对单目深度估计的物理3D对抗攻击

ETH | CVPR 2024 | 基于消失点引导的驾驶场景视频语义分割

CVPR 2024 | 点亮夜晚：一种用于自动驾驶中无配对低光增强的多条件扩散框架

CVPR 2024 | 压缩的端到端自动驾驶运动规划器

CVPR 2024 | AIDE: 用于自动驾驶目标检测的自动数据引擎

上海AI Lab | CVPR 2024 | PACER+：自动驾驶场景中的行人动画控制

大疆 | CVPR 2024 | 自动驾驶中单视图和多视图深度的自适应融合

CVPR 2024 | 自然数据投毒对自动驾驶轨迹预测的对抗性后门攻击

CVPR 2024 | 安全驾驶感知中的诱因自视角事故视频理解

CMU | CVPR 2024 | Diffusion-ES: 基于扩散的无梯度规划，用于自动驾驶和指令引导驾驶

华为诺亚| CVPR 2024 | CaDeT：一种用于自动驾驶中鲁棒轨迹预测的因果解缠方法

CVPR 2024 | NeuRAD: 自动驾驶场景的神经辐射场

CVPR 2024 | 利用自监督学习促进自动驾驶Radar

博士论文 | 面向自动驾驶的预训练基础大模型研究

CVPR 2024 | ChatSim：通过LLM-Agents进行自动驾驶仿真场景编辑

CVPR 2024 | DrivingGaussian：用于周围动态自动驾驶场景的复合高斯溅射

CVPR 2024 | 反馈引导的自动驾驶

毫末 | CVPR 2024 | Cam4DOcc：用于自动驾驶应用中基于摄像头的4D占据预测的基准Benchmark

面向自动驾驶的预训练基础大模型研究

CVPR 2024 | VLP：自动驾驶的视觉语言规划

CVPR 2024 | LaMPilot: 自动驾驶语言模型程序的开放基准数据集

最新 | 地平线VADv2：通过概率规划实现矢量化端到端自动驾驶

Occupancy-MAE: 基于占据栅格MAE的自动驾驶大场景点云自监督预训练

英伟达CVPR 2024 | PARA-Drive：并行架构的实时自动驾驶

CVPR 2024 | DUALAD：端到端自动驾驶中区分动态和静态世界

CVPR 2024 | GAFusion：多向导引下的适应性融合LiDAR和摄像头的3D目标检测

自动化所张兆翔组最新工作 | 端到端自动驾驶 | 世界模型 | 预训练

清华大学&鉴智鉴智机器人 CVPR2024 | 张量低秩分解用于自驾3D Occupancy预测

CVPR 2024 | 自动驾驶世界模型

CVPR 2024 | 端到端三维重建

CVPR 2024 | 像预测下一个Token进行目标识别

自监督多视角立体视觉深度估计MVSNet系列论文整理

聊聊无人驾驶汽车的发展历史(一）——从无线电控制到机器视觉

聊聊无人驾驶汽车的发展历史(二）——军方、大学和汽车公司合作研究

聊聊无人驾驶汽车的发展历史(三）——DARPA无人驾驶挑战赛

聊聊无人驾驶汽车的发展历史(四）—— Google无人驾驶发展之路

聊聊无人驾驶汽车的发展历史(五）——Tesla Autopilot进化史

三维视觉：针孔相机模型与坐标转换

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉