毫末 | CVPR 2024 | Cam4DOcc：用于自动驾驶应用中基于摄像头的4D占据预测的基准Benchmark

文摘 2024-06-24 14:31 北京

欢迎关注微信公众号“机器人具身智能”

论文题目：Cam4DOcc: Benchmark for Camera-Only 4D Occupancy Forecasting in Autonomous Driving Applications

论文链接：https://arxiv.org/pdf/2311.17663

代码链接：https://github.com/haomo-ai/Cam4DOcc

一、方法

理解周围环境的变化对于在自动驾驶应用中安全可靠地执行下游任务至关重要。最近，仅使用摄像头图像作为输入的占用估计技术能够基于当前观察提供大规模场景的密集占用表示。然而，它们大多局限于表示当前的三维空间，并未考虑沿时间轴的周围物体的未来状态。

为了将仅使用摄像头的占用估计扩展到时空预测，我们提出了Cam4DOcc，这是一个新的基准，用于摄像头仅支持的四维占用预测，评估未来近场场景变化。我们的基准建立在多个公开数据集的基础上，包括nuScenes、nuScenes-Occupancy和Lyft-Level5，这些数据集提供了一般可移动和静态物体的序列占用状态，以及它们的三维后向离心流。为了为未来的研究建立这一基准，并进行全面比较，我们引入了四种基线类型，涵盖了多种基于摄像头的感知和预测实现，包括静态世界占用模型、点云预测的体素化、基于2D-3D实例的预测，以及我们提出的新型端到端四维占用预测网络。

此外，我们还提供了预设多任务的标准化评估协议，用于比较所有提出的基线在自动驾驶场景中对感兴趣物体的当前和未来占用估计性能。

本文的主要贡献：

我们提出了Cam4DOcc，这是第一个旨在促进基于摄像头的四维占用预测未来工作的基准。
我们通过利用领域内现有的数据集，为自动驾驶场景中的预测任务提出了新的数据集格式。
我们提供了四种新颖的基线方法用于基于摄像头的四维占用预测。其中三种是现有方法的扩展。此外，我们引入了一种新型的端到端四维占用预测网络，展示了强大的性能，并可以作为未来研究的宝贵参考。
我们引入了一种新颖的标准化评估协议，并根据这一协议在我们的Cam4DOcc上进行了全面实验，进行了详细的分析。

二、实验

这里展示部分结果，更多结果请参考论文。

三、总结

在这篇论文中，我们介绍了Cam4DOcc，这是一个专为自动驾驶应用中基于摄像头的4D占据预测任务设计的新型基准。以下是关键贡献和发现的详细介绍：

数据集与基准建立： 我们通过设计一个新的数据集格式，结合多个公开数据集的数据，创建了Cam4DOcc。这种格式促进了标准化评估，并为未来4D占据预测研究奠定了基础。
评估协议与基线模型： 我们制定了一个标准化的评估协议，并在Cam4DOcc框架内提出了四种基线模型。这些基线模型为评估4D占据预测方法的性能提供了基本参考。
OCFNet - 第一个基于摄像头的4D占据预测网络： 我们介绍了OCFNet，这是第一个端到端的基于摄像头设计的网络，用于预测未来的占据状态。OCFNet在实验评估中表现优于提出的基线模型，展示了其在有限训练数据条件下的有效性。
实验结果的见解： 通过对Cam4DOcc定义的四个不同任务进行全面实验，我们发现端到端时空网络（如OCFNet）在仅使用摄像头进行占据预测时显示出最有前景的结果。此外，技术如膨胀的GMO标注和利用3D反向离心流对提高预测准确性也具有益处。
局限性与未来方向： 尽管OCFNet取得了成就，但在预测更长时间间隔内和在存在大量移动物体的场景中仍面临挑战。我们的基准和分析旨在加深对当前占据感知模型的理解，并突出未来改进的重点。
影响与未来工作： 我们将Cam4DOcc视为评估4D占据预测进展的关键工具。作为基础模型，OCFNet为进一步研究提升基于摄像头的占据预测能力提供了起点。

欢迎关注微信公众号“机器人具身智能”

http://mp.weixin.qq.com/s?__biz=MzA4NTAzMjIwMg==&mid=2447667697&idx=2&sn=6bd26069ce6cce6af70a8fea4d76f63d

机器人EmbodiedAI

与世界交互

最新文章

CVPR 2024 | 自动驾驶 | 多模态事故视频理解数据集MM-AU

CVPR 2024 | 多智能体、多次遍历、多模态自动驾驶：开放MARS数据集

CVPR 2024 | 驾驶视频去雾技术中的非对齐正则化安全辅助

CVPR 2024 | SynFog：基于端到端成像仿真的逼真合成雾数据集

CVPR 2024 | LMDrive：利用大型语言模型的闭环端到端驾驶

浙大| Let Occ Flow: Self-Supervised 3D Occupancy Flow Prediction

CVPR 2024 | 使用证据理论对准确的训练数据进行自动驾驶中的占用地图预测

英伟达 | CVPR 2024 | VLP: 视觉语言规划用于自动驾驶

华为诺亚 | CVPR 2024 | 全面理解自动驾驶：通过注入鸟瞰视角的多模态大模型

2024 arxiv | 百度 | 探索端到端自动驾驶的因果关系

南大&英伟达 | CVPR 2024 | 开环端到端自动驾驶仅仅需要Ego Status吗？

西安交大 | CVPR 2024 | 在自动驾驶中对单目深度估计的物理3D对抗攻击

ETH | CVPR 2024 | 基于消失点引导的驾驶场景视频语义分割

CVPR 2024 | 点亮夜晚：一种用于自动驾驶中无配对低光增强的多条件扩散框架

CVPR 2024 | 压缩的端到端自动驾驶运动规划器

CVPR 2024 | AIDE: 用于自动驾驶目标检测的自动数据引擎

上海AI Lab | CVPR 2024 | PACER+：自动驾驶场景中的行人动画控制

大疆 | CVPR 2024 | 自动驾驶中单视图和多视图深度的自适应融合

CVPR 2024 | 自然数据投毒对自动驾驶轨迹预测的对抗性后门攻击

CVPR 2024 | 安全驾驶感知中的诱因自视角事故视频理解

CMU | CVPR 2024 | Diffusion-ES: 基于扩散的无梯度规划，用于自动驾驶和指令引导驾驶

华为诺亚| CVPR 2024 | CaDeT：一种用于自动驾驶中鲁棒轨迹预测的因果解缠方法

CVPR 2024 | NeuRAD: 自动驾驶场景的神经辐射场

CVPR 2024 | 利用自监督学习促进自动驾驶Radar

博士论文 | 面向自动驾驶的预训练基础大模型研究

CVPR 2024 | ChatSim：通过LLM-Agents进行自动驾驶仿真场景编辑

CVPR 2024 | DrivingGaussian：用于周围动态自动驾驶场景的复合高斯溅射

CVPR 2024 | 反馈引导的自动驾驶

毫末 | CVPR 2024 | Cam4DOcc：用于自动驾驶应用中基于摄像头的4D占据预测的基准Benchmark

面向自动驾驶的预训练基础大模型研究

CVPR 2024 | VLP：自动驾驶的视觉语言规划

CVPR 2024 | LaMPilot: 自动驾驶语言模型程序的开放基准数据集

最新 | 地平线VADv2：通过概率规划实现矢量化端到端自动驾驶

Occupancy-MAE: 基于占据栅格MAE的自动驾驶大场景点云自监督预训练

英伟达CVPR 2024 | PARA-Drive：并行架构的实时自动驾驶

CVPR 2024 | DUALAD：端到端自动驾驶中区分动态和静态世界

CVPR 2024 | GAFusion：多向导引下的适应性融合LiDAR和摄像头的3D目标检测

自动化所张兆翔组最新工作 | 端到端自动驾驶 | 世界模型 | 预训练

清华大学&鉴智鉴智机器人 CVPR2024 | 张量低秩分解用于自驾3D Occupancy预测

CVPR 2024 | 自动驾驶世界模型

CVPR 2024 | 端到端三维重建

CVPR 2024 | 像预测下一个Token进行目标识别

自监督多视角立体视觉深度估计MVSNet系列论文整理

聊聊无人驾驶汽车的发展历史(一）——从无线电控制到机器视觉

聊聊无人驾驶汽车的发展历史(二）——军方、大学和汽车公司合作研究

聊聊无人驾驶汽车的发展历史(三）——DARPA无人驾驶挑战赛

聊聊无人驾驶汽车的发展历史(四）—— Google无人驾驶发展之路

聊聊无人驾驶汽车的发展历史(五）——Tesla Autopilot进化史

三维视觉：针孔相机模型与坐标转换

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉