Transformer杀疯了！跨模态3D目标检测SOTA！易复现！

文摘 2024-10-28 09:05 上海

ICCV'23旷视科技Cross Modal Transformer(CMT)工作提出了——跨模态的Transformer将图像和点云数据作为输入，并且直接生成精确的3D检测框。在nuScenes test数据集上达到了74.1%的NDS（单一模型的最先进技术），同时保持了快速的推理速度。此外，整个跨模态的Transformer设计非常简单，主要是它易于复现。

为了让大家更好的掌握跨模态3D目标检测器，并改进融合运用到自己的论文中，研梦非凡于10月31日晚（周四），邀请了来自QStop50学校博士—杨导师，为大家独家详解《超实用发论文方向！基于Transformer的3D 目标检测》，从跨模态Transformer的性能与贡献到3D目标检测、重点讲解跨模态Transformer的算法研究以及实验，一文速通跨模态3D目标检测，复现论文，找创新点，轻松发论文！

👇🏻扫描二维码找助教0元预约直播课！

凡预约即可免费领取200篇前沿论文（目标检测+大模型+多模态）

直播课内容预览

ICCV'23《Cross Modal Transformer: Towards Fast and Robust 3D Object Detection 》

一、论文摘要

CMT模型
无需显式视图转换
设计简洁易复现
多模态tokens的空间对齐
快推理速度，高准确率

二、研究背景

跨模态介绍
跨模态Transformer与SOTA性能的比较
跨模态Transformer的主要贡献

三、相关工作

基于相机的3D目标检测
基于LiDAR的3D目标检测
多模态的3D目标检测
基于Transformer的目标检测

👇🏻扫描二维码找助教0元预约直播课！

四、算法研究

跨模态Transformer的结构

跨模态变换器(CMT)架构
CMT通过建立不同模态间的位置对应关系

坐标编码模块（CEM）
图像的CE
点云的CE
位置引导的查询生成器
解码器和损失函数
基于Mask的训练和模型鲁棒性研究
讨论

CMT与FUTR3D在端到端建模动机上类似,但方法和效果完全不同
主要区别

五、实验结果

数据集和评估指标
实验细节
与最先进技术的比较
强大的鲁棒性
消融研究
分析

六、总结和展望

跨模态的Transformer
强大的性能且易于复现

👇🏻扫描二维码找助教0元预约直播课！

直播导师介绍

杨导师

杨导师，博士毕业于QStop50知名计算机名校。

博士期间研究方向：聚焦为计算机视觉，自然语言处理，高效的深度学习训练和推理方法，大语言模型轻量化与高效微调技术。

曾在多家公司担任算法研究员，并进行计算机视觉，高效模型压缩算法，多模态大语言模型的研究，包括模型量化，剪枝，蒸馏，编译以及高效稀疏化训练与推理。

在国际顶级会议CVPR，ICCV，EMNLP等发表13篇论文，并担任CVPR，ICCV，ECCV，ICML，ICLR，NeurIPS等重要会议和期刊的审稿人。

多项发明专利，指导学生有耐心，教学严谨，思维逻辑缜密，已经指导数十篇论文。

对于成果好的学生，帮助学生写推荐信和指导申请硕/博申请。

👇🏻扫描二维码找助教0元预约直播课！约导师meeting～

ps：研梦非凡开设的前沿论文系列直播，旨在帮助大家提升读论文技能，快速抓住重点，掌握有效方法，进而找到创新点，轻松产出科研论文成果。

研梦非凡科研论文指导

科研论文idea，并非拍脑门就能产生，需要经过一遍遍做实验、跑代码、改模型、思路修正。研梦非凡专业论文指导，和研梦导师一起找idea，共同解决科研问题。授之以渔——搭建论文写作框架，增删改查，针对性实验指导！哪里薄弱补哪里！

<<< 左右滑动见更多 >>>

研梦非凡部分导师介绍

研梦非凡导师团队，来自海外QStop200、国内华五、C9、985高校的教授/博士导师/博士后，以及世界500强公司算法工程师、国内外知名人工智能实验室研究员等。

这是一支实力强大的高学历导师团队，在计算机科学、机器学习、深度学习等领域，积累了丰富的科研经历，研究成果也发表在国际各大顶级会议和期刊上，在指导学员的过程中，全程秉持初心，坚持手把手个性化带教。包括但不限于以下导师～

<<< 左右滑动见更多 >>>

比赛8人冲牌小班介绍（第一二期已满，三期开招）

<<< 左右滑动见更多 >>>

我们不是小作坊哦～我们背靠研途考研（就是张雪峰老师和徐涛老师在的那个研途考研），做教育十余年，重交付，重口碑，是我们一贯的公司理念！

http://mp.weixin.qq.com/s?__biz=MzU4OTg3Nzc3MA==&mid=2247496580&idx=1&sn=f438b16848bb1fc1217c94aa84eec2e9

计算机视觉Daily

一个专注于计算机视觉开源项目的公众号，涵盖CV、传统图像处理、OpenCV、深度学习、机器学习代码实战和相关资料等内容

最新文章

Mamba作者点赞！清华团队深入分析长上下文建模中的状态崩溃

CVPR 2025 坐等Rebuttal，ICLR 2025和AAAI 2025投稿微信群来了！

突发！AI科学家重返谷歌！

微软亚洲研究院MSRA招聘实习生

AAAI 2025 开奖倒计时！CVPR 2025、ICLR 2025 投稿微信群来了！

重磅发布！最新版《深度学习》书籍开放下载

NeurIPS 2024 | 收敛加快8倍，准确率提升超30%！华科大提出MoE Jetpack框架

今年顶会这情况。。。大家提前做准备吧！

NeurIPS 2024 | 浙江大学提出SINE：通用分割新模型

发一篇CVPR真不难

LeCun团队新作DINO-WM：预训练视觉特征的世界模型，超强规划能力！

博士延毕，师兄终于毕业了。。。

NeurIPS 2024 Oral | 大模型量化新工作！4bit达到新SOTA！

ICLR 2025 分数出炉！附AAAI 2025和CVPR 2025投稿微信群

Karpathy后悔了：2015年就看到了语言模型的潜力，却搞了多年强化学习

CVPR 2025 正式截稿！ICLR 2025和AAAI 2025投稿微信群成立！

突发！谷歌宣布35岁Keras之父Francois Chollet离职！

面完腾讯算法岗，心态崩了。。。

Ilya认错，Scaling Law崩了？自曝SSI秘密技术路线取代OpenAI

ICLR 2025 分数出炉！附ICLR 2025和CVPR 2025投稿微信群

揭示Transformer重要缺陷！北大提出傅里叶分析神经网络FAN：填补周期性特征建模缺陷

ICLR 2025 即将开分！ICLR 2025和CVPR 2025投稿微信群来了！

这本大模型书籍可以下载了！

即插即用！加速扩散Transformer！Meta提出自适应缓存新方法，视频生成加快2.6倍！

多模态大模型最新研究进展！OpenAI、谷歌、Meta和微软杀疯了！

AAAI 2025 分数出炉！附微信群！

顶刊TPAMI 2024！解耦图神经网络：同时训练多个简单的GNN，而不是一个！

AAAI 2025 即将开奖！附微信群！

Copilot一夜杀死编程助手！GitHub官宣接入Claude和谷歌Gemini！OpenAI沦为备胎。。。

AAAI 2025 投稿微信群成立！

10秒创造一个世界！吴佳俊团队新作实时交互式3D世界生成，比现有技术快100倍！

CVPR 2025 投稿微信群成立！

黄仁勋预言成真了！！

NeurlPS 2024 Oral | 多模态融合检测端到端算法E2E-MFD来了！

CVPR 2025 投稿交流群成立！

Transformer杀疯了！跨模态3D目标检测SOTA！易复现！

NeurIPS 2024 | 免训练！超强！FreeLong：长视频生成框架

CVPR 2025 投稿交流群来了！

LeCun锐评诺奖：出于压力才颁给AI，但两个成果已经完全无用！玻尔兹曼机和Hopefield网络

敲响警钟！首例大模型卷进青少年自杀案？明星AI创业公司面临诉讼。。。

ECCV 2024 | 谷歌提出LookupViT：全新通用视觉Transformer块

ICLR 2025 投稿交流群来了！

OpenAI满血版o1剧透：数学代码能力再破天花板！已开启测试评估！

ECCV 2024 | ClearCLIP：删除两个组件，可以提升语义分割性能！

AAAI 2025 投稿交流群成立！

Apple AI落后两年？库克回应：“不抢首发，只做最好”。。。

异常检测和缺陷检测微信群成立！

AI解决132年数学难题！Transformer成功寻找新的李雅普诺夫函数，三体问题相关

AAAI 2025 投稿交流群来了！

DenseNet作者刘壮官宣！将入职普林斯顿大学助理教授！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉