小米算法岗面试，差点就挂了。。。

文摘 2024-09-18 17:15 北京

最近面试小米某业务算法岗，围绕视觉核心任务，提问很多与目标检测相关，比如，各类单双阶段算法，YOLO和Faster R-CNN的区别，DETR的query问题...除了传统的闭集检测方法，极具潜力的开集检测，尤其是一些多模态大模型，考察也越来越常见，不熟悉容易卡壳：闭集和开集检测的关系是？介绍一个前沿的开集检测器，比如Grounding DINO？再简述其模型架构及基本原理？等等。

为了帮助大家掌握热门的Grounding DINO，研梦非凡于9月25日晚（周三），邀请了CV资深算法工程师张导师，独家讲解ECCV'24创新工作《Grounding DINO：最强开集目标检测器！》（AI前沿直播课NO.70），从开集与闭集目标检测的关系，到Grounding DINO的研究背景、主要贡献，重点讲解模型结构、训练方法和实验，并详解代码和Demo演示，1节课速通最先进的开集目标检测器，get论文改进和求职面试知识点！

👇🏻扫描二维码找助教0元预约直播课！

凡预约即可免费领取200篇目标检测精选论文&代码（开集目标检测/YOLO系列/顶会收录等）

unsetunset9.25直播课内容概览unsetunset

01 Grounding DINO基本信息

ECCV2024收录论文、开源代码
Grounding DINO 1.5等版本更新

02 开集与闭集目标检测器的关系

闭集目标检测器：只能检测预先定义的类别对象
开集目标检测器：可以检测指定的任意对象，在闭集检测器中引入语言特征

03 Grounding DINO的特点

以DINO为基础，基于Transformer的检测器
Transformer架构的优势分析
无需使用NMS等模块，支持端到端训练
提出了图像-语言特征深度融合的方案
零样本基准测试中刷新记录

👇🏻扫描二维码找助教0元预约直播课！

凡预约即可免费领取200篇目标检测精选论文&代码（开集目标检测/YOLO系列/顶会收录等）

04 Grounding-DINO的总体结构（重点）

双编码器-单解码器架构

组成部分
具体原理

特征增强模块

多个特征增强器层
可变形自注意力模块
GLIP启发下图像-文本的交叉注意模块

语言引导的查询选择
跨模态解码器

跨模态查询的传递
与DINO解码器层相比，额外的文本跨注意层

子句级文本特征

句子级表示与词级表示的局限性
子句级表示的创新

05 训练方法和实验

损失函数

回归损失、分类损失

训练变体
完成任务

任务1：COCO数据集闭集目标检测
任务2：零样本迁移
任务3：在RefCOCO数据集上进行指代对象检测

可视化检测结果
将Grounding DINO和Stable Diffusion应用于图像编辑

06 代码&Demo演示（重点）

直播课导师介绍

张导师

某上市公司高级算法工程师，在自动驾驶感知等视觉领域，拥有5年以上工作经验，尤其是目标检测、目标跟踪、图像分割，以及点云、多模态、模型轻量化和部署方向，一线项目经历丰富，具备高水平的Python、Pytorch等开发能力。

👇🏻扫描二维码找助教0元预约直播课！

凡预约即可免费领取200篇目标检测精选论文&代码（开集目标检测/YOLO系列/顶会收录等）

unsetunset研梦非凡科研论文指导unsetunset

idea并不是直接拍脑门拍出来的，是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。研梦非凡1V1定制化论文指导，和研梦导师一起找idea，研梦导师指导实验，共同解决数据问题。授之以渔——搭建论文写作框架，增删改查，针对性实验指导！哪里薄弱补哪里！

<<< 左右滑动见更多 >>>

全程1v1论文辅导扫码咨询助教

unsetunset研梦非凡部分导师介绍unsetunset

研梦非凡导师团队，来自海外QStop50、国内华五、C9、985高校的教授/博士导师/博士后，以及世界500强公司算法工程师、国内外知名人工智能实验室研究员等。

这是一支实力强大的高学历导师团队，在计算机科学、机器学习、深度学习等领域，积累了丰富的科研经历，研究成果也发表在国际各大顶级会议和期刊上，在指导学员的过程中，全程秉持初心，坚持手把手个性化带教。包括但不限于以下导师～

<<< 左右滑动见更多 >>>

扫码加助教为你匹配合适课题的大牛导师

http://mp.weixin.qq.com/s?__biz=Mzg4MDg4MzQ5Nw==&mid=2247492647&idx=1&sn=1fca1a752e3ef21c4306fbe7884c15bf

kk机器学习算法

机器学习基础、计算机视觉…

最新文章

面试理想汽车，搞砸了。。。

面试小鹏汽车，问的太细致了。。

深入浅出Batch Size，对模型训练的影响分析

最强目标检测大合集！！

面试腾讯，开心起飞。。。

商汤三面，有遗憾。。。

面试拼多多，麻了。。。

面试腾讯，offer到手！！

YOLO跌落神坛？新一代目标检测器又有新突破！

字节一面，贼细致。。

面试米哈游，太痛苦了。。

面试蚂蚁，太爽了。。。

京东太离谱了，校招算法岗轻松给70。。。

面试小红书，大失误。。。

面试蚂蚁，超预期。。。

面试小米，惨不忍睹。。。

离谱，二面视觉算法岗“寄”在大模型

讨论 XGBoost，太激烈了。。

面试米哈游，奔溃。。。

面试阿里，超级爽！！

26申博时间规划！别再按老套路来了，没用

面试理想汽车，爽爆了。。

面试拼多多，麻了。。。

面试字节，问暴了。。

讨论Prophet 模型，太精彩！！

Transformer 3D姿势估计器。。

完爆YOLO？新一代目标检测器又有新突破！！

腾讯算法岗，上岸！！

大模型LoRA超级变体！仅需参数0.4%达微调效率巅峰！

突破一个强大算法模型，核支持向量机！！

20场kaggle机器学习比赛Top方案GrandMaster整理！

突破一个强大算法模型，Transformer ！！

不愧是北理博士，强悍。。

211本无痛拿下蚂蚁60k的offer！！

讨论 XGBoost，太激烈了。。

腾讯算法岗，年包80w。。

面试字节算法岗，上岸！！！

面试幻方量化岗，考察太全面了。。。

一个强大算法模型，核支持向量机！！

字节一面，考察贼细。。

不愧是PCA，太强大！！

小米算法岗面试，差点就挂了。。。

不愧是Prophet 模型，太强了！！

超强！十大图像增强完全总结！！

字节算法专家，Kernel PCA分析太强了。。。

讨论T-SNE，脑子被榨干。。。

图解Numpy，这篇文章是真的强！

卷积神经网络数学原理解析

面试商汤算法岗，手握1篇顶会被嫌弃了。。。

不愧是北理博士，强悍。。

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉