MIT发布“Clio：实时任务驱动的Open-Set 3D场景图”

科技 2024-11-03 23:24 上海

点击上方“计算机视觉life”，选择“星标”

快速获得最新干货

3D高斯泼溅为什么能一直火？有哪些应用场景？

香港大学开源的这个激光雷达惯性SLAM，太强了！

一招掌握3DGS基础视觉三维重建！深度计算+点云处理+网格重建优化+纹理贴图！

谷歌这个SLAM开源方案，造福了整个机器人行业！

以下内容来自小六的机器人AI学习圈（6年积累，全国最大的机器人SLAM交流社区，为SLAM行业从业者提供从入门、学习、交流、求职、线下链接、合作、咨询、答疑等一系列的服务）知识星球每日更新内容

扫码立减30元！长按二维码，领券加入即可开始学习~3天内无条件退款

购买后务必加客服领取其他权益和加交流群

星球中有什么呢？请看这里

【Clio: Real-time Task-Driven Open-Set 3D Scene Graphs】

文章链接：[2404.13696] Clio: Real-time Task-Driven Open-Set ...

项目主页：GitHub - MIT-SPARK/Clio

现代的类无关图像分割工具(例如, SegmentAnything)和开集语义理解工具(例如, CLIP)为机器人感知和建图提供了前所未有的机遇。传统的密集分布度量语义地图仅限于几十个或几百个语义类，而现在我们可以构建包含大量对象和无数语义变化的地图。这就给我们提出了一个基本问题：机器人在地图表示中必须包含的对象(并且,更一般地,对于语义概念)的合适粒度是什么?虽然相关工作通过调整目标检测和关联的阈值来隐式地选择粒度级别，但我们认为这种选择本质上是任务依赖的。本文的第一个贡献是提出了一个任务驱动的3D场景理解问题，在该问题中，机器人被给定一个用自然语言描述的任务列表，并且必须选择粒度、对象和场景结构的子集，以保留在其地图中，该地图足以完成任务。我们证明这个问题可以自然地用信息瓶颈( Information Bottleneck，IB )来描述，IB是一个已经建立的讨论任务相关性的信息论框架。第二个贡献是基于凝聚的IB方法的任务驱动3D场景理解算法，能够将环境中的3D图元聚类成任务相关的对象和区域，并增量执行。第三个贡献是将我们的任务驱动的聚类算法集成到一个名为Clio的实时流水线中，该管道在线构建环境的分层三维场景图，并且在机器人探索时只使用机载计算。我们最后的贡献是一个广泛的实验活动，表明Clio不仅允许实时构建紧凑的开集三维场景图，而且通过将地图限制在相关的语义概念上，提高了任务执行的准确性。

推荐教程

我对Fast-LIO2做了改进，解决了Z轴漂移、有效检测回环及解决了回环重影、实现了重定位
2025秋招，上来就问3D Gaussian Splatting。。。
香港大学开源的这个激光雷达惯性SLAM，太强了！
一招掌握3DGS基础视觉三维重建！深度计算+点云处理+网格重建优化+纹理贴图！
谷歌这个SLAM开源方案，造福了整个机器人行业！
重大变革！NeRF和3D高斯喷溅如何重塑SLAM？
发顶会顶刊不再难！多传感器融合SLAM、生成式AI、3DGS、NeRF、标定等方向
这个开源框架，造福了无数卫星定位研究者和初创公司！
BOSS：用了机器人仿真，立省几十万
自动驾驶中的GNSS、RTK到底多重要？
太强了！世界第一款开源的自动驾驶一体化框架Autoware！（附交流群）
如何从零开始搭一套自己的SLAM系统？
17讲全部上线！全网首个详解深度学习特征开源算法SuperPoint和SuperGlue（附交流群）
最炸裂的机器人AI技术教程都在这了！

http://mp.weixin.qq.com/s?__biz=MzIxOTczOTM4NA==&mid=2247614910&idx=2&sn=acd5e48882c5f6f17fee71faab48f7ab

计算机视觉life

聚焦计算机视觉、机器人SLAM、自动驾驶、AR领域核心技术。系统学习教程官网cvlife.net

最新文章

MVSplat360：从稀疏视图到360°全景合成的前馈方法

三维机器视觉行业，代沟太大了！

哈工大发布LiV-GS：户外环境3D高斯泼溅LiDAR-视觉集成SLAM系统

周日（11月24日）上海，深圳，线下体验试用~

今晚内部直播交流：扫描仪+机器人实时SLAM及二次开发！

周日（11月24日）上海，深圳，线下体验试用~

BOM成本仅2535元全球最小开源端到端人形机器人Zeroth 01 Bot来了！

【文末赠书】一文读懂基于大模型的具身智能技术

谷歌2024博士奖学金名单公布

上海周边，深圳，本周末线下体验试用~

IROS 2024最新接收的NeRF/3DGS前沿研究成果汇总

三维空间扫描仪化身机器人感知定位利器！用于机器人自主定位导航、实景三维重建！

报名！线下体验试用~

浙大等联合发布“HVOFusion: 使用混合体素八叉树进行增量网格重建”

周六聊天

这些机器人AI技术企业里都在用！逐行代码保姆级解析！

三维空间扫描仪化身机器人感知定位利器！用于机器人自主定位导航、实景三维重建！

国防科技大学发布“TD-NeRF：联合相机位姿和神经辐射场优化的新型截断深度先验”

浙大西湖大学开源MBA-SLAM！解决NeRF、3DGS中的运动模糊问题！

这周日，成都、哈尔滨，不见不散！

最强助攻！让你的机器人轻松实现自主SLAM并重建稠密彩色点云!

这周日，成都、哈尔滨，不见不散！

纯Lidar SLAM如何优化解决Z轴方向的偏移？

最后一天！

没想到3DGS在这个领域是刚需！

成都、哈尔滨，我们来啦！

详解 | 各车企智驾“无图”方案

SLAM面试题：DBoW的构建和使用

cvlife的双十一！

商汤&浙大SfM新工作！LiVisSfM：利用激光雷达和视觉线索，获得精确鲁棒的三维重建

成都、哈尔滨，我们来啦！

SLAM挑战：有光无光切换，自由穿梭小黑屋！

cvlife年度最大优惠来了

保就业的AI算法工程师课程来啦！

章国锋团队重磅开源！XRDSLAM：基于深度学习的模块化SLAM！灵活组合不同算法！（商汤&浙大）

招募：3D Gaussian Splatting方向项目合作/实习生（可远程）

【万字长文】采访3DGS创业者康总：畅谈3D高斯泼溅技术在移动端的创新应用与未来展望

这些机器人AI技术企业里都在用！

港科大待开源“BeautyMap：二进制编码的自适应矩阵，用于全局地图中动态点的移除”

MIT发布“Clio：实时任务驱动的Open-Set 3D场景图”

湖南大学开源数据集及代码！ESVO2：事件相机的双目VIO系统，CPU实时运行！

西安，明天见！

采访西安灵视探索创业者业全：低空飞行器与卫星SLAM应用探索、行业现状与未来展望

ETH发布“轮腿式机器人的鲁棒自主导航与运动学习”

南京见了几个客户，应用场景需求和难题，探讨解决思路

西安、苏州，我们来啦！

国内外有哪些不错的3D Vision的组或实验室？

被裁员是怎样的一种体验？

西安、苏州，我们来啦！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉