2024年11月9-10日,由中国图象图形学学会(CSIG)主办、杭州师范大学承办的第31期CSIG图像图形学科前沿讲习班(IGAL31)在杭州师范大学仓前校区成功举办。本期讲习班主题为“AIGC+具身智能前沿技术及创新应用”,由杭州师范大学信息科学与技术学院缪永伟教授担任学术主任,来自全国各地的教师、学生以及企业界工程师参加讲习班,讲习班现场气氛热烈。
图 1 讲习班开幕
11月9日上午举行的开班仪式上,学术主任、中国图象图形学学会杰出会员、杭州师范大学教授缪永伟致开班辞,他热忱欢迎国内同行老师和研究生参与,并希望各位参会者能在为其两天的学习交流中激发对这些前沿技术的研究和创新应用的浓厚兴趣,引领未来图形图像处理技术的发展。
图 2 学术主任缪永伟教授致辞
开班仪式后的讲习班第一场报告由浙江大学李玺教授作了题为“多模态视觉结构学习”的分享。本报告主要围绕数据驱动的人工智能学习方法,进行大规模图像/视频数据的视觉特征学习,从目标视觉感知特性、视觉特征表达、深度学习器构建机制、高层语义理解等多维度视角进行了深入剖析,并引入了大规模多模态特征学习所涉及的主要研究问题和技术方法。然后系统地回顾了多模态特征表达和学习领域的不同发展阶段,介绍了近年来我们利用特征学习进行视觉语义分析和理解所做的一系列代表性的研究工作及其实际应用。
图 3 李玺教授作报告
接着,来自国防科技大学的徐凯教授作了围绕“多模态具身感知与交互”的主题作了分享。如何基于多模态感知输入,建构结构化、语义化,且大模型友好的三维环境表达,同时发挥端侧模型的感知理解和柔性交互能力,以及云侧大模型的常识推理和任务规划能力,以实现面向高层次任务的主动、持续、长程感知与交互,是具身智能系统的核心能力要求。围绕上述问题,徐凯教授汇报了相关进展,包括跨智能体动态抓取技能学习,机器人主动三维场景图构建,未知场景物体目标导航,以及基于多模态大模型的室内物品整理。
图 4 徐凯教授作报告
9日下午,天津理工大学的程徐教授作了题为“主动感知的海洋环境检测”的分享。程徐教授先是介绍了建设海洋强国的战略背景,报告从传统被动式监控手段存在信息利用率低、适应性差、智能化程度不足等问题出发,指出任务驱动的主动视觉感知与决策规划技术,赋予海洋监控系统自主感知、智能决策和高效行动的能力亟需发展。接下来,围绕主动感知策略优化和智能决策规划机制,程徐教授介绍了如何实现对海洋环境信息的精准获取、高效处理和智能应用,为海洋强国建设提供关键技术支撑。
图 5 程徐教授作报告
中国科学院计算技术研究所高林研究员作了题为“面向高真实感几何建模的重光影技术”的分享。高林研究员指出随着人工智能和计算机图形学技术的交叉融合,高真实感建模技术在快速演进,从神经辐射场到高斯泼溅,这些方法仅通过多张彩色照片就可以进行高真实感的几何建模。相比于传统方法,降低了几何建模的成本,提升了照片级真实的效果。但是这类方法相比于传统方法更加难以编辑,为了解决这一问题,在本次报告中,高林研究员基于“面向高真实感几何建模的重光影技术”这一题目,分享了如何对神经辐射场和高斯泼溅进行解耦表征、并对其进行重新光影,包括将分别介绍面向人-物-场的重新光影方法。
图 6 高林研究员作报告
10日上午,首先是清华大学刘永进教授作题为“基于神经辐射场的机器人稀疏扫描和三维重建”的报告。报告介绍了一个新颖的稀疏表面重建系统,利用最佳输入视图,与一个重建模块相耦合的稳定优化过程;随后介绍了一个新颖的室内重建框架,提出了混合架构来分别建模室内低频和高频区域;此外,还引入了一种有效的图像锐化去噪技术和一个用来估计法向量不确定性的模块,以避免模型被不可靠的表面法向监督所误导。
图 7 刘永进教授作报告
接下来,浙江大学许威威教授作了题为“端到端的三维内容构建技术”的分享。许威威教授的报告聚焦于三维场景的端到端重建技术,探讨了如何极大提升从图像自动恢复三维表达的自动化程度和自由度。报告中介绍了神经隐式场、3DGS及其中关键技术原理,并对其在场景重建、材质计算、人体重建等三维内容构建上取得的进展进行了介绍。
图 8 许威威教授作报告
10日下午,中国科学院空天信息创新研究院王成研究员作了题为“激光雷达遥感数据处理”的报告。报告首先对激光雷达遥感的基本概念、基本原理及国内外发展概况进行介绍,其次分别介绍多模态多平台激光雷达数据处理关键算法与大致流程,然后介绍激光雷达遥感的诸多典型应用领域, 最后介绍团队研发的激光雷达数据处理软件“点云魔方”,包括软件构架、软件特点、软件模块和功能等。
图 9 王成研究员作报告
10日下午讲习班最后一场报告,浙江大学章国锋教授作了题为“视觉SLAM”的分享。章国锋教授从视觉SLAM的基本概念和基本理论出发,结合视觉SLAM满足实际的应用需求所需要解决的一些关键性难题上切入(例如: 如何让移动终端在大尺度复杂场景下做到实时稳定的跟踪定位?如何实现高效的全局优化以及时消除误差累积?如何以低成本的方式构建大尺度场景的视觉定位数据集?),并重点介绍了为解决以上关键问题所做的课题组研究工作,同时介绍了课题组在室内定位导航、虚实融合与混合现实上的应用。
图 10 章国锋教授作报告
本次讲习班专家报告丰富、内容精彩,学员们踊跃互动、积极提问,参会者通过本次讲习班的机会,不仅加深了对专业领域的认知,还拓宽了视野和思维,更促进了同行之间的交流与合作。本次学科前沿讲学班在学术主任缪永伟教授主持的结班仪式活动中顺利落下帷幕,第31期CSIG图像图形学科前沿讲习班在各位报告嘉宾、广大同行以及学会各级领导的大力支持下,取得了圆满成功。
图 11 现场交流热烈
图 12 与会人员合影留念