随着人工智能和智能机器人技术的普遍重视,"AIGC+具身智能前沿技术"得到了快速发展和技术革新,借助场景智能理解、多模态视觉计算、具身智能、神经辐射场NeRF和3D Gauss SPlatting、可微渲染等前沿技术,将能够实现高智能、高精度三维对象生成处理和机器人具身智能,本讲习班邀请到国内该领域的8位著名专家学者进行专题讲座,内容涵盖:视觉计算与AIGC、机器人扫描重建、具身智能感知、三维内容生成与渲染、视觉SLAM、遥感点云处理、主动视觉感知等。本讲座将展示最新研究成果和前沿方法,热忱欢迎国内同行老师和研究生参与,激发对这些前沿技术的研究与兴趣,引领未来图形图像处理技术的发展。
2024年11月9-10日
杭州
01
组织单位
主办单位:中国图象图形学学会(CSIG)
承办单位:杭州师范大学
02
日程安排
时间:2024年11月9日~10日
03
报名及注册费
1、本期讲习班限报150人,根据缴费先后顺序录取,报满为止。
2、2024年11月7日(含)前注册并缴费:CSIG会员2000元/人,非会员2500元/人(赠送1年CSIG会员);现场缴费:会员、非会员均为3000元/人;CSIG团体会员参加,按CSIG会员标准缴费;组团(5人及以上)报名2000元/人,组团(10人及以上)报名1600元/人,。
3、注册费包括讲课资料和2天会议期间午餐,其它食宿、交通自理。
4、即日起请登录会议注册网站注册。
5、会议注册网址:
https://conf.csig.org.cn/10409.html
7、酒店预定:
1.博雅苑酒店(原梅苑悦居酒店)
地址:杭州师范大学仓前校区学术交流中心B座
电话:0571-26271000
标间:432元/晚(含早)
住宿登记请说明:参加CSIG图像图形学科前沿讲习班。
2.杭州师范大学教育交流中心(1)
地址:杭州师范大学仓前校区恕园3号楼
电话:0571-28865555
标间:260元/晚(不含早)
住宿登记请说明:参加CSIG图像图形学科前沿讲习班。
04
学术主任
缪永伟,杭州师范大学信息学院教授、博导,杭州市钱江特聘专家,浙江省高校中青年学科带头人。系中国计算机学会CCF杰出会员,中国图象图形学学会杰出会员。系CCF计算机辅助设计与图形学专委会委员,中国图象图形学学会智能图形专委会委员,中国图象图形学学会三维视觉专委会委员,中国工业与应用数学学会几何设计与计算专委会委员。研究兴趣包括计算机图形学与3D视觉、点云数据智能处理、智能可视媒体(图形图像)计算等。在科学出版社出版学术专著2部,在CCF-A类顶级期刊或领域内权威期刊发表SCI/EI索引论文100余篇,授权国家发明专利6项,担任20+国内外顶级或权威期刊的审稿人。曾获得“中国计算机图形学大会”最佳论文奖,曾获得“全国几何设计与计算大会”最佳论文奖。
05
特邀讲者
李玺 浙江大学求是特聘教授/博导
报告人简介:李玺,浙江大学求是特聘教授/博导。国家杰出青年基金获得者,IET Fellow,IEEE Senior Member,国家青年特聘专家,浙江省特聘专家,杭州钱江特聘专家,科技部科技创新 2030 新一代人工智能重大项目负责人,国家自然科学基金委联合基金重点项目负责人,教育部重点规划研究项目负责人。主要从事人工智能AI领域研究,担任国际权威期刊的编委(如TNNLS和TMM)和顶级会议的Area Chair(如ICCV、CVPR、ECCV),两项最佳国际会议论文奖(ACCV 2010 和 DICTA 2012),一项最佳学生论文奖(ACML 2017),2019 年和 2020 年中国图象图形学报最佳封面文章和年度优秀论文,ICIP 2015 Top 10%论文奖。获得2021 年中国图象图形学学会自然科学奖二等奖,2021 年中国电子学会科技进步一等奖,2021 年中国产学研合作促进会产学研合作创新与促进奖,2021 年世界人工智能大会 SAIL 奖,2022 年世界互联网领先科技成果,2022 年教育部高等学校科学研究优秀成果奖科学技术进步奖一等奖,2023 年中国发明协会发明创业奖创新奖一等奖,2023年陆增镛CAD&CG高科技奖一等奖,两项北京市自然科学技术奖(包括一等奖和二等奖),以及一项中国专利优秀奖。
报告题目:多模态视觉结构学习
报告摘要:互联网和物联网时代催生了海量多模态大数据,从这些海量数据中有效提取知识迫切需要各种人工智能的技术和手段。因此,如何进行人工智能驱动的多模态计算已经成为当今知识经济时代亟待解决的核心技术问题。本报告主要围绕数据驱动的人工智能学习方法,进行大规模图像/视频数据的视觉特征学习,从目标视觉感知特性、视觉特征表达、深度学习器构建机制、高层语义理解等多维度视角进行了深入剖析,并引入了大规模多模态特征学习所涉及的主要研究问题和技术方法。然后系统地回顾了多模态特征表达和学习领域的不同发展阶段,介绍了近年来我们利用特征学习进行视觉语义分析和理解所做的一系列代表性的研究工作及其实际应用。报告的最后将和大家一起探讨一下涉及多模态特征学习所面临的一些开放性问题和难题。
程徐 天津理工大学计算机学院教授/博导
报告人简介:程徐,天津理工大学计算机学院教授/博导。国家优秀青年基金获得者,欧盟玛丽居里学者,入选人社部海外青年人才引进专项。博士毕业于挪威科技大学与天津理工大学获海洋工程与工学双博士学位,曾任职挪威智能创新署终身研究员。主持的项目包括国家优秀青年基金,海外青年人才引进专项,国家自然科学基金青年基金项目,欧盟地平线项目,中国国际合作项目(挪威方)。在国际知名期刊会议发表文章七十多篇。担任多个国际期刊编委,获得天津优秀博士学位论文以及多个国际会议最佳论文奖。
报告题目:主动视觉感知的海洋环境监测
报告摘要:在建设海洋强国的战略背景下,智能化海洋环境监控对于保障海洋权益、发展海洋经济、保护海洋生态环境具有重要意义。然而,传统被动式监控手段存在信息利用率低、适应性差、智能化程度不足等问题,难以满足日益复杂的海洋环境监测需求。为此,亟需发展任务驱动的主动视觉感知与决策规划技术,突破传统静态视觉算法的局限,赋予海洋监控系统自主感知、智能决策和高效行动的能力。通过主动感知策略优化和智能决策规划机制,实现对海洋环境信息的精准获取、高效处理和智能应用,为海洋强国建设提供关键技术支撑。
许威威 浙江大学CAD&CG国家重点实验室长聘教授/博导
报告人简介:许威威,浙江大学计算机科学与技术学院CAD&CG国家重点实验室长聘教授,教育部长江学者。曾任日本立命馆大学博士后,微软亚洲研究院网络图形组研究员, 杭州师范大学浙江省钱江学者特聘教授。主要研究方向为智能三维感知、重建和仿真。在国内外高水平学术会议和期刊发表论文100余篇,其中ACM Transactions on Graphics, IEEE TVCG、IEEE CVPR、AAAI等CCF-A类论文60余篇。获中国和美国授权专利15项。所开发的高精度、高真实感三维重建技术在先临高精度扫描仪、百度阿波罗自动驾驶仿真平台、华为河图和徐工机械远程驾驶舱中得到应用。2014年受国家自然科学基金优秀青年基金资助,主持国家自然科学基金重点项目一项,获浙江省自然科学二等奖一项。
报告题目:端到端的三维内容构建技术
报告摘要:三维场景的端到端重建技术极大提升了从图像自动恢复三维表达的自动化程度和自由度,近年来在基于图像的绘制、逆向重建等领域获得了快速的发展。该表达可通过可微绘制技术从传感器数据直接构建几何和材质的隐式表达,支持自由视点绘制、体积视频和全息会议等虚拟现实应用,简化了传统场景构建技术流程。本报告将聚焦于介绍神经隐式场、3DGS及其中关键技术原理,并对其在场景重建、材质计算、人体重建等三维内容构建上取得的进展进行介绍。
高林 中国科学院计算技术研究所泛在计算系统研究中心副主任
报告人简介:高林,中国科学院计算技术研究所泛在计算系统研究中心副主任、研究员、博士生导师、中国科学院大学岗位教授。国家优秀青年基金获得者,北京市杰出青年基金获得者,入选英国皇家学会牛顿高级学者。研究方向为计算机图形学、三维计算机视觉。在SIGGRAPH、TPAMI、TVCG等期刊会议发表论文100余篇,研发的人脸AIGC的APP被全球180余个国家或者地区的用户所使用。现任或者曾任GDC 2024大会联合程序主席、SGP 2023大会联合主席、China 3DV 2023程序委员会联合主席,SIGGRAPH 2023-2024技术论文程序委员会委员,NeurIPS 2024领域主席,IEEE TVCG编委,CSIG智能图形专委秘书长,曾获得亚洲图形学会青年学者奖,吴文俊人工智能优秀青年奖,CCF技术发明一等奖,CCF CAD&CG开源软件奖等奖励。
报告题目:面向高真实感几何建模的重光影技术
报告摘要:随着人工智能和计算机图形学技术的交叉融合,高真实感建模技术在快速演进,从神经辐射场到高斯泼溅,这些方法仅通过多张彩色照片就可以进行高真实感的几何建模。相比于传统方法,降低了几何建模的成本,提升了照片级真实的效果。但是这类方法相比于传统方法更加难以编辑,为了解决这一问题,在本次报告中,我们将分享如何对神经辐射场和高斯泼溅进行解耦表征、并对其进行重新光影,包括将分别介绍面向人-物-场的重新光影方法。
刘永进 清华大学计算机系长聘教授/博导
报告人简介:刘永进,清华大学计算机系长聘教授,人机交互与媒体集成研究所所长,中国图象图形学学会智能图形专委会主任,科技部某重点专项总体专家组专家, 全国信息技术标准化技术委员会委员。国家杰出青年基金获得者(2018-2022)、国家优秀青年基金获得者(2014-2016),入选教育部新世纪人才计划(2011)。
近五年在PAMI、TOG、SIGGRAPH、TIP、TAFFC、TVCG、CVPR、AAAI、CVPR等权威期刊会议上发表近百篇,其中SCI论文60余篇,7篇论文入选ESI高被引及热点论文。获得两次世界华人数学家联盟年度最佳论文奖(2017、2018)在内的十余项国内外知名期刊会议的最佳论文/优秀论文,六项专利技术作价1100万进行了成果转化。培养多名博士生和硕士生获得清华大学优秀博士/硕士学位论文,以及北京市和全国一级学会(中国人工智能学会、中国图象图形学学会、中国图学学会)的优秀博士学位论文奖、CSIG石青云科学家奖和瑞士Chorafas青年研究奖。两名博士毕业生入选中国科协青年人才托举计划。刘永进教授两次获得中国人工智能学会吴文俊人工智能自然科学奖(2018、2021),两次获得北京市科学技术奖(2021,2023), 2022年中国图象图形学学会高等教育教学成果奖一等奖,以及2011年国家技术发明二等奖。
报告题目:基于神经辐射场的机器人稀疏扫描和三维重建
报告摘要:近年来,作为计算机视觉和计算机图形学交叉融合的新一代技术,神经辐射场吸引了学术界和工业界的广泛关注。神经辐射场技术也为机器人扫描重建带来了新的机遇与挑战:一方面,扫描的硬件成本得到了进一步降低,仅需普通的相机手机设备扫描的RGB视频或图像就可以完成重建;另一方面,对于稀疏扫描物体的高质量网格表面重建和室内场景精细网格表面重建仍存在挑战性问题和困难。在本次报告中将介绍两项工作:(1)一个新颖的稀疏表面重建系统,利用扭曲一致性分数渐进式规划最佳输入视图,并与一个基于多分辨率哈希特征的重建模块相耦合,通过渐进式训练策略和方向海森损失函数稳定优化过程;(2)一个新颖的室内重建框架,提出了MLP+Triplane混合架构来分别建模室内低频和高频区域。为了增强法向量先验,还引入了一种有效的图像锐化去噪技术和一个用来估计法向量不确定性的模块,以避免模型被不可靠的表面法向监督所误导。在基准数据集上的实验表明,我们所提出的方案可以解决上述挑战,且优于现有方法。
徐凯 国防科技大学计算机学院教授/博导
报告人简介:徐凯,国防科技大学教授/博导,国家杰出青年基金获得者。普林斯顿大学访问学者。研究方向为计算机图形学、三维视觉、具身智能、数字孪生等。在国际上较早开展了数据驱动三维感知、建模与交互工作,提出面向复杂三维数据的结构化感知、建模与交互理论方法系统。发表TOG/TPAMI/TVCG等A类论文90余篇,其中图形学顶会SIGGRAPH论文30余篇(第一作者10篇)。担任图形领域顶级国际期刊ACM Transactions on Graphics、IEEE Transactions on Visualization and Computer Graphics的编委,以及多个领域重要会议的程序主席。任中国图象图形学学会三维视觉专委会副主任、中国工业与应用数学学会几何设计与计算专委会副主任。获湖南省自然科学一等奖2项(排名1和3)、中国计算机学会自然科学一等奖(排名3)、军队科技进步二等奖、军队教学成果二等奖等。
报告题目:多模态具身感知与交互
报告摘要:具身感知与交互是具身智能系统的重要组成部分。如何基于多模态感知输入,建构结构化、语义化,且大模型友好的三维环境表达,同时发挥端侧模型的感知理解和柔性交互能力,以及云侧大模型的常识推理和任务规划能力,以实现面向高层次任务的主动、持续、长程感知与交互,是具身智能系统的核心能力要求。围绕上述问题,本次报告汇报我们的相关进展,包括跨智能体动态抓取技能学习,机器人主动三维场景图构建,未知场景物体目标导航,以及基于多模态大模型的室内物品整理。
报告人简介:章国锋,浙江大学教授/博导,国家杰出青年科学基金获得者。主要从事三维视觉与增强现实方面的研究,尤其在SLAM和三维重建方面取得了一系列重要成果,开源了一系列相关系统和算法的源代码,是OpenXRLab扩展现实开源平台的主要发起人。曾获2010年CCF优秀博士学位论文奖、2011年全国优秀博士学位论文奖、2020年浙江省技术发明奖一等奖(排名第4)、2021年浙江省自然科学奖一等奖(排名第2)以及国际顶级会议ISMAR 2020唯一最佳论文奖。担任国际顶级期刊IJCV编委,以及《Virtual Reality & Intelligent Hardware》、《计算机辅助设计与图形学学报》和《中国图象图形学报》等期刊编委。
报告题目:视觉SLAM
报告摘要:视觉SLAM是计算机视觉和机器人领域的基本问题,有着广泛的应用。经过几十年的发展,视觉SLAM取得了很大的进展,已经达到一定的成熟度,但要满足实际的应用需求仍需要解决一些关键性难题。例如,如何让移动终端在大尺度复杂场景下做到实时稳定的跟踪定位?如何实现高效的全局优化以及时消除误差累积?如何以低成本的方式构建大尺度场景的视觉定位数据集?本次报告将介绍视觉SLAM的基本原理和前沿进展,并重点介绍我们为了解决以上关键问题所做的研究工作,以及在定位导航和混合现实上的应用。
报告人简介:王成,中国科学院空天信息创新研究院研究员/博士生导师、中国科学院大学教授。国际数字地球学会中国国家委员会激光雷达专业委员会主任委员,入选国家高层次人才计划和中科院引进人才计划。研究方向为激光雷达遥感,发表相关SCI论文100余篇,获省部级科技奖励10项;出版了第一部激光雷达遥感教材《激光雷达遥感导论》并被全国五十多所高校使用,开发了我国激光雷达软件“点云魔方”(2015年发布)并已在测绘、林业、电力等行业推广使用。
报告题目:激光雷达遥感数据处理
报告摘要:围绕激光雷达遥感前沿技术及其发展态势,本报告首先介绍激光雷达遥感的基本概念和基础理论,然后介绍多平台(星载、机载、地基)多模态(点云、波形、光子)激光雷达数据处理所涉及的基本模型、数据处理方法、数据融合方法,随后对激光雷达在测绘、林业、电力、通讯、数字城市、无人驾驶、考古等领域的典型应用进行详细介绍,最后介绍激光雷达数据处理软件“点云魔方”的特点、功能和应用情况。
06
联系方式
联系人:黄老师
联系电话:010-82544754
邮箱:igal@csig.orrg.cn
欢迎扫描二维码加入中国图象图形学学会
(http://membership.csig.org.cn)