本次会议将汇聚人工智能领域的优秀青年专家作为报告嘉宾,为参会者呈现关于人工智能领域的最新研究成果。论坛期间将组织安排报告、Panel等学术活动,为与会者奉献一场精彩的学术盛宴。热忱欢迎广大师生参加。由于会议时间与研究生考试时间冲突,暂不支持线下会议,敬请谅解。
会议时间:12月21日 9:00 - 17:30
论坛主席:孙皓亮(山东大学)
腾讯会议号:813-892-768
腾讯会议链接:https://meeting.tencent.com/dm/dormevmzsNxk
会议具体日程
(一)报告
报告题目:概率分布表征—从架构设计到模型微调
报告摘要:视觉表征学习是计算机视觉和模式识别领域一个重要的研究课题。本报告围绕概率分布表征,从深层神经网络架构设计到预训练模型微调,介绍一系列深层概率分布表征网络和基于概率分布表征的高效模型微调方法,提出的方法在提升深层模型泛化性和鲁棒性方面取得了一定的进展。
报告人简介:王旗龙,天津大学智算学部教授,博士生导师。主要围绕鲁棒神经网络架构和开放环境视觉感知开展研究,探索了一系列深层概率分布表征网络,发表TPAMI、CVPR等高水平论文40余篇,谷歌学术引用10000余次,单篇论文最高引用6400余次。先后获吴文俊人工智能优秀青年奖,中国人工智能学会优秀博士论文,CAAI-华为学术奖励基金优秀项目,入选博士后创新人才支持计划(2018)。相关成果应用于自动驾驶环境感知与遥感影像智能解译,分别获2022年天津市科学技术进步二等奖(排名第一)和2023年天津市科学技术进步二等奖(排名第三)。多次担任CVPR、AAAI等国际会议AC和SPC。
报告题目:(量子)结构模式识别与图机器学习-发展历程、现状,及未来展望
报告摘要: 图是描述事物间复杂结构关系的数据类型,如何分析与处理图结构数据是目前人工智能领域研究热点。结构模式识别与图机器学习能够有效挖掘并学习图数据内部蕴含的复杂关联关系与结构模式信息,已在计算机视觉、生物化学信息学、金融复杂网络、社交网络等众多领域获得了广泛应用。本报告首先梳理了结构模式识别与图机器学习过往近40年的发展脉络,分析了不同阶段相关研究的理论特点。针对现有研究存在的理论难点与瓶颈问题,介绍报告人在相关图结构嵌入、图核函数、图神经网络、基于图的特征选择方向的系列研究工作。最后,着重介绍与分析图核与图神经网络之间的理论关联,以及两者近期的融合工作,探讨未来结构模式识别与图机器学习进一步发展方向。
报告人简介: 白璐,北京师范大学-人工智能学院教授,博导,智能技术与教育应用教育部工程研究中心副主任。交叉科学部首届“国家优青”,教育部“国家优秀自费留学生”,百度全球高潜力“AI华人青年学者”,曾入选国际模式识别学会“IAPR Newsletter下一代”(The Next Generation,全球每年4位青年学者)。2015年于英国约克大学(University of York, UK)获哲学博士学位,师从IEEE/IAPR Fellow、英国皇家工程院院士Edwin R. Hancock教授。主要研究包括:结构模式识别、图机器学习、金融人工智能等。发表包括TPAMI、TKDE、ICML、NeurIPS、ICDE、IJCAI、AAAI等在内的国际权威期刊会议论文110余篇。其中,5篇入选ESI热点/高被引,3篇获国际模式识别学会IAPR颁发的“Eduardo Caianiello最佳学生论文奖(ICIAP 2015)”与“最佳科技论文奖(ICPR 2018)”,以及国际管理学重要会议IEEE IEEM 2019颁发的“最佳论文提名”与“杰出论文奖”。担任国际权威期刊IEEE TNNLS、PR journal、Neural Networks编委,曾组织期刊PR首个关于金融人工智能主题特刊。公开或授权国家发明专利近10项,部分研究成果应用于科大讯飞、中国电信等企业实际业务,或形成报告被“国家发展和改革委员会”采纳。
报告题目: 文生图模型中文本和图像表征的思考
报告摘要: SD模型是一种依赖文本提示来生成图像的扩散模型,其核心优势在于能够精准描述目标图像的内容。不过,该模型在生成与文本语义高度一致的图像时存在一定的困难,并且推理过程相对缓慢。为应对这些挑战,我们探讨了优化文本嵌入的方法,通过移除不相关的信息来澄清复杂文本提示中主要对象之间的关系。此外,为了改善推理速度,我们引入了特征共享机制,以减少处理时间并提高效率。
报告人简介: 王亚星,南开大学计算机学院副教授,博士生导师,入选海外高层次青年人才,南开“百名青年学科带头人培养计划”。西班牙巴塞罗那自治大学博士,曾在西班牙巴塞罗那自治大学从事博士后研究。研究方向为扩散模型、生成对抗网络、图像到图像翻译、迁移学习。在IJCV,CVPR,NeurIPS等期刊会议发表论文30余篇,谷歌学术引用2000余次。现担任Computers, Materials & Continua期刊编委,ECCV Workshop 组织者,在国际顶级期刊和会议TPAMI、NeurIPS、CVPR、ICCV等多次担任期刊和会议审稿人。多模态语言翻译国际竞赛 (WMT16 Multimodal Machine Translation challenge) 中荣获第一名、2022年粤港澳大湾区(黄埔)国际算法算例大赛(遥感目标检测赛道)亚军(2/116队伍)。
个人主页:https://yaxingwang.netlify.app/author/yaxing-wang/
报告题目: 扩散模型前沿进展
报告摘要: 扩散概率模型逐步地对先验分布去噪恢复数据分布,可以有效地建模各类视觉数据。本次报告会介绍连续扩散模型的理论、方法与应用,包括高效采样、基础架构设计与训练、图像编辑、视频生成、三维物体生成等,并探讨扩散模型在文本建模上的前沿进展。
报告人简介:李崇轩,中国人民大学高瓴人工智能学院准聘副教授、博士生导师,2010-2019年获清华大学学士和博士学位。主要研究机器学习、深度生成模型,代表性工作部署于DALL·E 2、Stable Diffusion、Vidu等生成式大模型。获国际会议ICLR杰出论文奖、吴文俊优秀青年奖、吴文俊人工智能自然科学一等奖、中国计算机学会优秀博士论文等,主持国家自然基金重大研究计划培育项目等。担任IEEE TPAMI 编委、软件学报编委和ICLR、NeurIPS等国际会议的领域主席。
个人主页:https://zhenxuan00.github.io/
邮箱: chongxuanli@ruc.edu.cn
报告题目: 开放场景视觉计算
报告摘要:开放场景视觉计算是人工智能领域的重要研究方向,旨在使智能系统能够在动态、多变的真实环境中高效理解和处理视觉信息。从自动驾驶到空间智能,再到具身智能,开放场景视觉计算都是关键所在。面对开放场景中环境的多样性、不确定性以及数据分布的复杂性,现有视觉算法在表达能力、学习效率和推理复杂度方面面临诸多挑战。本次报告将从视觉表达、高效学习、复杂推理三方面展开:在视觉表达方面,介绍基于非学习视觉原型的可解释视觉概念表达方法,以及其在图像分类和图像分割等任务中的应用;在高效学习方面,介绍课题组在视觉-语言大模型的提示学习方面的研究成果;最后,在复杂推理方面,重点介绍视觉溯因推理的研究成果,这种推理通过从观察到的现象中推导可能的因果解释,帮助智能系统完成从“看见”到“理解”的跨越。
报告人简介:周天飞,北京理工大学计算机学院教授,博士生导师,国家优秀青年基金(海外)获得者。2017年于北京理工大学取得博士学位,之后在联想研究院、起源人工智能研究院(IIAI)、苏黎世联邦理工学院(ETH Zurich)从事科研工作。2023年加入北京理工大学计算机学院。主要研究方向为人工智能和计算机视觉,在相关领域国际顶级期刊和会议(如IEEE TPAMI、ICML、NeurIPS、CVPR)等发表学术论文60余篇,谷歌学术引用4600余次。第一作者论文获医疗图像分析领域顶会MICCAI的最佳论文奖(2022年)、世界人工智能大会青年优秀论文提名奖(2021年)、入选斯坦福“全球前2%顶尖科学家”榜单、带队在7个国际学术竞赛中获得冠军。 担任IEEE TCSVT特邀编辑、Multimedia Tools and Applications副主编等。