一、时间地点
会议时间:2024年11月8-9日
会议地点:北京市海淀区中国科技会堂B406会议室
二、会议组织
立项支持:中国科学技术协会
三、会议主题
四、会议议程
五、主旨报告
程明明 南开大学
嘉宾简介:程明明,南开大学杰出教授,新一代人工智能发展战略研究院副院长。主持承担了国家杰出青年科学基金、优秀青年科学基金项目、科技部重大项目课题等。他的主要研究方向是人工智能、计算机视觉和计算机图形学,在SCI一区/CCF A类刊物上发表学术论文100余篇(含IEEE TPAMI论文38篇),h-index为93,论文谷歌引用5.4万余次,单篇最高引用5千余次,多次入选全球高被引科学家和中国高被引学者。技术成果被应用于华为、国家减灾中心等多个单位的旗舰产品。获得教育部自然科学一等奖2项、其他省部级科技奖2项。培养的3名博士生获得省部级优秀博士论文奖。现担任中国图象图形学学会副秘书长、天津市人工智能学会副理事长和顶级期刊IEEE TPAMI, IEEE TIP和《中国科学:信息科学》编委。
报告题目:高效能个性化图像生成
报告摘要:以大模型为代表的多模态图像生成技术可以有效地根据文本信息生成高质量的图像。然而,现有多模态生成技术在模型训练和个性化生成方面表现出较低的效率。例如,作为最近AI顶流的Sora模型虽然可以生成数十秒的流畅视频,但其训练代价相当高。Sora核心组件Difussion Transformer (DiT) 经常需要数十万次地迭代训练才能生成高质量的图像。此外,在图像生成中引入个性化的信息虽然富有吸引力,但是经典通过模型微调的形式经常耗费数十分钟才能得到高质量的结果。这些问题给生成式模型的大规模推广造成了障碍。本报告将介绍如何通过引入结构信息建模能力和个性化信息编码能力,有效地避免上述问题,并将该领域主流方法的性能提升2个数量级以上。
方乐缘 湖南大学
嘉宾简介:方乐缘,湖南大学教授,国家杰青、国家优青,科睿唯安(Clarivate Analytics)全球“高被引科学家”, 爱思唯尔中国高被引学者。获得国家自然科学二等奖2项、IEEE GRSS最高影响力论文奖、湖南省自然科学一等奖2项等。担任SCI期刊IEEE Transactions on Image Processing、IEEE Transactions on Neural Networks and Learning System、IEEE Transactions on Geoscience and Remote Sensing等期刊编委。现主要从事深度学习、弱监督学习以及在遥感图像处理与分析等方面的研究。研究成果在国际权威期刊和会议发表论文160余篇,其中SCI期刊发表论文100余篇(IEEE TPAMI、IJCV、TIP等本领域顶级期刊论文80余篇),国际权威会议论文30篇,Google scholar引用15600余次,ESI高被引22篇,ESI热点论文4篇。主持国家杰青、基金委联合重点、国家重点研发课题等项目。
报告题目:资源受限遥感影像处理
报告摘要:深度学习因其出色的性能在遥感影像处理分析中已被广泛应用。然而,高性能深度学习模型严重依赖于海量数据、精确标注以及庞大算力。在星载/机载遥感实际应用中,数据数量、标注质量、计算能力严重受限,制约着智能模型在遥感领域的应用。本报告首先针对遥感影像数量和质量受限问题,提出跨图像关联的半监督遥感图像处理方法,摆脱了模型对原始海量高质量数据的依赖;其次,针对遥感影像标注困难、时间代价昂贵的问题,提出点标签智能解译方法,保持处理精度的同时,显著降低标注代价;最后,针对遥感计算能力受限的问题,提出一种高效的网络层压缩方法,在不影响推理精度的同时,大幅降低存储和计算代价。
常晓军 中国科学技术大学
嘉宾简介:常晓军,中国科学技术大学讲席教授,国家高层次人才,澳大利亚研究理事会青年研究奖获得者。主要从事多模态学习、计算机视觉和绿色人工智能及其在社会公益方面的应用。主持包括澳大利亚研究理事会科研基金、企业联合基金(Linkage Program)等国家级项目十余项。相关科研成果发表在T-PAMI、TIP等国际顶级期刊和CCF A类会议上150多篇,论文的Google Scholar引用次数18000余次,其中21篇入选ESI高被引/热点论文。2019年至2023年连续入选科睿唯安高被引学者。担任IEEE TCSVT、IEEE TNNLS、ACM TOMM等国际顶级期刊的副主编和CCF A类会议的领域主席(Area Chair)。
报告题目:多模态大模型赋能具身智能
报告摘要:随着多模态大模型的快速发展,具身智能系统在理解和处理复杂环境方面得到了显著提升。多模态大模型能够有效融合视觉、语言和其他感知信息,为具身智能系统提供了更强的环境感知能力和决策支持,赋能于机器人、自主驾驶等多个领域的实际应用。本次报告将简要探讨多模态大模型在具身智能中的核心作用与优势,分析其在信息融合、任务执行和人机交互中的应用场景,展示最新的研究进展和实际应用案例,为未来的智能系统发展提供新的思路。
六、考察调研
本次沙龙调研活动定于2024年11月8日赴启元实验室进行考察。启元实验室成立于2020年10月,是智能科技领域的新型科研事业单位,位于中关村国家创新自主示范区核心区(海淀园)。实验室聚焦智能科技领域,重点开展前沿性、战略性、颠覆性科研攻关,以“体现国家意志、服务国家战略、承担国家使命、代表国家水平”为使命定位,矢志成为智能领域的全球科技创新高地、人才汇聚高地、技术转移转化高地。
七、联系人及联系方式
联系人:骆岩峰、崔金凯
电话:010-82544661
邮箱:info@csig.org.cn