【预告】PRCV2024专题论坛 | 视觉基础模型及其前沿应用

学术 2024-10-17 17:32 北京

第七届中国模式识别与计算机视觉大会（PRCV 2024）将于2024年10月18日至20日在乌鲁木齐举办。Visual Intelligence在PRCV 2024大会上组织了视觉基础模型及其前沿应用论坛，邀请了5位嘉宾进行分享。2024年10月18日(周五)10:00，我们与您相约新疆国际会展中心！

论坛简介

时间：2024年10月18日（周五）10：00-12：05

地点：新疆国际会展中心五层报告厅

简介：在大规模基础模型取得重大进展的推动下，计算机视觉领域经历了深刻的变革。计算机视觉领域的变革浪潮前沿是视觉模型，例如Vision Transformer（ViT），通过自注意力机制来理解图像，引领了图像理解范式的转变。同时，跨语言图像预训练（CLIP）框架提出了一种新的方法，通过利用图像-文本对数据集来促进视觉-语言理解。此外，Segment Anything Model（SAM）和GPT-4V为视觉模型赋予了交互式语义分割的功能。这些进展不仅突显基础模型理论的重要性，而且还提供了具体的实现路径，重塑计算机视觉的格局。然而，视觉基础模型的研究方兴未艾，如何在实际应用场景中产生更大的价值，值得我们进一步探索。基于此，中国图象图形学学会主办的英文学术期刊Visual Intelligence将在本次大会上组织“视觉基础模型及其前沿应用”专题论坛，旨在将领域内相关研究者聚集在一起，交流目前视觉基础模型研究和技术应用的最新进展和未来发展趋势，对其中一些共性、难点问题进行交流和深入探讨。

论坛日程

论坛主席

罗斌

CSIG常务理事，安徽大学教授，VI副主编

罗斌，安徽大学计算机科学与技术学院教授、博士生导师，安徽省学术技术带头人，安徽省模范教师。现任中国图象图形学学会（CSIG）常务理事、安徽省计算机学会监事长。曾受聘英国电信公司短期研究员、美国佛罗里达技术学院客座教授、澳大利亚新南威尔士大学客座研究员、新加坡南洋理工大学客座教授、英国Stirling大学客座教授、英国York大学博士后研究员等。研究方向为模式识别与数字图像处理。代表性成果发表于IEEE TPAMI和CVPR等国际期刊和会议。任Visual Intelligence副主编和《安徽大学学报（自然科学版）》主编。

范登平教授

南开大学

范登平，南开大学教授、博士生导师，计算机系主任、国家级四青人才。代表性论文：1篇NeurIPS workshop最佳论文、2篇CVPR最佳论文提名、5篇热点论文、10篇TPAMI，谷歌引用2.1万，H指数53。担任IEEE TIP、Visual Intelligence等国际期刊编委，CVPR、NeurIPS等国际顶会领域主席，入选斯坦福全球前2%顶尖科学家榜单。

论坛嘉宾

郑伟诗教授

中山大学

报告题目：具身视觉感知与学习

报告摘要：面向物理实体机器人的视觉行为感知与学习是具身智能研究的重要一环。本次报告将汇报我们研究组在通用机器人自由抓取建模上所展开的相关研究，包括机器人6DOF抓取建模、机械灵巧手抓取建模、动态抓取与多机器人协作、机器人行为质量评估等初步研究成果。

个人简介：郑伟诗，中山大学计算机学院教授、副院长，教育部“长江学者奖励计划”特聘教授，英国皇家学会牛顿高级学者，教育部机器智能与先进计算重点实验室主任。他长期研究协同与交互分析理论与方法，解决人体建模和机器人行为的视觉计算问题。担任IEEE TPAMI、Visual Intelligence等期刊的编委。主持承担国家级重点类项目和人才项目5项、广东省自然科学基金委卓越青年团队(负责人)项目等。获国家教学和省部级科技奖励6项。

王兴刚教授

华中科技大学

报告题目：低复杂度视觉基础模型研究

报告摘要：Transformer 在视觉和多模态基础模型领域已取得巨大成功，但其计算复杂度随输入序列长度的增加而呈二次增长。因此，探索低复杂度的视觉和多模态基础模型成为一个核心问题。本报告将介绍我们利用 Mamba、Gated Linear Attention 等新机制构建低复杂度视觉基础模型的初步研究，以及如何运用这些新型网络实现计算高效且表征能力强的视觉理解和内容生成模型。

个人简介：王兴刚，华中科技大学电信学院教授、博士生导师，入选国家级青年人才计划，现任Image and Vision Computing期刊（Elsevier, IF 4.2）共同主编。主要从事基础模型、视觉表征学习、目标检测分割跟踪等领域研究、在IEEE TPAMI、IJCV、CVPR、ICCV、NeurIPS等顶级期刊会议发表学术论文60余篇，谷歌学术引用3万余次，其中一作/通讯1000+引用论文5篇，入选Elsevier 2023中国高被引学者。担任CVPR、ICCV、ICIG等会议领域主席，Machine Vision and Application等期刊编委。入选中国科协青年人才托举工程，获湖北青年五四奖章、CSIG青年科学家奖，吴文俊人工智能优秀青年奖，CVMJ 2021最佳论文奖，湖北省自然科学二等奖等，指导学生获2022年全国“互联网+”大赛金奖、2023年挑战杯“揭榜挂帅”专项赛全国一等奖。

叶茫教授

武汉大学

报告题目：多模态基础模型驱动的图文跨模态检索

报告摘要：图文跨模态检索任务是连接视觉内容与文本信息的重要桥梁，如何将通用多模态基础模型迁移适配到下游任务具有重要意义。本次报告将分享我们团队基于通用CLIP模型在下游的图文跨模态检索上的研究进展，主要包括以人为中心的图文检索和多模态检索，通用图文检索和视频文本检索等方向，旨在实现更精准高效的信息检索。

个人简介：叶茫，武汉大学计算机学院教授、博士生导师，国家级高层次青年人才，入选中国科协青年人才托举工程、湖北省高层次人才。曾任阿联酋起源人工智能研究院研究科学家，美国哥伦比亚大学访问学者。主要研究方向多模态检索、多模态语义理解、联邦学习等，以第一/通讯作者发表 CCF-A 类论文 60 余篇，谷歌学术引用 9000 余次，1篇论文入选湖北省优秀科技论文。受邀担任CCF-A类期刊IEEE TIFS（中科院一区）等国际SCI期刊编委，多次受邀担任顶级会议CVPR、ACM MM、NeurIPS、ICLR、ECCV领域主席等学术职务。

任文琦教授

中山大学

报告题目：低质量与对抗环境下的目标检测

报告摘要：本报告聚焦低质量视觉内容增强与感知对抗主题。针对图像视频在成像过程中常见的模糊、雨雾、低分辨率及低动态范围等质量退化问题，深入研究了多种视觉基础模型在视觉内容清晰化上的可行性，验证了新颖Transformer和状态空间模型在底层视觉恢复任务的有效性。提出一种新的图像恢复算法，在提升图像的清晰度的同时充分融合了下游目标检测效果的增益考量。通过对干净标签进行对抗攻击能够生成既与原始样本相近又有助于目标检测的伪标签，从而确保在增强图像质量的同时提升目标检测的准确度。此外，针对视觉对抗攻击这一日益严重的威胁，进一步提出一种无需先验知识或额外训练的对抗补丁定位与移除方法。该方法能够应对各种对抗攻击模式，兼容不同预训练的目标检测器，显著提升了防御能力。提出的方法在多种退化场景和攻击类型下均能显著提升目标检测的准确性。

个人简介：任文琦，中山大学“百人计划” 引进人才，教授，主持国家自然科学优秀青年基金，广东省重大人才工程青年拔尖人才。长期从事多媒体内容安全、目标增强与感知、计算机视觉等领域的教学科研工作。在人工智能和计算机视觉领域发表80余篇中科院一区和CCF-A类期刊和国际顶会议论文。截至目前，Google Scholar 引用14000余次，包括ESI高被引论文7篇，第一作者论文单篇最高被引1800余次，入选2022/2023年爱思唯尔中国高被引学者。担任CVPR、NeurIPS、ICLR等计算机视觉与人工智能国际会议的领域主席，《中国图象图形学报》等期刊编委。主持国家自然科学基金优青、面上、国际合作与交流项目，深圳市优青、面上项目，华为、腾讯公司资助项目等20余项。入选2018微软亚洲研究院“铸星计划”、2022百度全球高潜力AI华人青年学者。曾获2019年中国计算机学会优博奖、2022年吴文俊人工智能优秀青年奖、2023年中国图象图形学学会自然科学一等奖（第三完成人）。

王文海

上海人工智能实验室青年科学家

报告题目：视觉语言大模型的研究与应用：通过开源套件缩小与商用多模态大模型的性能差距

报告摘要：随着大语言模型的兴起，多模态大模型也取得了显著进步，推动了复杂的视觉语言对话和交互，弥合了文本与视觉信息之间的鸿沟。然而，现有的开源模型与商用闭源模型（如GPT-4o和Gemini 1.5 Pro）相比，在模型性能上仍存在显著差距。本报告将探讨图文多模态大模型的基本原理和技术，探索如何利用开源套件构建强大的多模态大模型，研究如何通过渐进式策略扩展开源多模态模型的性能边界，以缩小开源模型与商业闭源模型在多模态理解方面的能力差距。

个人简介：王文海，上海人工智能实验室青年科学家。南京大学博士，香港中文大学博士后，上海人工智能实验室“书生”系列视觉和多模态模型核心开发者。研究方向为视觉基础模型，在IEEE TPAMI、CVPR、ICCV、ECCV、ICLR、NeurIPS等国际会议和期刊发表论文40余篇，其中20篇为一作/共同一作/通信作者。研究成果获得了超过2万次引用，单篇最高引用超3000次。研究成果分别入选CVPR 2023最佳论文，世界人工智能大会青年优秀论文奖，CVMJ 2022最佳论文提名奖，两次入选ESI高被引论文（前1%）和热点论文（前0.1%），6次入选Paper Digest CVPR、ICCV、NeurIPS、ECCV年度十大最具影响力论文。入选斯坦福大学2023年度全球前2%顶尖科学家，中国图象图形学学会优博提名，世界人工智能大会云帆奖。担任Visual Intelligence编委，IJCAI 2021的高级程序委员会委员，以及多个顶级国际期刊和会议的审稿人。

PRCV2024简介

第七届中国模式识别与计算机视觉大会(The 7th Chinese Conference on Pattern Recognition and Computer Vision，PRCV 2024)将于2024年18日至20日在乌鲁木齐举办。PRCV2024由中国自动化学会（CAA）、中国图象图形学学会（CSIG）、中国人工智能学会（CAAI）和中国计算机学会（CCF）联合主办，新疆大学承办，是国内顶级的模式识别和计算机视觉领域学术盛会，CCF C类会议。

本届会议旨在汇聚国际国内模式识别和计算机视觉领域的广大科研工作者及工业界同行，分享最新理论研究进展和技术研发成果。通过此次会议，能加强本领域学术界和企业界进行深入的“产学研”交流与合作，从而进一步促进模式识别与计算机视觉领域的协同创新。

大会官网：

http://www.prcv.cn/

来源：Visual Intelligence公众号

图像图形领域高质量科技期刊分级目录

中国图象图形学学会科普活动、素材征集通知

中国图象图形学学会高校志愿者招募

中国图象图形学学会关于组织开展科技成果评价的通知

2024年CSIG图像图形中国行承办方征集中

http://mp.weixin.qq.com/s?__biz=MzUxMDE4MzAzOA==&mid=2247803336&idx=4&sn=d2fff81bd25c53a0290d676884b78e9c

中国图象图形学学会CSIG

发布图象图形技术的理论研究、应用推广、科学普及、专业培训、技术咨询、学术交流、出版专业书刊等信息，促进该学科技术的发展和在国民经济各个领域的推广应用。

最新文章

【CCIG 2025】2025中国图象图形大会诚招合作单位

【动态】中国图象图形学学会组织编写的《元宇宙产业技术路线图》正式出版

【早鸟票最后一天】第五届CSIG中国媒体取证与安全大会日程安排出炉！

【学习时间】习近平：推进中国式现代化，科学技术要打头阵

【预告】CSIG智能制造新质生产力研讨会将于10月30日在长沙召开

【速览】TPAMI 2024 | 基于可复用网络架构生长的连续立体匹配框架

【科研播报】CSIG理事、北京大学林宙辰教授团队全新混合序列建模架构MixCon：性能远超Mamba

【预告】PRCV2024专题论坛 | 视觉基础模型及其前沿应用

【直播预告】CSIG科普大讲堂—AI for Nobel Prize将于10月20日举办

【CSIG团体会员】四川爱科会易科技有限公司加入CSIG！

【CSIG团体会员】兴图新科受邀亮相北京安博会|10月22日邀您共赏

【直播预告】第三期CSIG理事荟活动将于10月17日晚8点开始

【通知】关于推荐中国科协科技人才举荐和表彰奖励评价专家的通知

【CSIG青年科学家会议2024】大会开放注册

【直播预告】CSIG菁英青云在线论坛第41期将于10月22日举办

【CSIG全国科普日】CSIG-VIS@S35: 高原走进西安高新一中南校区

【通知】中国图象图形学学会2024年度奖励和激励计划初评通过项目公示

【CSIG青年科学家会议2024】大会全部讲者名单发布

【ChinaVR 2024】大会顶刊顶会论文征集

【CSIG全国科普日】“人与AI合作”学术科普讲座在复旦大学成功举办

【动态】中国图象图形学学会主办的20场会议入选中国科协《重要学术会议目录（2024）》

【科研播报】CaPaint：基于扩散模型的时空数据因果解码与修补

【招生简章】中国科学院自动化研究所2025年招收攻读硕士学位研究生招生简章

【速览】TPAMI 2024 | 基于时空量子扩散模型的实时X射线血管造影冠状动脉狭窄检测

【科研播报】NeurIPS 2024录用论文速递Part.3

【直播预告】CSIG云讲堂：10月15日19点，张振宇主讲：表里先验引导的三维数字人重建与生成

【CSIG全国科普日】网络安全科技馆全国科普日活动成功举办

【学习时间】习近平：大力弘扬伟大爱国主义精神，把强国建设、民族复兴伟业不断推向前进

【科研播报】2024诺贝尔物理学奖、化学奖揭晓，AI包揽两大奖项

【科研播报】CSIG副理事长兼秘书长马惠敏教授团队论文被国际顶级会议录用

【直播预告】第三期CSIG理事荟活动将于10月17日晚8点开始

【动态】中国图象图形学学会海智专家服务团赴湖南开展调研活动

【动态】第28期企业行—走进陕西山河明泽生态环境技术咨询有限公司成功举办

【CSIG全国科普日】“启少年志筑科技梦”全国科普日青少年主题科普系列活动成功举办

【通知】第五届CSIG中国媒体取证与安全大会将于10月25日-27日举行

【预告】CSIG10月活动速递第一弹，快来一睹为快~

【秋招进行时】CSIG团体会员：广东履安实业校园招聘火热进行中

【CSIG全国科普日】《点亮少年好奇心，培养强国栋梁》活动在天津工业大学成功举行

【CSIG全国科普日】耿国华教授向西北大学计算机类新生讲授“数字化技术赋能文化遗产保护”专题科普报告

【CSIG全国科普日】“探索《黑神话·悟空》：AI 赋能下的科技艺术融合”活动成功举办

【CSIG全国科普日】手机光影赋新篇塘河古韵映江南—手机摄影美育暨江南塘河古建筑水文化数字化影像保护公益巡讲成功举行

【CSIG月报】2024年9月热点回顾

【科研播报】EMNLP 2024录用论文速递Part.1

【秋招进行时】CSIG团体会员：爱芯元智2025届校园招聘启动 | 共绘AI新纪元

【通知】Visual Intelligence 第2卷第3期在线出版

【科普动态】CSIG-VIS@S31-S34: 袁晓如走进雄安四所中学

【科研播报】高新波：新一代人工智能助推新质生产力的形成和发展

【秋招进行时】CSIG理事单位：商汤科技2025届校园招聘正式启动！

【秋招进行时】CSIG理事单位：商汤2025届校招AI先锋顶尖人才计划启动

【科研播报】NeurIPS 2024录用论文速递Part.2

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉