软件所提出基于因果推理的视觉语言模型下游任务适应方法

职场 2024-10-23 09:52 北京

近日，软件所天基综合信息系统全国重点实验室研究团队在机器学习领域国际顶级学术会议NeurIPS 2024发表题为Rethinking Misalignment in Vision-Language Model Adaptation from a Causal Perspective的论文，深入探讨了基础视觉语言模型在适应特定下游任务时面临的数据错位问题，并提出了一种创新的适应方法，显著提高了模型对新类数据的识别能力。论文共同第一作者为博士生张雅楠和特别研究助理李江梦，通讯作者为特别研究助理强文文。

近年来，诸如CLIP等基础视觉语言模型通过在大规模数据集上的训练，展现出了卓越的泛化能力。然而，在这类模型通过提示调优适应下游任务时，普遍存在数据错位，即测试时除了有用于训练的基类数据，还需在新类数据上进行评估。实验显示，随着训练进行，模型在基类上的性能持续提升，但在新类上的表现呈现先升后降的趋势。研究团队使用结构因果模型（SCM）对这一现象进行了分析，发现下游任务中基于基类估计的任务无关生成因子对新类来说往往是不准确的，被错误保留的任务无关生成因子成为了影响模型性能的混杂因子。

为了减轻混杂因子的干扰，研究团队提出了一个名为因果驱动的语义解耦与分类方法CDC，通过前门调整来提升模型新类识别的能力。

该方法由两个核心模块组成：第一个模块为语义解耦模块，旨在从输入数据中提取并解耦不同的语义特征；第二个模块为可信分类模块，能够处理多个独立的特征输入，评估对应输出的不确定性，并将结果进行融合。这两个模块互相配合，共同实施前门调整，以估计输入图像及其类别之间的真实因果关系，来增强对新类数据的识别能力，减轻了与任务无关的生成因子对模型性能的负面影响。

因果驱动的语义解耦与分类方法（CDC）框架图

研究团队进一步在Base-to-New、跨数据集OOD泛化、跨域OOD泛化三种不同的实验设置下进行了验证。结果表明，在不同的实验设置下引入CDC均能实现稳定的性能提升。特别是在Base-to-New实验中，CDC在HM指标上相较基线方法MaPLe实现了较为明显的平均性能提升。

Base-to-New设置下的实验结果

跨数据集OOD泛化设置下的实验结果

跨域OOD泛化设置下的实验结果

论文链接：

‍‍‍https://arxiv.org/abs/2410.12816‍‍‍

供稿：天基综合信息系统全国重点实验室

END

编辑 | 龙梦姣

责编 | 张欢

http://mp.weixin.qq.com/s?__biz=MzA5MjU3MTU5OQ==&mid=2652071715&idx=1&sn=afa02a64f33c6c71af3ca9fee04ed481

中国科学院软件研究所

软件所科学传播平台，报导研究所新近科研进展、大事要闻、科普活动、先进人物事迹等

最新文章

RISC-V软件共建平台——“如意RISC-V社区”重磅发布

FairMT方法揭露机器翻译中的性别歧视，助力消除偏见

软件所受邀参加操作系统大会&openEuler Summit 2024

哲思浸润出的软件理论之花

“天智二号”C星发射成功

软件所人机交互团队荣获ACM UIST最佳论文荣誉提名奖

侯建国：承前启后继往开来走好抢占科技制高点新征程

中国科学院举行建院75周年专题学习活动

聚焦科技自立自强之路《科学的七个瞬间》正式播出丨中国科学院建院75周年

科技自立自强之路上的75个首创故事丨中国科学院建院75周年

软件所召开“推进党纪学习教育常态化长效化”理论学习中心组专题学习会

软件所提出基于因果推理的视觉语言模型下游任务适应方法

2024软件定义卫星技术大会在无锡举办

软件所提出自监督学习泛化能力提升新方法

软件所提出智能体迁移测试新方法——Demo2Test

软件所举办“澜湄流域虫媒传染病防控信息化监测技术”培训

软件所举办2024年学术年会

9月10日，软件所邀您赴约2024年度学术年会！

软件所获RISC-V国际基金会RISC-V Ecosystem Labs认证（国内首家）

软件所博士生张昕荻荣获“中国科学院院长特别奖”

刘哲博士论文入选2024年度中国科学院优秀博士学位论文

软件所举办第二届国际青年学者论坛

软件所智能软件研究中心高级工程师屈晟获“英特尔中国优秀创新奖”

中国科学院软件研究所同学会成立大会圆满举行

中国科学院传达2024年夏季党组扩大会议精神

中国科学院举行党的二十届三中全会精神宣讲报告会

扎实推进重大科技任务实施

直播预告 | 今晚8点！【科学公开课】漫谈软件定义卫星

中国科学院党组召开2024年夏季扩大会议

软件所采用动态融合策略方法提高长期时间序列预测性能

软件所分布式SMT求解器研究工作获CAV杰出论文奖

软件所在实时系统不透明性的可判定问题取得理论进展

软件所提出新方法实现GAN模型性能提升

暑期不失约！软件所同步直播第六季《科学公开课》

致软件所学友的一封信

中国科学院软件研究所同学会理事会第一次会议召开

软件所举行2024届研究生毕业典礼

习近平总书记在全国科技大会国家科学技术奖励大会两院院士大会上的重要讲话引发热烈反响 | 新闻联播

丁薛祥在全国科技大会和两院院士大会第二次全体会议上强调锚定战略目标抓好重点任务确保如期建成科技强国

全国科技大会国家科学技术奖励大会两院院士大会在京召开习近平为国家最高科学技术奖获得者等颁奖并发表重要讲话

科技创新助力中国式现代化建设丨新思想引领新征程丨新闻联播

软件所王青、王俊杰、刘哲课题组获得ACM CHI最佳论文荣誉提名奖

软件所提出两种提升元学习泛化性能的方法

软件所提出自动检测机器翻译公平性的新方法

软件所召开巡视整改专题民主生活会

智能机器人操作系统开源社区共建工作启动

祝贺！软件所代表队卫冕国科大“科苑杯”男篮联赛冠军

软件所举办党纪学习教育推进会暨支部工作培训会

软件所举办党纪学习教育读书班

软件所举办2024年“软件定义未来”公众科学日活动

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉