软件所提出自动检测机器翻译公平性的新方法

职场 2024-06-20 17:24 北京

近日，中国科学院软件研究所天基综合信息系统全国重点实验室特别研究助理孙泽宇（第一作者）的论文Fairness Testing of Machine Translation Systems被软件工程顶级期刊ACM Transactions on Software Engineering and Methodology (TOSEM)接收。论文关注可信人工智能的公平性问题，提出了首个旨在检测机器翻译系统公平性的框架FairMT。

随着机器翻译系统的广泛应用，其中的公平性问题日益突显，即系统在处理不同语言、性别、种族、文化等受保护属性时，可能表现出偏见或不公正。现有的几种关于自然语言处理公平性的测试方法主要是利用任务分类，通过输入中变更与公平相关的词汇来检测输出类别的差异。但当前并没有专门为机器翻译任务设计的公平性测试方法，主要挑战在于机器翻译输出的句子是序列而非单一类别，自动检测两个序列之间的公平性问题，目前仍是个难题。

为应对这一挑战，研究团队提出了首个旨在基于蜕变测试自动检测机器翻译系统公平性的框架FairMT。该框架首先遵循蜕变关系，通过模板化方法变更涉及公平性的相关词汇，将源内容和更改内容作为一组输入。随即使用基于神经网络的语义相似性度量来评估输入所对应的翻译结果，将得分低于预定义阈值的测试案例报告为具有潜在公平性问题的内容。最后，FairMT用额外的蜕变关系判断输入中与公平性无关的内容，通过变异这些内容再度生成测试输入进行语义相似性度量，最终确认是否存在公平性问题。

FairMT框架概览

研究团队在谷歌翻译、T5和Transformer上使用FairMT方法进行测试，分别检测到最多832、1984和2627个公平性问题。进一步的人工评估也证实了检测结果的有效性。研究团队还发现，常用自动化翻译质量衡量指标BLEU分数与公平性的相似性度量存在正相关关系，可以证明公平性问题的解决有助于提升翻译质量。

论文链接：

https://dl.acm.org/doi/pdf/10.1145/3664608

供稿：天基综合信息系统全国重点实验室

END

编辑 | 龙梦姣

责编 | 张欢

http://mp.weixin.qq.com/s?__biz=MzA5MjU3MTU5OQ==&mid=2652071147&idx=1&sn=7f3a2656d4e6fd48413b8d7819c7e9f6

中国科学院软件研究所

软件所科学传播平台，报导研究所新近科研进展、大事要闻、科普活动、先进人物事迹等

最新文章

RISC-V软件共建平台——“如意RISC-V社区”重磅发布

FairMT方法揭露机器翻译中的性别歧视，助力消除偏见

软件所受邀参加操作系统大会&openEuler Summit 2024

哲思浸润出的软件理论之花

“天智二号”C星发射成功

软件所人机交互团队荣获ACM UIST最佳论文荣誉提名奖

侯建国：承前启后继往开来走好抢占科技制高点新征程

中国科学院举行建院75周年专题学习活动

聚焦科技自立自强之路《科学的七个瞬间》正式播出丨中国科学院建院75周年

科技自立自强之路上的75个首创故事丨中国科学院建院75周年

软件所召开“推进党纪学习教育常态化长效化”理论学习中心组专题学习会

软件所提出基于因果推理的视觉语言模型下游任务适应方法

2024软件定义卫星技术大会在无锡举办

软件所提出自监督学习泛化能力提升新方法

软件所提出智能体迁移测试新方法——Demo2Test

软件所举办“澜湄流域虫媒传染病防控信息化监测技术”培训

软件所举办2024年学术年会

9月10日，软件所邀您赴约2024年度学术年会！

软件所获RISC-V国际基金会RISC-V Ecosystem Labs认证（国内首家）

软件所博士生张昕荻荣获“中国科学院院长特别奖”

刘哲博士论文入选2024年度中国科学院优秀博士学位论文

软件所举办第二届国际青年学者论坛

软件所智能软件研究中心高级工程师屈晟获“英特尔中国优秀创新奖”

中国科学院软件研究所同学会成立大会圆满举行

中国科学院传达2024年夏季党组扩大会议精神

中国科学院举行党的二十届三中全会精神宣讲报告会

扎实推进重大科技任务实施

直播预告 | 今晚8点！【科学公开课】漫谈软件定义卫星

中国科学院党组召开2024年夏季扩大会议

软件所采用动态融合策略方法提高长期时间序列预测性能

软件所分布式SMT求解器研究工作获CAV杰出论文奖

软件所在实时系统不透明性的可判定问题取得理论进展

软件所提出新方法实现GAN模型性能提升

暑期不失约！软件所同步直播第六季《科学公开课》

致软件所学友的一封信

中国科学院软件研究所同学会理事会第一次会议召开

软件所举行2024届研究生毕业典礼

习近平总书记在全国科技大会国家科学技术奖励大会两院院士大会上的重要讲话引发热烈反响 | 新闻联播

丁薛祥在全国科技大会和两院院士大会第二次全体会议上强调锚定战略目标抓好重点任务确保如期建成科技强国

全国科技大会国家科学技术奖励大会两院院士大会在京召开习近平为国家最高科学技术奖获得者等颁奖并发表重要讲话

科技创新助力中国式现代化建设丨新思想引领新征程丨新闻联播

软件所王青、王俊杰、刘哲课题组获得ACM CHI最佳论文荣誉提名奖

软件所提出两种提升元学习泛化性能的方法

软件所提出自动检测机器翻译公平性的新方法

软件所召开巡视整改专题民主生活会

智能机器人操作系统开源社区共建工作启动

祝贺！软件所代表队卫冕国科大“科苑杯”男篮联赛冠军

软件所举办党纪学习教育推进会暨支部工作培训会

软件所举办党纪学习教育读书班

软件所举办2024年“软件定义未来”公众科学日活动

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉