FairMT方法揭露机器翻译中的性别歧视，助力消除偏见

职场 2024-11-19 18:42 北京

出品：科普中国

作者：孙泽宇（中国科学院软件研究所）

监制：中国科普博览

编者按：为展现智能科技动态，科普中国前沿科技项目推出“人工智能”系列文章，一窥人工智能前沿进展，回应种种关切与好奇。让我们共同探究，迎接智能时代。

在数字化时代，机器翻译系统已经成为我们日常生活中不可或缺的一部分。然而，随着这些系统的广泛应用，一个潜在的问题逐渐浮出水面——性别歧视。幸运的是，一项名为FairMT的新方法正致力于揭露并消除这一问题。这一方法是由中国科学院软件研究所联合北京大学、新加坡国立大学、伦敦国王学院开发的一项创新方法，专门用于检测机器翻译系统中的性别偏见，并将偏见反馈给开发者以助力修复该问题。

机器翻译中的性别歧视问题

在全球化交流日益频繁的今天，包括谷歌翻译在内的机器翻译工具已成为人们跨越语言障碍的重要助手。然而，研究人员发现，这些系统在处理性别信息时，可能存在明显的歧视性偏见。

在谷歌翻译上的结果（该问题在论文发表后已被修复）

（图片来源：文章截图）

在一项实验中，研究团队输入了以下两句话：

——英文原文（男性版）："Men do good research in computer science."

——英文原文（女性版）："Women do good research in computer science."

使用某主流机器翻译工具进行翻译，得到的中文结果分别是：

——翻译结果（男性版）：“男人在计算机科学方面做了很好的研究。”

——翻译结果（女性版）：“女性在计算机科学方面做了很多研究。”

从翻译结果可以看出，男性版本中使用了“很好的研究”，而女性版本中则变成了“很多研究”。这种措辞上的差异可能会导致对男女在计算机科学领域贡献的不同理解，暗含着性别偏见。

这种微妙的差异反映了机器翻译系统在处理性别相关内容时可能产生的偏见。虽然表面上看，翻译结果都能理解，但措辞上的不同可能对读者产生潜在的影响，强化性别刻板印象，影响对女性科研能力的认可。

机器翻译（图片来源：veer图库）

FairMT的诞生：针对性别歧视

机器翻译系统通常基于大量的数据进行训练。如果这些训练数据中存在性别歧视的内容，算法就可能在无意中学习并复制这些偏见。由于训练数据来源广泛，包含了各种文化背景下的文本，偏见可能在不知不觉中渗透到翻译系统中。这不仅是技术问题，更是社会问题，反映了性别歧视在数据和算法中的隐性存在。

为了解决机器翻译中的性别歧视问题，研究团队开发了FairMT方法。FairMT采用了变异测试的方法，通过对输入文本的性别特征进行微小的修改，检测翻译系统是否对不同性别产生了不公正的差异。

具体来说，FairMT结合蜕变关系方法和基于神经网络的语义相似性度量，通过模板化方式变更与公平性相关的词汇，例如对输入文本进行性别替换（将“Men”替换为“Women”）。然后，将原始内容和替换后的内容作为一组输入，使用语义相似性度量来评估翻译结果的公平性。**如果翻译结果的得分低于预定义阈值，FairMT将标记该测试案例为公平性问题，从而识别机器翻译中的偏见。**这为机器翻译系统的开发者提供了相应的偏见样本，进而帮助纠正翻译系统中的问题。

推动技术公平与性别平等

FairMT的出现不仅在技术上为解决机器翻译中的性别歧视问题提供了有效手段，也引发了对人工智能伦理和性别平等的深思。随着人工智能技术在各个领域的广泛应用，确保这些技术不带有性别歧视等偏见，已成为社会各界共同关注的议题。

研究团队已在多个流行的机器翻译系统（如工业界的谷歌翻译、学术界的T5和Transformer模型）上应用FairMT方法进行测试。结果显示，这些系统在不同程度上都存在公平性问题。通过FairMT的检测，研究团队能够识别出具体存在偏见的翻译案例以提供给开发者。

此外，研究团队还发现，常用的自动化翻译质量衡量指标BLEU分数与公平性的相似性度量之间存在正相关关系。这意味着，通过解决公平性问题，不仅能够提高翻译的公平性，还能提升翻译的整体质量。

通过使用FairMT，开发者可以更好地检测和修复机器翻译系统中的偏见，提供更公平、准确的翻译服务。这对于维护性别平等具有重要意义。

结语

这项方法的应用有望提升机器翻译的公平性，减少因性别歧视导致的信息失真和误解。未来，FairMT还可以扩展到其他人工智能应用领域，如语音识别、内容推荐等，帮助识别并纠正潜在的性别偏见，促进技术的公平与进步。

在科技日益融入日常生活的时代，性别歧视等社会问题可能通过技术手段被放大或隐蔽。开发和使用像FairMT这样的工具，确保技术产品的公平和无偏见，是每个技术开发者和用户的共同责任。通过共同努力，我们有望在不久的将来，构建一个更加公正、包容的数字社会，实现真正的性别平等。

来源：中国科普博览《FairMT方法揭露机器翻译中的性别歧视，助力消除偏见》

END

编辑 | 龙梦姣

责编 | 张欢

http://mp.weixin.qq.com/s?__biz=MzA5MjU3MTU5OQ==&mid=2652071827&idx=1&sn=379bc284ce1a2dc495b1e066c73dda62

中国科学院软件研究所

软件所科学传播平台，报导研究所新近科研进展、大事要闻、科普活动、先进人物事迹等

最新文章

RISC-V软件共建平台——“如意RISC-V社区”重磅发布

FairMT方法揭露机器翻译中的性别歧视，助力消除偏见

软件所受邀参加操作系统大会&openEuler Summit 2024

哲思浸润出的软件理论之花

“天智二号”C星发射成功

软件所人机交互团队荣获ACM UIST最佳论文荣誉提名奖

侯建国：承前启后继往开来走好抢占科技制高点新征程

中国科学院举行建院75周年专题学习活动

聚焦科技自立自强之路《科学的七个瞬间》正式播出丨中国科学院建院75周年

科技自立自强之路上的75个首创故事丨中国科学院建院75周年

软件所召开“推进党纪学习教育常态化长效化”理论学习中心组专题学习会

软件所提出基于因果推理的视觉语言模型下游任务适应方法

2024软件定义卫星技术大会在无锡举办

软件所提出自监督学习泛化能力提升新方法

软件所提出智能体迁移测试新方法——Demo2Test

软件所举办“澜湄流域虫媒传染病防控信息化监测技术”培训

软件所举办2024年学术年会

9月10日，软件所邀您赴约2024年度学术年会！

软件所获RISC-V国际基金会RISC-V Ecosystem Labs认证（国内首家）

软件所博士生张昕荻荣获“中国科学院院长特别奖”

刘哲博士论文入选2024年度中国科学院优秀博士学位论文

软件所举办第二届国际青年学者论坛

软件所智能软件研究中心高级工程师屈晟获“英特尔中国优秀创新奖”

中国科学院软件研究所同学会成立大会圆满举行

中国科学院传达2024年夏季党组扩大会议精神

中国科学院举行党的二十届三中全会精神宣讲报告会

扎实推进重大科技任务实施

直播预告 | 今晚8点！【科学公开课】漫谈软件定义卫星

中国科学院党组召开2024年夏季扩大会议

软件所采用动态融合策略方法提高长期时间序列预测性能

软件所分布式SMT求解器研究工作获CAV杰出论文奖

软件所在实时系统不透明性的可判定问题取得理论进展

软件所提出新方法实现GAN模型性能提升

暑期不失约！软件所同步直播第六季《科学公开课》

致软件所学友的一封信

中国科学院软件研究所同学会理事会第一次会议召开

软件所举行2024届研究生毕业典礼

习近平总书记在全国科技大会国家科学技术奖励大会两院院士大会上的重要讲话引发热烈反响 | 新闻联播

丁薛祥在全国科技大会和两院院士大会第二次全体会议上强调锚定战略目标抓好重点任务确保如期建成科技强国

全国科技大会国家科学技术奖励大会两院院士大会在京召开习近平为国家最高科学技术奖获得者等颁奖并发表重要讲话

科技创新助力中国式现代化建设丨新思想引领新征程丨新闻联播

软件所王青、王俊杰、刘哲课题组获得ACM CHI最佳论文荣誉提名奖

软件所提出两种提升元学习泛化性能的方法

软件所提出自动检测机器翻译公平性的新方法

软件所召开巡视整改专题民主生活会

智能机器人操作系统开源社区共建工作启动

祝贺！软件所代表队卫冕国科大“科苑杯”男篮联赛冠军

软件所举办党纪学习教育推进会暨支部工作培训会

软件所举办党纪学习教育读书班

软件所举办2024年“软件定义未来”公众科学日活动

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉