大阪大学利用AI读唇APP根据口型合成声音，为病人再现失去的声音

百科 2024-11-11 14:49 日本

通过AI工具，可以恢复因喉癌或下咽癌等疾病失去的声音。大阪大学研究生院信息科学研究科的御堂义博特任副教授（全职）、三浦典之教授，以及该校研究生院医学系研究科的猪原秀典教授组成的研究团队开发出了 “基于AI读唇的日语发声系统Lip2ja”，并将其制成了智能手机的应用程序。该程序使用可通过短时间的发声录音实现个性化语音合成的发声平台 “CoeFont”，使其能够模仿本人的声音发声。研究团队已经在第75届日本气管食道科学会上发表了相关成果。

通过手机相机拍摄说话人的口型合成声音

因喉癌等失去声音的人可以使用替代音声发声，但需要在脖子上佩戴特殊设备，或通过颈部开口发声，对身体负担大，且声音与本人原来的声音相去甚远。

通过摄像头拍摄口部视频来推测发声内容的机器读唇软件，在母音数量较多（约24个）的英语中已实现高精度应用。然而，在母音只有5个的日语中，如 “ka” 和 “a” 的口部形状上几乎相同，因此被认为难以实现读唇。

2009年，神奈川工科大学信息学部的宫崎刚助教等人提出了 “口型代码”。并发现了日语发声时口部形状变化中，不仅仅是发声字符的母音，还要考虑到前后文字关系的规律性，并成功将这一关系编码为口型代码。口型代码有16种，比日语的5个母音更详细地将口部形状与发声字符关联到一起。

研究小组将根据口部视频推测口型代码的AI以及根据推测得到的口型代码转换为日语文字的AI组合到了一起，开发出了两段式AI读唇应用程序。通过将自然语言处理AI应用于高精度推测的口型代码，成功地将普通日本人无法辨识的口型代码翻译成了自然的日语。

此外，通过利用记录简短语音来合成个性化声音发声平台 “CoeFont”，还实现了用本人的声音 “读出” 内容的功能。

可能会因手术等失去声音的患者可以事先录入自己的声音，这样手术后便可仅通过口部动作重现失去的声音。这种声音再现不仅对患者本人，还可帮助与其共同生活的家人提高生活质量。

CoeFont公司向研究小组无偿提供了该软件，使其成功开发出此次的系统。

御堂副教授表示：“此次大阪大学的医工合作研发的系统，通过语音实现无障碍沟通，即使不幸无法自然发声，也能以尽可能接近发声状态进行交流。当回忆起与家人朋友的往事时，伴随着图像唤起生动的声音的情景并不罕见。我们成功开发出了技术方面存在困难的日语读唇发声系统，希望该系统不仅能提升日常生活质量，还能为珍贵的记忆添上声音的色彩。在2024年5月举行的第125届日本耳鼻咽喉科头颈部外科学会总会及学术讲演会的专题讨论会上，CoeFont的AI声音的高品质给我留下了深刻印象。该公司快速支持了我们的研究，大幅改进了通过读唇实现用本人声音发声的系统。”

原文：《科学新闻》
翻译：JST客观日本编辑部

http://mp.weixin.qq.com/s?__biz=MzIxNzU1MTc2NA==&mid=2247528600&idx=4&sn=064c485d1c5c1b839cbf05b010ddf137

客觀日本

《客观日本》公众号由日本国立研究开发法人科学技术振兴机构（JST）运营，重点介绍日本的科学技术创新信息

最新文章

福井大学开发出无需水或溶剂，只使用CO₂超临界流体为布料脱色的新型回收法

微软在东京开设日本首个研究基地

日本农研机构和宫崎大学发现：感染共生细菌的雌虫比未感染雌虫具有繁殖优势，为使用“天敌昆虫”的害虫防治策略提供新见解

日央行行长强调加息的必要性担忧通胀加速

独家：日本政府将在COP29介绍去碳化先进事例

丰田等20家企业与爱知县签署实现氢氨社会合作协议

产学合作拓展微藻类潜力，实现国产生物基航空燃料的生产

JAMSTEC着手开发微生物腐蚀诊断技术，为每年6.6万亿日元损失做出对策

日本学术会议公开关于第7期基本计划的建言草案，优先对应传染病、气候变化和超少子老龄化等社会课题

广州车展开幕日系车商欲凭EV扭转劣势

日本为从太空把握温室气体情况将发射新卫星

详讯：日本三季度实际GDP年率增长0.9%

筑波大、东大和理研发现神经元突触连接强度可控制睡眠的质与量

东京大学成功直接观察到燃料电池固体电解质内部的空间电荷层，为提升电池材料性能提供新的结构控制指针

熊本知事会晤经产相望帮助招揽台积电第三工厂

详讯：原子能规制委正式决定敦贺2号机组审查不合格

日本环境省拟利用野生驯化站繁殖对马山猫

福岛一核燃料碎片已从运输容器中取出

QS亚洲大学排名：日本无缘前20，北京大学居榜首

阿尔茨海默病第二款新药日本定价获批

日本政府将讨论制定数据利用相关规则

日本东北大学、东京大学等提出量子力学多体系预测的统一数值指标，明确量子计算机要实现的目标

英伟达CEO在日演讲强调AI将辅助预测未来

京都大学癌症免疫疗法新设施宣告落成

东京大学发现：真姬菇在视频中显得更富有感情

日本政府拟加大对稀有金属供给源多元化支援力度

2050年日本47个都道府县中27个将会是“一人户” 超40%

埼玉大与水产技术研发现，有害赤潮浮游生物通过释放活性氧来维持光合作用是造成严重灾害的原因

日本与澳大利亚签署气象卫星图像合作备忘录

日企ispace推迟再次发射登月舱的计划

中方最快明年年初在福岛一核厂区内采样

东京大学发现将易碎陶瓷组合后的无破损可变形现象，为开发强韧陶瓷材料提供新方向

NII为CiNii Research增加自动翻译功能，推出以日文论文为主体的学术信息检索服务试用版

详讯：日本2024上半年度经常项目顺差创新高

富士吉田市在富士山公路举行自动驾驶巴士试乘会

铠侠计划最晚明年6月在东交所上市

NICT等全球首次实现无需新外部磁场的新型超导磁通量子比特，有望应用于量子计算机的小型化

日本东北大学被认定为首个 “国际卓越大学”

独家：日本政府力争实现新一代地热发电投入实用

日本理研团队成功开发光量子计算机

北九州市利用污水提取磷等原料并制成肥料

广岛大学发现肿瘤标志物对判断肝细胞癌全身药物疗法的疗效有用

详讯：丰田半年财报净利润大减26.4%

日本10月经济形势报告上调5个地区评估

大阪大学利用AI读唇APP根据口型合成声音，为病人再现失去的声音

农研机构开发出日本首款农业专用生成式AI，将在三重县试运行

乐天在东京推出机器人送餐服务

乏燃料过渡性贮藏设施确定国内首次运营

分析：特朗普胜选势必影响日本对外贸易

约220家日企参展中国进博会

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉