失语四年，AI帮他重新“开口”说话

科技 2024-08-24 12:07 英国

大数据文摘授权转载自学术头条

撰文：马雪薇

肌萎缩侧索硬化（ALS），又名渐冻症，是一种神经系统罕见病，被世界卫生组织（WHO）列为与艾滋病、癌症等并列的 5 大绝症之一。

由于“肌无力”，渐冻症患者不仅无法正常完成行走、抓取物品等日常活动，连咀嚼、吞咽也异常困难，最终甚至不能发声讲话，这使得患者的抑郁情绪增加、生活质量下降。

如今，人工智能（AI）在让“失语”患者重新说话方面，取得了新的突破。

在一项新的研究中，由加州大学戴维斯分校健康中心研究团队及其合作者开发的一种由人工智能（AI）驱动的大脑植入物，成功将大脑信号转换为语音，让失语患者重新开口说话，准确率高达 97.5%。

图 | Casey Harrell 与他的妻子。（图源：Ian C. Bates, The New York Times)

相关研究论文以“An Accurate and Rapidly Calibrating Speech Neuroprosthesis”为题，已发表在权威医学期刊《新英格兰医学杂志》（NEJM）上。

在这项研究中，他们对一位 45 岁的渐冻症患者 Casey Harrell 进行了临床试验。在参加试验前，Harrell 四肢瘫痪无力，言语很难理解。试验结果显示：

在系统使用的第一天，经过 30 分钟的尝试说话训练数据后，神经假体达到了 99.6% 的准确率，词汇量为 50 个单词。
第二天，可能输出的词汇量增加到了 125000 个单词，并且在额外 1.4 小时的训练数据后，神经假体达到了 90.2% 的准确率。
随着更多训练数据的积累，神经假体在植入手术后八个月以上保持了 97.5% 的准确率。

此后，Harrell 使用神经假体进行了超过 248 小时的自主节奏对话，经过短暂的训练期后，皮层内语音神经假体达到了恢复自然交流水平的性能。

视频 | Harrell 利用神经假体进行对话。

据《纽约时报》报道，在任何一个时刻，植入物都会捕捉到一群神经元的活跃，将它们的放电模式转化为声音的元音或辅音单位，然后计算机将这些声音串连成一个单词，再将单词串连成句子，选择它们认为最可能对应于 Harrell 试图说的话的输出。

该论文的通讯作者之一、加州大学戴维斯分校助理教授、神经外科医生 David M. Brandman 表示：“这一技术帮助了一位瘫痪的人与朋友、家人和护理者沟通，我们的研究展示了有史以来最准确的语音神经假体设备。”

找回失语患者的声音

参与研究的患者 Harrell 是一位 45 岁的男性，患有 ALS 和四肢瘫痪，伴有严重的构音障碍 (ALSFRS-R = 23)。

在植入阵列之前，研究团队通过解剖 MRI 扫描确定中央沟，并通过功能性 MRI 确认参与者是左半球语言优势。利用人类连接组计划的多模态 MRI 皮层分区，将植入目标精确映射到参与者的脑中。

其次，团队使用四个 64 电极犹他阵列从左侧腹侧前中央回测量皮层神经活动。机器学习技术每 80 毫秒将皮层神经活动解码成一个英语音素。使用一系列语言模型（LM），预测的音素序列被翻译成一系列单词，当参与者尝试说话时，这些单词出现在屏幕上。在句子结束时，一个自声音文本到语音算法将解码的句子发声，旨在模仿参与者在发展 ALS 之前的语音。

图 | 电极位置和语音解码设置。a, 大致微电极阵列位置，由黑色方块表示，叠加在参与者大脑的 3D 重建上。b, 脑到文本语音神经假体的示意图。

神经假体在启动后即可实现高准确率解码，无需大量训练数据。研究结果表明，该神经假体在短期内即可为患有严重言语障碍的 ALS 患者提供自然沟通的能力。

图 | 在线语音解码性能。

图 | 广泛使用神经假体进行准确的自发语音。a, 参与者和语音神经假体在对话模式下的照片。神经假体仅基于神经活动检测到他试图说话，并在 6 秒的语音不活动后结束，或者在他通过眼动追踪选择激活屏幕上的按钮后结束。解码的句子完成后，参与者使用屏幕上的确认按钮来指示解码的句子是否正确。b, 参与者使用语音神经假体与女儿交谈的第二天样本转录。c, 参与者使用语音神经假体与周围人沟通的累积小时数，包括在结构化研究会议期间和个人使用期间。对于由红色轮廓点表示的会议，解码准确度在（d）中量化。d, 评估对话中的语音解码准确度（n = 925 个已知真实标签的句子，来源于（c）中红色标记的会议）。平均单词错误率为3.7%（95%置信区间，3.3%至4.3%）。

此外，研究还发现，腹侧中央前回区域的电极阵列在解码语音方面表现最佳，其次是 55b 区、4 区和背侧中央前回区域的电极阵列。解码错误往往发生在发音相似的音素之间。此外，神经假体还能够泛化到新的单词，并且训练数据中出现的频率越高，对特定单词的解码准确性也越高。神经假体能够解码非发声语音，以及不同说话幅度的语音，包括低声、正常和大声说话。

总而言之，这项研究证明了脑机接口技术在恢复失语症患者沟通能力方面具有巨大潜力。

不足与展望

虽然这项研究取得了显著的成果，但仍然存在一些局限性，需要在未来研究中进一步解决。

首先，该研究仅涉及一位参与者，因此需要更多参与者的研究来评估该系统在不同个体中的性能分布，并确定是否存在个体差异。

其次，该研究的参与者患有 ALS 并伴有严重构音障碍。需要进一步研究来评估该系统是否适用于其他原因导致的构音障碍患者，例如脑干卒中或中风。

而且，该研究仅报告了 8 个月的数据。需要更长时间的数据来评估神经解码的长期稳定性，并确定是否存在信号衰减或其他长期问题。

此外，该系统将脑信号解码为文本，然后使用语音合成器将其转换为语音。然而，目前的语音合成技术无法完全复制人类语音的自然度和丰富性。将脑信号直接转化为语音仍然是一个挑战，需要进一步的研究。

还需要考虑的是，目前使用的设备较大，并且需要连接到外部电脑。需要开发更小、更便携、无线连接的设备，以提高患者的舒适度和便利性。在未来，还可以尝试开发更易于用户和护理伙伴操作的自动化软件，以进一步提高患者的自主性。

黑色小圆动图分割线

租售GPU算力

租：4090/A800/H800/H100

售：现货H100/H800

特别适合企业级应用

扫码了解详情☝

点「在看」的人都变好看了哦！

http://mp.weixin.qq.com/s?__biz=MjM5MTQzNzU2NA==&mid=2651735100&idx=1&sn=83685c34882c72badefe112b8adb2a92

大数据文摘

普及数据思维，传播数据文化

最新文章

贝索斯领投、OpenAI连续跟投，这家机器人公司再融4亿美金

你愿意和AI恋人共度一生吗？

比ChatGPT更牛！苹果新AI模型刷新交互体验！能看懂你的手机屏幕！平板和安卓机也都行

专访"Prompt之神"李继刚 - 我想用20年时间，给世界留一句话。

深夜重磅！ChatGPT可以“AI搜索”了，但并不完美

谷歌被俄罗斯罚款2,500,000,000,000,000,000,000,000,000,000,000,000美元

OpenAI放弃自制AI芯片！伦敦场开发者日Hugging Face工程师现场“拷问”Sam Altman

想用AI特效在万圣节“鬼混”，看这一篇就够了。

AI + 影视，学会「避坑」再「吟诗」丨CNCC 2024

做AI捏捏，享赛博解压。

困扰18亿人的“全球干旱”，被AI更准确预测了

开源一夜崩塌：Linux无理由除名俄罗斯开发者。我们该醒了？

帮老外割草、送餐、保洁，中国服务机器人冲向海外

Character AI被起诉！14岁青少年自杀，AI陪伴何去何从

加强版Claude3.5正式上线，一句话操控电脑的时代真的要来了。

Transformer能否推理引争议，DeepMind连夜更新论文开源数据集：Transformer真的很强

Andrej Karpathy预言AI马太效应：差异只会越来越显著

“AI调解员”登上Science！Google DeepMind打造，“劝架”水平远超人类

台积电股价创历史新高，先进制程比想象中重要？

谷歌计划将 Gemini 并入 Deepmind，下个月开始生效

这个AI插件，想让你体验在浏览器上开挂的感觉。

对统计学“又爱又怕”，到底如何学统计？

科研那些事（万字长文，真诚分享）

创造历史，马斯克成功回收20多层楼高的星舰助推器

从广东看中华文明起源，《穿越磨刀山》以AI技术开拓考古新视野

苹果发文质疑：大语言模型根本无法进行逻辑推理

三星，正在自救

o1诞生对下一轮AI爆发的启示：技术远远没有收敛，仍在演进丨智源Workshop精华观点回顾

马斯克的Cybercab首秀！没有方向盘和踏板，26年量产，特斯拉这次又玩大的了

哈佛大学俩学生开发出一种 AI 眼镜，看你一眼就能扒光所有个人信息

AI 法力无边！物理诺贝尔奖颁给了 HNN 之父和深度学习之父

别笑，你可能也分不清这些视频是不是AI的。

两万字实录：大语言模型、提示学习与未来科技研发的交汇点

破纪录！OpenAI成为史上第一家估值万亿元的AI公司！独家融资协议：“别投对手公司”

是什么，缔造了英伟达神话？

ChatGPT上线全新功能Canvas - 我消灭你，与你无关。

为何马斯克的“盲视”不可能超越肉眼？

当代年轻人，在AI实现婚纱照自由

国庆从你的城市出发，5小时高铁最远能到哪

颠覆认知：大模型不可靠，越大越不可靠？最新研究登上 Nature

科研大佬投稿顶会的经验分享：时间安排、idea灵感、科研习惯

三只羊卢总的录音AI到底能不能做出来？我的答案是：当然能。

2024工博会最新洞察：机器人走向大负载，中国厂商从跟随到并跑

AI击败人类！DeepMind推出AlphaChip，几小时内即可生成“超人”芯片布局

Meta放大招，发布真AR眼镜！但让人“高”攀不起

腾讯 Robotics X 控制负责人郑宇近日离职，已加入优必选

OpenAI CTO深夜离职！Altman再发长文：感谢她做的一切，我将专注于技术和产品

热门视频：人形机器人一拳破次元！远程暴打沙袋和乒乓球

Sam Altman罕见发长文：ASI终将至，准备好迎接“智能时代”吧！深度学习是有效路径

Nature重磅：颠覆AI计算，提升460倍能效，新型分子忆阻器有望为Transformer提速

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉