语言是人类文明的基石,是民族团结的粘合剂,也是矛盾冲突中的排头兵。
12月26日下午,在安徽合肥举行的2024年中国力量年度人物颁奖盛典上,作为获奖者之一的蔡磊通过视频短片发声。说话已十分困难的蔡磊仍然坚信,渐冻症终将被战胜。
渐冻症的症状之一是“延髓麻痹”,即“舌肌常先受累,表现为舌肌萎缩、束颤和伸舌无力。随后出现腭、咽、喉、咀嚼肌萎缩无力,致患者说话构音不清、吞咽困难、喝水呛咳、咀嚼无力”,这就影响到了语言能力。
在最近的2024年中国力量年度人物颁奖盛典(12月26日下午,安徽合肥)上,蔡磊作为获奖者在现场通过视频短片公开发声。短片中,蔡磊身着咖色西装外套,面色不错,但说话已经比较困难,说的内容也难以听清,需要有人翻译。为了说一句完整的话,他要费很大力气,每讲几个字还会被呛咳打断,但他仍然努力讲清楚每一个字。
也许AI可以帮助蔡磊先生,至少在说话能力上。近来、脑机接口(BCI)技术通过植入微型电极读取大脑信号,将瘫痪患者的思维转化为语言。该技术帮助肌萎缩侧索硬化症(ALS)患者恢复沟通能力,提高生活质量,并有望在未来5到10年内推广应用。
几年前,凯西·哈雷尔(Casey Harrell)被诊断出患有一种严重的脑部疾病,即肌萎缩侧索硬化症(amyotrophic lateral sclerosis,简称ALS)。这种疾病让他全身瘫痪并失去语言能力。然而,在去年,一名医生在哈雷尔的大脑语言中枢植入了微型电极。这些电极能够捕捉脑电波并通过计算机转化为文字。如今,这位46岁的男子可以再次与人交谈。
科学家利用哈雷尔发病前的语音录音,训练了一种人工智能模型。借助这一技术,他如今通过电子语音合成器“说话”,而且合成的声音与他以前的自然声音相似。
“患这种病的人常常会感到孤独和抑郁,”哈雷尔通过新技术说道。他解释,这些患者会觉得自己不再有价值。但有了这项技术,他和其他患者可能重新参与社会生活。
了解“读心术”背后的技术
加州大学戴维斯健康中心(University of California, Davis Health)的神经外科医生大卫·布兰德曼(David Brandman)指出,这项新技术是目前最精确的语言解码技术。他于2023年8月在《新英格兰医学杂志》(New England Journal of Medicine)上发表了相关研究成果。
布兰德曼强调,这项技术并非真正的“读心术”。它无法读取使用者的私人想法,只能在使用者有意尝试说话时才起作用。
“目前,美国有成千上万的人想说话却无法开口,”布兰德曼说。“他们被困在自己的身体里。”有朝一日,这项技术可能帮助许多人找回自己的声音。
技术的核心原理
大脑中的电信号沿神经元传递,控制人体的各种动作。每次挥手、跑步或微笑,大脑的不同区域都会被激活。这些信号通过神经通路传递,刺激所需的肌肉。
但外伤或疾病可能会损坏这些神经通路,导致信号无法传递到控制动作或语言的肌肉。
布兰德曼与神经科学家谢尔盖·斯塔维斯基(Sergey Stavisky)共同运营着一个神经假体实验室。他们的团队自2021年以来一直致力于通过脑机接口(brain-computer interfaces,简称BCI)恢复语言能力。
BCI通过植入设备读取大脑信号,并使用计算机解读信号的含义,进而将其转化为机器动作。例如,用户可以通过意念控制机械手臂。
这一研究属于一个长期项目“脑门”(BrainGate)的一部分,主要测试植入装置的安全性及其对改善患者生活的效果。
哈雷尔决定参与研究。
从这枚便士可以看出植入患者大脑的微电极阵列(左)的大小。其尖角方形阵列直径约为 3 毫米。
将脑信号转化为语言
2023年7月,布兰德曼将四个微型设备植入哈雷尔大脑中的语言控制区域。这些设备共有64根金属针,可以检测神经元传递的电信号。
术后,研究人员来到哈雷尔家中,启动了BCI系统。经过几分钟的学习,这套系统开始解码哈雷尔试图说话时的大脑信号,将其转化为文字。
凯西-哈雷尔的大脑模型以橙色显示大卫-布兰德曼通过手术植入微电极阵列的位置。
当人类说话时,大脑会将每个单词分解成一系列的小声音单元,称为音素(phoneme)。例如,“moose”包含三个音素:“m”、“oo”和“ss”。每个音素在大脑中产生独特的电信号,犹如指纹。数学算法帮助系统将这些信号转化为相应的单词,再通过计算机屏幕显示或扬声器“说出”。
第二天,哈雷尔首次借助系统与自己的小女儿对话。这是她记忆中第一次听到父亲说话。
这张图片映射了神经元发出的脑电波。这些脑电波与大脑中的电信号相对应。图中显示了凯西-哈雷尔在思考 "报纸 "和 "快递 "这两个词时,脑电波的差异。
在使用新系统前,哈雷尔需要借助一名受过训练的解读员来表达想法,但每分钟只能传递约6个单词。相比之下,普通人每分钟能说120到150个单词。而现在,他可以用技术流畅地表达自己的想法、需求和幽默感,甚至每天使用系统与家人、朋友和同事交谈长达12小时。
不是第一套脑语音系统
布兰德曼和斯塔维斯基团队的技术并非第一个脑语音系统。但他们的设备首次实现了用户在家全天候自主使用,无需技术人员现场协助。
之前的类似设备通常有一半的针脚数量,解码准确率为四分之三左右。由于每四个单词中会有一个解码错误,交流效率较低。布兰德曼团队的改进包括增加针脚数量和优化解码算法,使得设备能更精准地“听到”神经信号。
经过32周的测试,这项技术的准确率达到约97%,即每50个单词中只有一个错误,且表现仍在提升。
尽管BCI技术仍在发展,但它为瘫痪患者提供了希望。例如,人们或许能够通过意念控制轮椅,甚至检测情绪或压力。布兰德曼预计,类似哈雷尔使用的BCI系统或将在未来5到10年内实现广泛应用,为更多患者带来福音。
作者丨Jennifer Junghans
时间丨December 18, 2024 at 6:30 am
来源丨
https://www.snexplores.org/article/brain-computer-implant-voice-ai
翻译丨双子座
编辑丨扬薇儿
往期文章
付费文章