AI 耳机这两年,正成为科技行业的热门赛道,相关产品层出不穷。前有 Meta、字节、讯飞等一众大品牌相继入局,后有无数小品牌贴牌厂商前仆后继,当下 AI 耳机市场的繁荣程度堪比此前的“百团大战“。如此火爆的行业现象自然吸引了不少科技爱好者的关注,也让人不禁心生遐想——我们距离《流浪地球》里那样使用翻译耳机直接进行交流的时刻还有多远?最近,罗永浩在聊到时空壶 AI 同传翻译耳机 W4 Pro 时,发出了诸多犀利评价:“未来五到八年,人类就不需要学习语言了。” 为了描述这款耳机的功能,罗永浩甚至直接以电影《流浪地球》中的翻译耳机做类比:“电影中科幻、未来的道具,现实生活中已经做出来了。”除了罗永浩,《流浪地球》的导演郭帆也曾在节目中介绍过时空壶翻译耳机的使用和体验,力证“翻译耳机“这一巧思绝非空穴来风的想象。而在体验完这款 AI 翻译耳机后,罗永浩强势预言:“距离人类什么语言都不用学,也就是十年、八年的事”,“同声传译这项工作也将因为 AI 翻译技术的进步,五到十年后将被淘汰”。这不是老狐乱说,而是罗永浩的原话。当然,罗永浩作为科技圈的弄潮儿,也是新东方教育的前英语教师,他的评价还是具有一定的参考性的。就拿电影《流浪地球》中的翻译耳机来说吧,这个耳机在电影中戏份不少,吴京饰演的刘培强一出场,随即就有耳机特写画面,给观众交代未来是如何跨语言沟通的。它的翻译形式与 W4 Pro 一样,都采用即时翻译。这很合理,要论沟通效率,即时翻译的效率势必比如今大多数翻译设备的“回合式”翻译——说完一段再等着翻译设备翻译——要高多了。在电影中,刘培强跟太空站的队友沟通基本不用等着耳机来翻译,跟普通的对话无异,原声一边说,耳机很快就能输出翻译声。而 W4 Pro 一样,只需戴上耳机,跟对方交流时,由耳机输出翻译后的声音,也不会干扰对方。就连 W4 Pro 的形态也跟电影里的耳机形态十分接近,当然,老狐说的是时间背景 2044 年的《流浪地球 2》中的翻译耳机,也就是 20 年后的设定。这也不难理解,比起回合式翻译,同传翻译的沟通效率更高,这也是为何高端的外交或商务场合,要请人工同传翻译的原因。要是 20 年后翻译设备还是回合式翻译,那么科幻电影就太不科幻了。现实中,聘请人工同传翻译也面临翻译难度高、价格贵的难题。优秀的同传翻译,一个小时的价格就到了大几千,而且因为难度还高,翻译员一边记下发言人说了什么,一边还要考虑怎样翻译才能“信达雅”,对人的体力和注意力是双重考验,时间一长需要多人轮换。普通人真干不了这活,大脑多任务高速运转,能把自己的“CPU”干烧了,所以,不管是电影还是 W4 Pro,采用耳机即时翻译的逻辑要更合理。在电影《流浪地球 2》中,还展现了机器即时翻译的另一大特长——多语言环境。在沙溢饰演的“师父”驾驶飞机战斗时,需要与说英语的塔台沟通,跟说俄语、韩语的队员沟通,这正是机器翻译的又一大特点,可同时实现多语言环境的翻译。毕竟一个人掌握两三门外语已经非常优秀,可是想要掌握联合国官方 6 种语言,再加上日语、韩语、印尼语、意大利语、德语……能同时掌握这么多种语言的,只能是语言天才。在今年的英雄联盟世界赛舞台上,就出现了多语言翻译效率低的一幕,在法国比赛场馆,中国队员接受采访,现场主持人需要先将问题用法语表达给观众,再用英语与翻译沟通,翻译再将问题转化为中文向队员提问,而队员回答后,再次需要完成中英法的转换。其实翻译已经非常出色,掌握了英、韩、日三门外语,但架不住比赛场馆设在德国、西班牙、甚至未来会去到巴西、墨西哥等地。而机器翻译就能解决这个问题,电影中的耳机能翻译多少种语言咱也不知道,但现在的时空壶 W4 Pro 翻译耳机,能翻译 40 种语言、96 种口音,这是人工翻译无论如何也比不了的。也许正因为如此,《流浪地球》中把翻译工具设定成耳机,挂在耳朵上实现即时翻译,还能完成多语种翻译,这总比时刻有一位翻译人员跟着要现实,也更符合未来的科技感。从《流浪地球》中翻译耳机的使用场景来看,W4 Pro 已经实现了即时翻译和多语言沟通的功能,所以老罗说时空壶 W4 Pro 把科幻电影变成现实,其实也没有毛病。不过,我们也要理性客观看到现实和科幻电影的差距,科幻电影是理想设定,而现实还有许多技术限制要考虑进去。首先是耳机形态方面,在电影《流浪地球》中,耳机只有耳机本体,不需要额外的设备,而在现实生活中,W4 Pro 还无法独立使用,需要借助手机 App。这其中有许多技术原因,试想一下,耳机能独立完成翻译任务,势必需要增强耳机的芯片性能,再增加电池容量,如果联网,还需要有射频芯片和天线等元件……这重量耳朵真撑不住。在未来,随着技术进步,老狐认为独立的翻译耳机一定会出现,但目前,借助手机 App 还是更现实的方案。不过有 App 存在,也带来了诸多新的功能,App 能记录下翻译的文本内容,适合用户在事后查看记录,而在演讲这种场合,App 还能总结翻译的内容,生成概览。
如果遇到长篇大论、昏昏欲睡的演讲,那么这个 App 就相当有帮助了。其次,在电影中,翻译耳机延迟较低,但现实中看,即便是目前体验最好的 W4 Pro,也仍然无法达到电影的效果,翻译延迟方面会有一句话的落后,而响应速度则在 0.2 秒左右。这当然与各种语言语法句式有关,比如常见的状语后置、定语从句后置等语法情形,都会影响机器翻译的速度,这也是为何人工同声传译会落后原声。延迟问题给 W4 Pro 的使用场景带来了限制,在对话沟通、听演讲、听播客等场景,翻译耳机能带来有效帮助,可切换到英语电影、YouTube 视频时,因为声音落后画面,体验则相对弱一点。这不是 W4 Pro 单个设备的问题,而是目前技术下翻译设备的通病,随着 AI 技术的发展,尤其是 AI 训练数据的增加,机器翻译水平提高后,则有希望解决这类问题。而一旦像 W4 Pro 这类随身翻译设备通过 AI 技术再次提升翻译水平,也许像罗永浩所说的,同传翻译失业,在可预见的未来将会成真,到那时,人人都能享受到跨语言无障碍沟通的便利。在这一方面,时空壶无疑是走在前面,时空壶成立于 2016 年,在跨语言沟通方面深耕了 8 年,近年来不断推出实时翻译耳机,是实时翻译行业的领头羊。在之前,时空壶把市场重心放在了海外,所以国内消费者可能没怎么听过,在翻译耳机这一品类,时空壶做到亚马逊畅销榜第一,技术早已得到海外消费者的认可。据老狐了解,时空壶如今在技术研发上的投入超过营收的 25%,这数据有多牛呢?作为对比,华为今年 1-9 月的研发占比是 21.75%,苹果上个财年的研发占比为 8%。比如老狐年初曾介绍过时空壶的旗舰产品 X1,这款翻译耳机支持最多 20 人 5 种语言同时在线翻译,这一项技术我查了一下别家的翻译旗舰产品,到目前为止,依旧还没有能做到的。可以这么理解,时空壶是最早死磕实时翻译技术的,在被众多竞争对手模仿后,时空壶秀出来的多人多语言在线技术,依然遥遥领先,这可能就是深耕翻译技术多年的底气吧。像时空壶这样死磕翻译技术,追求技术创新的厂家,还可以再多来几家。正是因为他们,让老狐觉得,像《流浪地球》中那样跨语言沟通毫无障碍,有一天真的会到来。参考资料:交个朋友直播间、时空壶编辑:饿羊羊