王春辉：自然人、机器人、数字人“三人”共生时代的语言生活

学术 2024-11-22 18:39 吉林

2024年第3期

专题研究一

数字时代的语言生活

作者简介

王春辉

首都师范大学教授、语言治理研究融智协同创新中心研究员，主要研究方向为语言治理与国家治理、语言国际教育与传播、汉语句法语义等

自然人、机器人、数字人“三人”共生时代的语言生活

王春辉

（首都师范大学　语言治理研究中心　北京　100089）

提要 地球似乎正在加速进入一个自然人、机器人、数字人“三人”共生的新时代。总体上呈现出数字化、智能化、自动化的新形态和新特征，相应地，语言生活也正发生着广泛而深刻的变化。在语言运用方面，产生了“自然人‒数字人”“数字人‒数字人”“机器人‒数字人”“自然人‒机器人‒数字人”这4种新形态；在语言学习方面，“三人”各自的语言学习与机器人和数字人助力自然人学习遥相呼应；在语言研究方面，新数据、新方法、新思想星火萌发，语言资源学、数字语言学等新兴交叉方向似乎正在加速成形。未来的语言研究，需要把握时代发展趋势，依托整体性视角和系统性思维，为国家和社会发展提供更多更好的助力。

关键词 机器人；数字人；语言生活；人工智能；语言治理

一、引言

1950年，两位思想者相继发出了关于技术与人类关系的新思考。在6月的一次演讲中，海德格尔说道：“对人类的威胁不只来自可能有致命作用的机械和装置。真正的威胁已经在人类的本质处触动了人类。”（马丁·海德格尔2005：28）10月，图灵（Turing 1950：442）在《计算机器与智能》一文中说道：“然而，我认为本世纪末，由于词汇用法会有较大的变化，总体的文化思想也会改变，届时当我们谈到机器会思考时将不会再被反驳。”^[1]70多年后的今天，正如两位思想者所料，到底什么是“人”，到底哪个是“我”，现实与虚拟、真实与虚假的界限在哪里，对于类似的基本问题，人类的观念和认知正在悄然演变。

2017年10月26日，在沙特阿拉伯首都利雅得举行的“未来投资倡议”大会上，“女性”机器人索菲娅被授予沙特公民身份。她也由此成为地球历史上首个获得公民身份的机器人。^[2]2023年8月9日，中国国内首个数字人存证备案的完整案例在中国数字人知识产权存证保护平台存证完成，开启了中国数字人存证备案、合规运营的先河。^[3]20世纪以来，尤其是近50年以来，在经历了从互联网到物联网的变迁、机器人的人类化（包括外形和思维）、人工智能的起伏（从寒冬走向春天）、赛博格的崛起、ChatGPT^[4]和Sora的横空出世以及脑机接口的突破等历史性发展之后，诞生了45亿年的地球似乎正在从“人机共生”时代^[5]加速进入一个自然人、机器人、数字人“三人”共生的新时代^[6]。这个时代或许将是一个人类文明、机器文明和数字文明融合而成的地球新文明。^[7]

对于这样一个时代，国内外不同学者从不同视角进行了研究。^[8]国内如李宇明（2023a，2023b）在多篇文章和多次演讲中都从“人机共生”时代的视角来解析当代的语言生活；戴曼纯（2022，2024）专门考察了数字时代背景下欧洲的语言技术和语言保护的发展，并对数字时代的语言生活进行了深入剖析；刘海涛、郑国锋（2021），冯志伟、张灯柯（2024），袁毓林（2024），胡范铸、胡亦名（2024）等聚焦人工智能飞跃背景下的语言学理论、学科发展和知识生产等问题；文秋芳、梁茂成（2024）分析了人机互动协商能力的5个要素，并以外语教育为例提出了提升这一能力的课程设置；王春辉（2022a）分析了数字时代语言伦理的新形态和新表现；饶高琦等（2023）从语言资源的视角讨论了大规模语言模型治理的话题；杨旭、罗仁地（2024）汇集了来自语言学各个领域的专家专门讨论了ChatGPT这一现象；刘星、王春辉（2023），肖俊敏、王春辉（2023）分别探讨了社交机器人辅助语言学习的情况和虚拟现实技术在语言教育中的应用。国际方面施普林格出版公司从2012年开始在“白皮书系列”丛书中出版“欧洲数字社会中的语言”丛书，报告了每种欧洲语言在语言技术方面的状况，并阐述了最紧迫的风险和机遇，计划将涵盖所有欧洲官方语言；^[9]Dejica et al.（2016）从数字人文、语言与翻译、语言教学等几个大的方面呈现了数字时代与语言相关的诸方面的内容；Makalela & White（2021）挑战了非洲数字交际有限且相对不成熟的观点，针对数字交际对非洲土著语言产生破坏性影响的假设提出了质疑，并提供了几种基于横向和用户的多语言制的语言政策和规划模型；Soria et al.（2023）通过11个案例研究，批判性地反思数字化在西班牙语世界不同领域和超级多元化背景下的有用性和局限性，从不同的理论和方法论角度阐释了数字化转型，以此让人们更好地理解语言和数字化之间复杂的相互作用；Rehm & Way（2023）全面收集了欧洲语言平等（ELE）项目的成果、战略议程和路线图，并就到2030年欧洲如何实现数字语言平等向欧盟提出了相关建议；Kessler（2024）总结了数字多模态写作和第二语言写作交叉点的最新研究。

上述研究以及其他更多的研究从不同角度向人们展示了我们这个时代语言生活的方方面面。对于我们所处的这个时代，已有研究有的称为“数字时代”，有的称为“人机共生时代”，有的称为“智能时代”，但似乎都未能较好地呈现出一个较为完整的图景，即文章一开头所提到的“三人”共生时代。本文尝试在前人基础上，来对“三人”共生进行界定并呈现其基本特征，然后以点带面有选择地呈现人类语言生活的几个方面，以此提请人们注意我们所处的时代宏观，并为当下和未来的语言治理提供参考。

[1]　英国作家塞缪尔·巴特勒在1863年的一封信中也发出过类似感慨：“谁是人类的继承者？回答是：我们正在创造我们自己的继承者。在将来的某一天，人类与机器的关系就如同现今动物与人的关系。结论就是，机器具有或将具有生命。”转引自雷·库兹韦尔（2019：123）。

[2]　参见新华网官网：http://www.xinhuanet.com//world/2017-10/27/c_1121867076.htm。

[3]　参见中国数字人知识产权存证保护平台官网：https://www.szr360.com/exhibition?titleNum=3&id=16。

[4]　2024年5月14日凌晨，OpenAI推出了GPT-4o，进一步改写了大模型交互的定义，它可以实时对音频、视觉和文本进行推理，语音响应时间缩短至232毫秒，与人类的反应速度接近；在语音对话中，GPT-4o的节奏、语气甚至接梗，几乎都与真人无异。

[5]　参见朗伯·鲁亚克斯，瑞尼·凡·伊斯特（2017）；马克·沃伦威尔德（2018）；爱德华·阿什福德·李（2022）。

[6]　李宇明（2023a）指出：“‘人‒机‒机‒人’交际成为交际常态时，人在生活、生产的诸多领域都需要与机器进行语言合作，人类进入‘人机共生’时代。”本文在此基础上又加入了“数字人”这一主体。

[7]　自从史蒂夫·尼科尔斯（Steve Nicholls）于1988年发表《后人类宣言》之后，后人类和后人类世的研究越来越多了。

[8]　鉴于文献众多，在此仅从国内和国际视角各举几例。

[9]　参见：https://www.springer.com/series/10412。

二、“三人”界定与共生特征

有必要先对本文所说的“三人”进行界定，并对“三人”共生时代的特征予以简单勾勒。

•

✦

（一）“三人”界定

✦

•

自然人（又称“生物人/碳基人类”）仍然是传统定义中生物学意义上的人类，具有生物学特征和心理特征。这是大众所熟知的普通人类个体，拥有感知、思维、情感和社交等方面的能力，其行为和决策受到生物学、社会学等多方面因素的影响。

机器人，是人工制造的机械设备，能够执行特定任务，通常是通过程序来控制其行为。机器人可以具有各种形态和功能，从简单的工业机器人到复杂的人形机器人，都属于这一范畴。机器人通常是由人类设计、制造和控制的，其行为是通过程序或者遵循预设规则来实现的。

数字人（又称“虚拟人/虚拟数字人”）^[10]是虚拟存在的人格化数字实体，通常是通过计算机技术模拟出来的。数字人可以是虚拟世界中的虚拟角色，也可以是通过人工智能技术赋予了某种程度的智能和自主性的程序实体。数字人可以拥有自己的思维、情感和行为，但其存在是基于计算机系统和算法，不同于自然人的生物基础。

三者之间的关键区别见表1。

需要注意的是，上述“三人”的典型特征虽然还算清晰，但在边缘部分也呈现出一定的模糊性和连续统性。比如赛博格^[11]就是自然人与机器人的部分合体，而Neuralink公司领衔的脑机接口技术则使自然人与数字人有了合体的可能。

[10]　有些学者对“虚拟人‒数字人‒虚拟数字人”进行了区分，比如Cui & Liu（2023）等，但鉴于目前的区分主要是技术上的而非社会功能上的，而且这种区分并不影响本文的讨论，所以本文用“数字人”来统称。目前对于“数字人”的界定各不相同，可以参看Burden & Savin-Baden（2019）。

[11]　赛博格（Cyborg，“控制论”和“有机体”的合成词），也称为“赛博有机体”“赛博有机存在”“控制论增强有机体”，指那些由生物学和电子技术相结合的生物体，它们可能包含有机和无机部分，并且可能具有机械、电子或数字组件。该术语由曼弗雷德·克莱因斯（Manfred Clynes）和内森·克莱恩（Nathan S. Kline）于1960年创造。相关研究可以参看Kaswan et al.（2024），Forlano & Glabau（2024）等。

•

✦

（二）“三人”共生时代的特征

✦

•

在“三人”共生的时代，人类生活呈现出一些新现象、新形态和新特征，与本文密切相关的可以归结为以下3点。

1.人‒机‒数融合智能及其交互。随着人工智能的跃进，自然人与机器人、数字人之间将发生智能的更广泛和更深入的融合，也会出现更为复杂的交互。包括语音识别、语音合成、自然语言处理、赛博格、脑机接口等技术的应用，使人们能够更自然地与机器或数字进行沟通。智能助手如Apple的Siri、Amazon的Alexa、谷歌助手、智能假肢和植入式技术等就是典型的例子。

2.万物数字化和虚拟存在性。教育、培训、商业、娱乐等各个领域都经历着数字化浪潮，除了自然人的实体存在外，数字人在虚拟空间中拥有自己的身份和存在，^[12]数字艺术品和虚拟现实艺术展览应运而生，虚拟现实和增强现实技术创造了新的体验形态，政府及其组织越来越依赖数字技术来进行治理和与公民互动。

3.数据共享和隐私挑战。“三人”共生的时代带来了大量的数据交流和共享，但也伴随着隐私安全和伦理的挑战。数字人对个人数据的收集和处理、社交媒体平台上的个人信息分享等，都可能会引发隐私、伦理、安全、个人身份和责任等问题。^[13]

总体来看，“三人”共生时代呈现出数字化、智能化、自动化的新形态和新特征，给社会、经济和个人生活产生带来了巨大的变化，并且必将产生更加深远的影响。

[12]　比如最近的“AI复活”热潮，可参看澎湃新闻：https://www.thepaper.cn/newsDetail_forward_26799816。

[13]　语言方面的问题可参看王春辉（2022a，2022b），饶高琦等（2023）。

三、语言生活三方面举隅

语言生活是运用、学习和研究语言文字、语言知识和语言技术的各种活动。语言生活包括运用、学习和研究3个维度，其中的“语言”，包括语言文字、语言知识和语言技术3个方面。三维度与三方面，纵横构成了语言生活的9个范畴：语言运用、语言知识的运用、语言技术的运用、语言学习、语言知识的学习、语言技术的学习、语言研究、语言知识的研究、语言技术的研究（李宇明2016）。限于篇幅，本节将集中从语言运用、语言学习和语言研究3个视角来以点带面地做一点初步思考。

•

✦

（一）“三人”各自的语言生活

✦

•

目前显然还处于“三人”共生时代的最初期阶段，因此“三人”语言生活在上述九大范畴之内还有着各自的典型特征。

自然人会继续使用传统的自然语言（如中文、英文等），但在“三人”时代他们也逐渐融入了新的数字化工具和平台。社交媒体、在线沟通工具等数字化平台成为自然人交流的重要场所，语言表达在虚拟空间中变得更加多样和即时。自然人的语言生活在数字时代中更加全球化，跨越地理和文化边界也更加便捷。

机器人使用编程语言和人工智能算法进行交流和执行任务。它们的语言交流主要围绕任务和功能展开，可以用于生产、服务、教育等领域，以实现特定的工作目标。在数字时代，机器人的语言能力不仅限于理解简单的指令，还可以逐渐理解和生成更自然、更智能的语言。

数字人是虚拟存在的个体，可能是数字助手、虚拟角色或人工智能程序的表现。它们的存在主要基于数字化的信息和算法。与自然人和机器人不同，数字人可能具有虚拟的身份，使用虚构的语言。它们可以在虚拟世界中与用户互动。数字人的语言生活可能更加灵活，可以根据用户需求和虚拟环境进行调整。

在这个“三人”共生的世界中，语言生活变得更加多元化和复杂化，涌现出新的语言形式和交流方式。自然人、机器人和数字人之间的交互推动着语言的演变，同时也呈现出“三人”时代独特的语言景观。

•

✦

（二）“三人”交互的语言生活

✦

•

1.语言运用方面

在机器人出现之前，地球上语言运用方面的生活基本上就是“人‒人”语言生活；机器人出现之后，才产生了“人‒机”和“机‒机”语言生活；数字人出现之后，又进一步出现了“人‒数”“机‒数”“数‒数”“人‒机‒数”这4类语言生活新形态，从而构成了一个七星矩阵。这一历史发展脉络正如图1所示。^[14]

限于篇幅，本节选择“人‒机”“人‒数”两类稍加论述。

（1）自然人与机器人的交互

人机交际（Human-Robot Communication，HRC）本来就是人机互动（Human-Robot Interaction，HRI）的核心问题之一，随着协作机器人、辅助机器人和伴侣机器人等各类社交机器人的出现和发展，这一领域的重要性进一步得到提升。在人们当前的日常生活中，参与人机交际的机器人正在呈指数级增长，用于公共场所（如酒店、商场、机场、医院等）、教育、援助、商业、呼叫中心和个人护理的社交机器人，用于生产工厂的协作机器人，还有智能玩具和自动驾驶汽车等，都需要机器人与自然人的有效沟通互动。

人机交际最近的实践主要集中于试图提高机器人参与情境和基础对话的能力（Janssens 2024）。这既涉及工业用机器人，也涉及社会用机器人。^[15]在工业用机器人层面，人机交际与人际交流类似，存在多种输入通道，如凝视、手势、自然语言界面、语音命令和面部表情等。在典型工业任务的不同场景下，有限的语音命令、指向和抓取手势以及使用骨骼和手跟踪的一些身体姿势往往是人机交流的常用方式。它们的特点是通过使用有限的手势来简化命令，使用有限的语音命令描述工作场景等（Mukherjee et al. 2022）。再如语言引导的视觉机器人，抓取任务侧重于使机器人能够基于人类语言指令抓取物体，但是现实世界中的人机协作任务往往会遇到语言指令不明确等情况，如在对语言问询的理解和语言信息中关键概念的辨别等方面存在的障碍（Wang et al. 2024）。

各种类型社交机器人的社会应用场景则是越来越广泛。支持早期语言发展以及第二语言习得的机器人辅导员的开发，为利用数字技术进行语言辅导以及与一般儿童机器人互动提供了创新的方法（Vulchanova et al. 2017）。大量研究证实了用社交辅助机器人来服务不同用户群体的好处和潜力，包括有心理健康问题的个人、患有自闭症谱系障碍的儿童、老年人以及中小学生等，而凭借更实惠的机器人硬件，它有可能降低限制获得个性化治疗、陪伴和教育的社会经济障碍（Shi et al. 2024）。在聋哑人和非聋哑人同时出现在公共场所的情况下，机器人同时使用手语和自然语言进行交流显然是必要的。所以双语机器人的框架也就应运而生，它表现出用口语表达信息的能力，并辅以表达性手势等非语言提示，同时通过手语传达信息，初步展示了机器人将自然语言表达与同步手势和手语无缝融合的能力，凸显了其在不同环境中彻底改变沟通动态的潜力（Hei et al. 2024）。而对于越来越火热的人形机器人来说，在可预见的未来，人类的交流以及与人形机器人的互动可能会变得越来越类似于自然人际交流（Pajaziti et al. 2021）。多模态人机交际则正在成为未来理论和实践的新热点，涉及手势识别、语音识别和情感识别等信息输入和输出的多个维度（Su et al. 2023）。

人际交际既涉及书面语言指令式交际，也涉及口语交际，而后者显然更加困难甚至更为重要。随着机器人技术的迅速发展，越来越需要更有效的口语人机交互，以充分发挥机器人助力社会发展的巨大潜力，但目前人类提供口语交互能力的水平仍然非常有限。针对此问题，Marge et al.（2022）等提出了25条建议，涉及8个主题：将人类需求放在首位，更好地对语言的社交和交互方面进行建模，提高处理错误和应急运行的能力，创建快速适应的新方法，更好地将语音和语言与其他交流方式相结合，使语音和语言成分更好地达及机器人当前知识和状态的丰富表征，使所有组件实时运行，改善研究基础设施和资源。优先考虑这些主题的研究和开发，或将为创建具有更好语音功能的机器人奠定较好的基础。

人类的语言交流是与非语言一起进行的。为了实现最基本的自然交际，对于人形机器人来说就需要至少一些类似嘴唇运动的特征来伴随语音生成。除了口型同步之外，还涉及点头、指示手势、目光移动等其他非语言交际形式。涉及的问题比如口型同步动作是否应该从音素级信息生成，指示手势的含义，点头或摇头的适切性，机器人的眼睛如何设计以最大限度地提高凝视阅读的适用性等（Mavridis 2015）。正是由于非语言交流在社交互动中发挥着重要作用，所以准确探索机器人的非语言行为如何影响人类也非常重要。机器人的非言语交际可以从运动、空间关系、触觉和时间等视角切入，而且其对自然人的影响至少会涉及改变认知框架、引发情绪反应、触发特定的行为反应和提高任务绩效等方面（Saunderson 2019）。此外，由于交际包括交际主体之间作为显式、隐式和非自愿交互刺激的信号传输，所以机器人物理方面的一些因素也会影响人际交际的效果，例如机器人的形状、尺寸、皮肤材料和重量等（Bonarini 2020）。

虽然取得了很大进步，但构建一个能够与人自然交流并在各种交互场景中合成可理解的多模态运动的机器人还是相当具有挑战性。尽管当下已经超越了20世纪90年代的仅预设命令、预设响应的状态，但人际交际似乎距离流畅和自然的目标还很远。基础语义的组合，在线意义的协商，情感交互和闭环情感对话，混合语音和运动的规划，通过众包在线游戏等大量获取人机交际的数据驱动模型，实时利用在线信息和服务以增强人机交际，在这些方面的研究需要格外重视和提升（Mavridis 2015）。正如Shkurti（2023）所说：“人机交际仍然是一个非常年轻的跨学科领域，涵盖了心理学、设计、计算机科学和工程学等多学科，存在着许多令人兴奋的可能性和开放的研究问题。最重要的是，随着机器人技术以越来越快的速度变得越来越普遍，这个领域在不久的将来将具有影响人类体验的巨大潜力。至关重要的是，这些技术的进步必须与人类与其交互的简单方式同步进行。”在未来几十年里，交互式机器人很可能成为我们日常生活的一部分，与我们无缝和谐共生，帮助我们创造一个更美好、更令人期待的未来。

（2）自然人与数字人的交互

向Web3.0的过渡标志着互联网发展的一个里程碑，将其从主要为静态的二维平台转变成交互式的三维空间。这个互联网新时代的特点是注重去中心化，人工智能和虚拟现实为用户提供更加身临其境和个性化的体验。在此背景下，数字人成为关键人物，充当起了用户和定义Web3.0先进技术之间的桥梁。

技术的进步促进了数字人在各种场景中的应用，例如娱乐、游戏、广告、工程、医疗保健、文旅、零售、教育和军事等。数字人具备从结构上改变这些行业的潜力，例如在娱乐领域它们可以充当虚拟偶像，举办音乐会和吸引全球观众举办在线活动；在广告中它们可以充当品牌代言人，以更能引起消费者共鸣的方式进行个性化沟通；在教育和健康领域它们可以充当导师或虚拟助理，以互动且易于访问的方式提供信息和支持。就数字人产业来说，从各种行业分析师报告中可以看到，到2032年全球数字人的市场规模/份额将达到400～5000亿美元。而市场的扩张主要是由数字人在不同领域的日益融合所推动，包括游戏、虚拟现实、增强现实、社交媒体和电子商务等。^[16]

有越来越多的公司可以使用数字人技术来帮助客户模拟从冲突解决到谈判、销售、领导力和管理培训等各种情况。比如它们可以建构一些初始场景包括推销电话模拟，以帮助销售员工获得与客户交谈的经验，允许经理练习员工绩效评估，以及缓和工作场所的情绪状况。^[17]Machine Learning Reply公司开发的数字人MARGO-T是一款能够通过自然语言和视频与人类互动的虚拟助手。基于谷歌的对话和合成引擎以及Transformer模型提供的生成人工智能的创造力，使得无论说话人使用什么语言，MARGO-T都能理解，并能根据说话人兴趣说明不同的用例，或者讨论更一般的主题。^[18]根据德勤公司的说法，数字人可能是组织交际（organizational communication）的下一个阶段，即基于组织的数字人与观察交际的自然人可以共享信息。数字人通过利用人类的想象力、肢体语言和语音提示，可以使交际技术的使用人性化，同时易于访问，而且可以达到每周7天、每天24小时可用。^[19]在工业和商业领域，采矿、安全、工程和远程劳动力管理等行业企业已经广泛使用数字人，以改善安全措施并简化入职流程。^[20]

会说话，对于数字人来说十分重要。Park & Catrambone（2021）的研究表明，数字人的面部表情和声音对自然人和它们的交际都会产生促进作用；而与仅有语音或仅有面部表情相比，在语音同步面部外观的情况下，数字人似乎会引发更强的社交促进作用。为了使数字人有效地进行交流，它们需要具有理解和生成人类语音的能力。语音合成技术将文本转换为逼真的语音，而语音识别使数字人能够理解并响应口语。这些技术能确保与数字人的对话听起来更加自然和亲切。

将虚拟数字人融入自然人社会带来了重大的伦理和技术挑战。真实性、隐私和数据安全成为最重要的问题，尤其是当这些化身变得与真人越来越难以区分时。此外，管理人类和数字化身之间的互动需要仔细考虑，以避免误解并确保积极的互动。

[14]　当“三人”以简称形式列举时，以“人”指代自然人、“机”指代机器人、“数”指代数字人。

[15]　虽然人机交际领域似乎两极分化为社会机器人和工业机器人，但某些场景可能会合并需求，并且必须使用情感计算、机器学习、机器人控制策略和工业工程的完整库来解决这一跨学科挑战。

[16]　参见：https://medium.com/antaeus-ar/the-world-of-digital-humans-where-ai-meets-realism-5e4955b8261c.

[17]　参见：https://www.talespin.com/blog-post/becoming-better-humans-using-virtual-human-technology-for-interpersonal-skill-development。

[18]　参见Machine Learning Reply公司官网：https://www.reply.com/en/artificial-intelligence/the-digital-humans-revolution。

[19]　参见：https://www2.deloitte.com/content/dam/Deloitte/uk/Documents/consultancy/deloitte-uk-future-of-sales-and-service-deloitte-2022.pdf。

[20]　参见：https://www.guildhawk.com/blog/how-global-businesses-use-multilingual-digital-humans。

2．语言学习方面

在语言学习方面，“三人”的互动大致可以分为机器人的语言学习、数字人的语言学习，以及机器人和数字人助力自然人类的语言学习3个方面。

（1）机器人的语言学习大致可以分为自然语言和人工语言两种。就自然语言来说，机器人可以通过自然语言处理（NLP）、机器学习算法、深度学习、符号人工智能、交互式学习等技术和方法，来不同程度地理解、解释和生成人类语言。为了使用人类语言，机器人必须通过机器人的传感器和执行器将单词映射到物理世界的各个方面。该问题与其他自然语言处理领域不同，因为需要将语言置于噪声感知和物理动作的基础上（Tellex et al. 2020）。目前的机器人语言学习还处于初级阶段，正如乔马丁（Chaumartin）所说：“聊天机器人非常接近通过图灵测试，但到目前为止，它们只是人类创造的最好的随机鹦鹉。”^[21]而且还存在着伦理方面的风险，但人工智能和机器人技术的不断进步正在不断提高机器人的语言学习能力，使它们能够在各种环境下与人类更有效地互动。比如计算语言学领域的新进展，即开始通过通信系统的出现来训练机器人理解人类语言（Kouwenhoven et al. 2022）。

（2）数字人的语言学习。数字人的语言学习跟机器人有些类似，也需要语音合成、文本到语音合成、自然语言处理等技术。美国南加州大学的创新技术研究所自2000年起开展了一项虚拟人类项目，其中的自然语言小组从一开始就致力于为虚拟人类提供对话功能。这项工作的很大一部分涉及集成的虚拟人类，具有具体的对话、情感、计划和任务推理、知识表示和感知。为了支持这项研究，他们也致力于对自然语言对话基础、自然语言组件的其他架构和语料库创建进行分类。^[22]

（3）机器人和数字人助力自然人的语言学习，历史已经较为悠久，研究也非常多。比如van den Berghe et al.（2019）的综述指出，机器人辅助语言学习（RALL）领域正在迅速发展，已有研究从不同类型机器人和不同方法的视角，以及针对不同语言、年龄组和语言系统的各方面的视角，都有相关研究的切入。文章概述了RALL研究迄今为止所获得的结果，讨论了当前使用社交机器人进行第一和第二语言学习的可能性和局限性，并讨论了33项教授词汇、阅读技巧、口语技巧、语法和手语的研究。除了对RALL情境中学习收益的深入了解之外，这些研究还提出了有关学生动机和机器人在学习情境中的社交行为等更普遍的问题。文章在最后提出在语言教育中使用社交机器人的未来研究方向。刘星、王春辉（2023）的综述也指出，进入21世纪以来，用于语言教学的机器人开始应用于各个年龄段的语言学习中，越来越多的理论与应用研究开始涌现。全球教师短缺现状、个性化学习趋势、语言学习理论发展，以及新冠疫情带来的远程学习浪潮等，多因素合力推动了这一领域的快速兴起。目前，用于辅助语言学习的社交机器人有不同的职能和角色，可根据硬件和软件属性对其分类。当前的研究主要涉及3个领域：机器人对语言技能的影响，机器人对学习者的影响，学习者对机器人的感知与态度。

3．语言研究方面

正如文章开头所述，“三人”共生时代给语言研究带来了许多新机遇和新挑战。在机遇方面，数字化使得语言数据更加丰富和易于获取，从而为语言学研究提供了更多的数据资源，机器学习算法可以利用这些数据进行语言模式识别、语言规律探索等研究，进而推动语言学的发展；促进了语言学与其他学科的跨界合作，如计算机科学、心理学、认知科学等，这种跨学科合作为语言学研究提供了新的视角和方法，促进了语言学与其他学科的交叉融合。在挑战方面，语言数据的获取和使用面临着数据隐私和伦理问题；在使用机器学习算法进行语言研究时，可能会出现算法偏见和歧视问题；数字技术的普及程度不均可能导致数字鸿沟加宽加深，从而影响语言学研究的广度和深度；时代的发展加快了语言变化的速度，包括新词的产生、语言的演变等，这种快速的语言变化可能会对语言学研究提出新的挑战，需要及时调整研究方法和策略。

为了适应语言在数字时代的变化和机遇，一些新兴交叉研究方向开始崭露头角。在国内，北京语言大学于2021年创立了中国首个“语言资源学”学科。它以语言资源为研究对象，系统研究语言资源的类型、构成、分布、质量特征、使用状况及其与语言研究和社会发展之间的关系，依据语言资源学的现有发展实际和未来发展趋势，下设语言资源理论与实践、语言资源应用技术、语言资源管理与伦理3个主要研究方向。^[23]在国际上，一门新兴的学科——数字语言学（Digital Linguistics，简称DLx）正在形成。数字语言学是一门运用数字技术和量化方法来研究语言现象和语言规律的交叉学科。作为一门新兴学科，它涉及语言学的各个分支（如语言教育、语言治理等）以及统计学、计量学、人工智能、数据科学等相关研究领域。与计算语言学专注于使用计算机执行与语言相关的任务不同（如机器翻译或语音识别），数字语言学更加关注语言数据本身，即语言数据的收集、处理、分析、可视化、存储、传播等方面，以及语言数据在数字环境中的表现和变化（Witt 2021）。

数字革命创造了语言使用的新途径和新颖的交流方式，无处不在的技术越来越深入地调节着我们的语言、语言生活和社交互动。技术产生了新的数据流，但也提供了收集和分析数据的新方法，比如语言处理的实验研究、语言变化建模以及更全面的记录濒危语言的方法。新一代语言学家需致力于研究这些问题，并将适合数字时代的方法、工具和技能纳入其科学范式之中。

[21]　参见：https://blog.3ds.com/brands/netvibes/why-is-it-so-hard-to-teach-robots-to-talk/。

[22]　参见：https://nld.ict.usc.edu/group/projects/virtual-humans-natural-language。

[23]　参见：https://yuyanziyuan.blcu.edu.cn/info/1065/2515.htm。

四、结语

近20年前，库兹韦尔在《奇点临近》中预言：“我把奇点的日期设置为极具深刻性和分裂性的转变时间——2045年。非生物智能在这一年将会10亿倍于今天所有人类的智慧。”（雷·库兹韦尔2019：80）如果这一预言也能如他的其他预言那样应验的话，人类离这一奇点的时间也恰好还有20年。历史的巧合，有时比人工的规划更加巧夺天工。

汤姆·惠勒（2022：5）提醒大家注意：“历史告诉我们，尽管人们常常聚焦于新技术本身，但技术带来的次生效应才是真正具有变革性的……一种新技术的历史，通常就是这种新技术艰难地走向成熟、最终让那些因它而利益受损的人也能接纳它的过程。”当下的地球似乎正在经历这个变革性时刻的前夜，“三人”共生时代已来，人们需要注意其技术本身，但是更要关注其次生效应，更要关注其给语言、语言生活和语言治理带来的新问题、新形态和新趋势，关注“三人”之间的共生、共享、共治和共建。

在塔米姆·安萨利（2021：226～249）看来，中华文明跟斯拉夫文明、伊斯兰文明有一个共同点，就是都属于与“进步叙事”相对的“复兴叙事”的文明。而本文最终想强调的是，中华文明也是当下和未来的文明。我们要从历史中汲取经验和给养，更要从当下和未来中寻觅机遇和航向。未来的语言研究，需要把握时代发展趋势，依托整体性视角和系统性思维，为国家和社会发展提供更多更好的助力。

该文发表于《语言战略研究》2024年第3期，参考文献从略，如有需要请参照原文。

编排：逯琳琳

审稿：王飙余桂林

相关推荐

《语言战略研究》入选为CSSCI（2023—2024）来源期刊

《语言战略研究》入编《中文核心期刊要目总览》2023年版语言学类核心期刊

卷首语丨徐杰：语言学理论的嬗变模式与新旧理论之间的关系

主持人语 | 王春辉：语言研究需要新质生产力

《语言战略研究》2024年第3期目录与提要

《语言战略研究》2024年第2期目录与提要

《语言战略研究》2024年第1期目录与提要

约稿启事丨“国际中文教育”专题（每年一期）