ChatGPT人工智能翻译的隐忧与纾解

教育   2024-11-20 12:42   美国  

译匠的产品和服务清单汇总(持续更新),欢迎关注,阅读原文获取更多内容。 

本文来源:《中国翻译》2024.2


摘要: 以ChatGPT为代表的大语言处理模型技术受到自然语言处理领域狂热追捧,对人工智能翻译也产生巨大影响。在积极接纳和应用技术的同时,如何识别并纾解ChatGPT翻译带来的隐忧,是亟需审慎思考的问题。本文以ChatGPT的工具价值为切入点,以形而下的具体表征解析ChatGPT翻译特点,从形而上的技术哲学视角探索其隐忧,并提出“数字共生”理念,聚焦译者主体、语言客体和翻译伦理提供纾解路径,以期为大语言模型时代人机关系哲学反思与人工智能翻译优化发展提供思路。

关键词: ChatGPT; 人工智能翻译; 人工译者; 隐忧; 纾解


作者简介: 

王贇,博士,太原学院外语系讲师。研究方向:翻译技术、典籍翻译、语料库翻译学;
张政,博士,北京师范大学外国语言文学学院教授、博士生导师。研究方向:机器翻译、典籍翻译、语料库翻译学。


美国人工智能研究实验室Open AI于2022年11月30日发布ChatGPT (Generative Pre-trained Transformer,聊天生成型预训练变换模型),能够模拟人类的语言行为,与用户进行自然交互,成为人工智能历史上里程碑式的产品。ChatGPT作为AIGC(AI Generated Content,人工智能自动生成内容)产品应用框架中大型语言模型(Large Language Models,LLMs)的重要板块,凭借超强的文本生成能力、学习能力及友好的交互性引发全网热议和关注(王华树、刘世界,2023:47)。ChatGPT创始人山姆·阿尔特曼(Sam Altman)认为GPT是人类迄今最伟大的技术,必将重塑人类对社会的认知,但也认识到大模型被滥用的风险(Ordonez et al., 2023)。在这场言必谈Chat GPT的全球狂欢中,一些人工智能科学家态度审慎,约书亚·本希奥(Yoshua Bengio)和埃隆·马斯克(Elon Musk)等1000多位专家担心其可能对社会和人类构成巨大风险,于2023年3月发布联名公开信(Pause Giant AI Experiments:An Open Letter),呼吁所有人工智能实验室暂停训练比GPT-4更强大的人工智能,这场技术竞赛的隐患像黑匣子一样难以预测。同样,以ChatGPT为代表的大语言模型技术必然对人工智能翻译带来深远影响,单一视角的乐观歌颂并不可取。下文将分析ChatGPT的工具价值,揭示人工智能翻译的隐忧及纾解路径,提供不同维度的审视与反思,以期促进翻译行业健康发展。

一、ChatGPT人工智能翻译的工具价值

人工智能(artificial intelligence)是研究和开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的新兴技术科学(胡加圣、戚亚娟,2023:3),其概念由“人工智能之父”约翰·麦卡锡(John Mc Carthy)于1956年首次提出。时至Chat GPT开放公众测试,实现了完全自主的“人工智能内容生成”(AIGC),包括文本生成、代码生成、视频生成、文本问答、图像生成、论文写作、影视创作、科学实验设计等(冯志伟等,2023:23)。当ChatGPT应用于翻译,成为比传统机器翻译引擎具有更多个性化互动功能的辅助工具,在效率和精度方面优势明显,但世人对其工具价值认知存在一定偏差。
《周易·系辞上》言“形而上者谓之道,形而下者谓之器”(杨天才,2016:362),为从技术哲学视角解读ChatGPT工具价值提供依据。“器”的变化会对“道”产生冲击和影响,而“道”对“器”的嬗变始终起着主导性作用(李崇华、张政,2023:29)。在ChatGPT掀起的这场声势浩大的智能翻译神话中,市场、社会和译者三方面可能发生的变化不容小觑:1)翻译服务企业认可Chat GPT低投入和高效率特征,可能将原本需要人工译者完成的项目转移为人工智能翻译+译后编辑,以“效率换质量”为工作原则,完成产品交付;2)社会大众对人工智能翻译工具迷信盲从,对人工翻译的认可度降低,忽视优秀译员的稀缺价值;3)译者自我职业身份认同也将减弱,想象力与创造性受到压制,主体价值式微,人文精神被弱化。这些变化会在强人工智能生态环境中,由ChatGPT翻译的交互性、准确性和竞争性特征而造成。

(一)交互性
ChatGPT强大的互动能力标志着信息社会进入了划时代的人机交互期(胡加圣、戚亚娟,2023:3)。用户可以自如与ChatGPT对话,得到连续的、稳定的、一致的回答(冯志伟等,2023:23)。ChatGPT采用分布式架构、分块计算、GPU(graphics processing unit)并行计算能力提升、常见结果缓存、优化算法等方法,能够快速响应用户询问,增加一定时间内的话轮次数(张震宇、洪化清,2023:38),有助于强化学习增加人机协商的机会,其交互性特征优于传统机器翻译引擎。

ChatGPT在对话生成方面拥有更好的表达能力和一定的上下文理解能力,对于翻译效果的提升有较大帮助,也可根据用户指令提示(prompt)对译文进一步进行语法修正和润色。ChatGPT还可以记忆过往的交互内容,并接受人工反馈以强化学习,较好地学习人类的偏好和习惯,并提供更恰当的答案(沈威,2023)。可见,在翻译任务交互模式中,ChatGPT基于人工指令驱动,以有限的数据和创造性,为人工翻译提供辅助,形成主导与从属的互动关系。

(二)准确性
ChatGPT翻译准确性与大数据语言模型预训练优势相关。Holmes认为大数据指大量结构化和非结构化数据,包括电子邮件、互联网网站和社交网站等生成的所有网络数据(2017:6)。“大数据”不单指以电子方式生成和存储的大量数据,还包括规模庞大、复杂度高的数据集,只有借助一定的算法技术才能从中提取有用信息(黄立波,2022:6-7)。ChatGPT使用的大型语言模型是一种基于Transformer架构的深度学习模型,在大规模无监督(unsupervised)语料上进行预训练,然后通过微调(fine-tuning)实现特定任务,在多个数据集上进行训练,可以识别、生成、理解自然语言,是自然语言处理领域的重要技术,对文本生成、自动翻译、情感分析、问答系统等任务产生巨大影响(焦建利、陈婷,2023:12)。研究人员发现语言模型的缩放定律(scaling laws)和“涌现能力”(emergent ability),当语言模型规模按指数增长时,其性能呈现线性增长,大型语言模型性能迅速提升并形成“涌现”(Kaplan et al.,2020;Wei et al.,2022),随算法和算力的升级,翻译的准确性有望大幅提升。
ChatGPT基于大规模通用语料进行训练具有先天优势,但无法提供与特定领域相关的专业知识,当翻译任务中使用ChatGPT进行术语提取和背景知识检索时,可能出现知识偏差,影响译文的准确性。自然语言极为复杂,提高自然语言处理水平,让计算机真正理解自然语言,仍是极为困难的任务(冯志伟、张灯柯,2022)。从翻译应用来看,ChatGPT并不是全知全能的高于人类智慧的神奇产品,大众经历狂热想象到冷静祛魅的过程,将形成较为客观的认知。

(三)竞争性
进入人工智能时代后,特别是ChatGPT发布后,人与技术的平衡被打破,语言智能系统的外语写作和翻译能力已经超越了一般的学习者(秦颖,2023:24),给翻译活动带来了冲击和影响,译者的焦虑及与现实世界的撕裂感增加。人工智能机器翻译表面上是获得人类译者能力的“师夷长技”竞争者,但本质是人工译者提升效率的实用性工具,是人工译者与翻译技术实现“数字共生”的必经阶段。若过分强调ChatGPT的工具价值,就必然会忽略其“道”的功用。“器”往往处于显化层面,大众常将翻译过程中的人机工作量占比变化,看作人工译者和ChatGPT之间的对立,甚至会把各尽所长、优势互补的人机组合模式差异,武断看作ChatGPT对人工译者劳动价值的颠覆和僭越。

面对人工智能翻译“器用”至上的倾向,器与人之间存在一定竞争关系,但这种关系并非全然是破坏性的,或以“消灭”人工译者为代价的,一定程度上对人工译者提出了更高的要求。高端的机器翻译可以帮助人们获取信息,进行沟通和交流,还可加入自然语言处理的管道式系统,或参与多模态的机器翻译(冯志伟、张灯柯,2022:86)。从长远来看,ChatGPT人工智能翻译所形成的竞争性特征,对于译者翻译能力提升与技术素养培育也大有裨益。

二、ChatGPT人工智能翻译之隐忧

“道器相依”的理念,结合抽象与具体、形上和形下的哲学思维方式,为认识ChatGPT的工具价值定位提供依据,也为进一步纾解人工智能翻译的隐忧提供方略。ChatGPT固然可辅助译者提升翻译效率,但如大规模滥用,甚至误用智能技术,可能会对译者主体、语言客体和翻译伦理产生负面影响。

(一)译者主体意识弱化
人工译者的批判精神在ChatGPT互动模式中被削弱,主体意识遭到侵蚀,译者的主观能动性减退。马丁·海德格尔(Martin Heidegger)提出技术时代的“最高的危险”不是对人不利的技术后果,而是人和存在的自身性的损坏、扭曲和丧失(绍伊博尔德,1993:180)。语言是人类大脑最底层结构,也是人类区别于其它生物的基本能力,翻译本身是一种创造性活动,是人的理性思维(观察、比较、分析、综合、抽象与概括等)和非理性思维(情感、直觉、幻觉、下意识、灵感等)相结合的体现(王贇、张政,2022:112)。人的翻译能力很大程度上依赖于双语转换能力,需要在大量针对性的训练中习得,而智能翻译“能力”的底层逻辑是基于人类提供的数据按预训练提取的规则生成内容。

对ChatGPT译文进行“译后编辑”,译者被迫长期处理质量参差的机器译文,译者自身价值也被扭曲或贬损。当人被限定在技术生产的界限内,就失去了多样性本质,进入单一意义的世界,成为“单向度的人”(Marcuse,1964:148-149)。在工具的操控下,人类丧失了否定、批判和超越的能力,以其思维和行为模式不情愿也不可能理解正在发生的事情,形成不受既定理性影响的错误意识(王贇、张政,2022:111)。译者如一直处在依赖于他者提供翻译的惰性状态,其语言能力、语言审美和敏感性都可能受到损害。

(二)自然语言受到污染
ChatGPT人工智能翻译可以减轻人工译者劳动负荷,但是机械化译文将损害人类自然语言,进而危害读者思维模式。背景性的语言系统(即语法)不仅是表达思想的一种再现工具,而且是思想的塑造者(张政、王贇,2018:102)。语言是人类的高级智能活动,不仅涉及语言内部的结构,还涉及语言外部的日常生活、科学技术、历史、社会、文化背景等多种知识,以及人的情感愿望和心理状态等丰富多彩的因素(冯志伟等,2023:24)。ChatGPT最新版本采用GPT-4模型,仍然是黑盒模型(black box),存在幻觉(hallucination)和推理错误,详见如下译例。

例1原文:The dawn found him crying in the street.

Chat GPT释义:The sentence suggests that someone was found in a vulnerable state, possibly experiencing emotional distress or physical pain, in the early hours of the morning. The reason for their crying is unknown, but it could be due to a variety of factors such as personal troubles, a traumatic event, or physical injury.

译文1:黎明发现他在街上哭泣。
译文2:当黎明发现他在街头痛哭流涕时,仿佛整个城市都被他的悲伤笼罩。

本句较贴切的译文是:黎明时分,他在街上哭泣(本文作者译)。ChatGPT翻译可能出现两类问题:1)原义识解偏差。The dawn(黎明)虽是英文原句主语,但逻辑上是时间状语,译为“黎明发现”让人误解“黎明”是人名。原文英语释义将the dawn理解为时间状语in the early hours of the morning,意义识解本是正确的,却在翻译时出现错误,可能前后指令之间并无衔接,作为单独语言生成任务分别执行。2)表达过度发挥。输入译文润色指令,使其修辞更生动,ChatGPT生成“仿佛整个城市都被他的悲伤笼罩”,此类夸张表达并非原句中信息,大幅度调整有悖于忠实原则。文中人物设定不一定是在城市生活,哭泣也不一定因为悲伤,crying还有可能是大喊大叫,短短一句话不足以支持这么多扩展信息,对读者的误导显而易见。

例2原文:The spirit is willing and the flesh is weak.

译文1:精神愿意,肉体虚弱。
译文2:心志愿,肉体弱。
译文3:心志愿,肉体薄。
译文4:心有余而力不足。

同一个句子经ChatGPT多次翻译,译文1、2、3不符合汉语表达习惯,令人费解,仅译文4较为地道。如果读者不懂英文,让其在4种译文中取舍反而平添困扰。人工智能翻译对于语境和文体风格的解码识别能力有限,如进行篇幅较长的文字翻译,更难保持上下风格统一。虽然ChatGPT在创作或回答问题时生成的文本内容(如诗歌、小说、新闻、对话等)很像人类的风格,也使得ChatGPT在创造性上优于以往的文本生成模型(沈威,2023),但整体而言,ChatGPT对于风格的把握较弱,并没有带来根本性的改变,更新版本的语言模型依然无法满足读者对不同艺术风格译文的需求(叶子南,2023:178)。

如果佶屈聱牙的机制译文大量充斥于人类自然语言,将造成不可逆转的语言污染,导致使用者语言审美能力的降低(王贇、张政,2022:113)。人工智能翻译句子时不依靠语境也能完成所谓的“交流”任务,跟随原文的结构走,也能给出个大致可以看懂的句子,但是这样处理的结果是文章的灵气荡然无存(叶子南,2023:177)。法国生物学家让-巴蒂斯特·拉马克(Jean-Baptiste Lamarck)很早就提出“用进废退”的观点,生物在新环境的直接影响下,某些经常使用的器官发达增大,不经常使用的器官会削弱或衰退(1963:113),译者语言灵感和审美能力也在长期消磨中丧失殆尽。随着人工智能技术的发展,译者很可能会陷入浅层思考、碎片化学习和“信息茧房”(桑斯坦,2008)的困境中,使其视野受限、问题解决能力受阻,高阶思维能力也会被抑制。更有甚者,如这些低精度译文重新流入ChatGPT训练数据集,再经由使用者调用输出,成为人类语言的污染源,长期循环往复将形成巨大威胁。

(三)翻译伦理遭遇冲击
ChatGPT引起的职业伦理问题常被漠视。2023年3月8日,著名语言学家、哲学家诺姆·乔姆斯基(Noam Chomsky)与语言学教授伊恩·罗伯茨(Ian Roberts)、科技公司人工智能主管杰弗里·瓦图穆尔(Jeffrey Watmull)联合发文“ChatGPT带来的虚假美景”(The False Promise of Chat GPT)(1),指出现阶段人工智能在学习语言、生成解释、道德判断等方面和人类有着较大差别,并警告如ChatGPT式机器学习程序继续主导人工智能领域,人类的科学水平以及道德标准都可能降低(Chomsky等,2023)。ChatGPT对译文的意识形态把控仍有赖于人工译者实现,稍有疏忽就可能会导致智力、文化和意识形态等方面的偏差。如用户自行生成译文,但缺乏相关常识或疏于查证,很可能会依据误导性信息制定策略或采取行动,不可避免会造成损失。

在一切皆可量化的数字化时代,以算计性思考(calculative thinking)的方式易于形成将功利、效率放在第一位的思维定式。从“人工译者”vs“机器翻译”到“人工译者”vs ChatGPT,争论本质问题没有变,只是随人工智能发展而导致竞争性更强。行业对“低资金投入+质量参差”的译文接受度更高,对“高资金投入+高质量译文”的价值产生怀疑。ChatGPT翻译引发的关注甚嚣尘上,但翻译质量测评等专业观点呼声甚微,可能导致在职优秀译员转行,准备进入行业的潜力人才可能因职业前景渺茫而流失,长此以往,翻译行业很难形成良性生态。

在教育和学术领域,为了防止学术欺诈和剽窃,巴黎政治学院、香港大学等高校宣布禁止在教学活动中使用ChatGPT等A I工具,多家学术期刊也发表声明不接受将ChatGPT列为论文“合著者”(史爱武,2 0 2 3)。翻译专业学生若尝试借助ChatGPT完成作业,将语言模型生成的翻译当作课程作业,致使教师给出不符合实际水平的成绩,会破坏翻译评价的公正,不仅对学生自己的翻译水平提高无益,还会对后续教学内容安排、教学方式与方法调整等产生误导。

从中国古典技术哲学来看,冶炼、水利、农业就已广泛运用各项技术,如庄子在《天地篇》中曾就机械使用及后果表达其观点。机巧之事生机巧之心,破坏纯白品质,以致心神不定,离道远矣。

三、ChatGPT翻译隐忧之纾解

面对越来越强大的智能技术,重新认识译者能力、语言质量和翻译伦理都迫在眉睫。我国古代“道”“器”辩证论既奠定了“工具理性”(实用主义)与“价值理性”(人文主义)的思想根基,也为纾解ChatGPT翻译隐忧提供指导。译者在使用人工智能翻译的过程中将自己作为技术系统的一部分融入到技术体系中,技术系统又同时将人技术化,人已经由生物意义上的人逐步转化为技术上的人(王贇、张政,2022:113)。人工译者应审慎使用ChatGPT,在“器”的层面拥有扎实稳固的翻译技术素养,在“道”的层面应勤于思考,提升视野,强化跨文化意识与能力,提升人机合作意识,成为“数字共生型”译者。

(一)调整交互翻译模式,增强译者主体性
使用生成式预训练模型的ChatGPT具有优异的交互性能,但其从大规模语言数据中获取的基本都是基于自然语言数据的参数,还没有与精神、物理和社会历史等外部世界联系的参数(冯志伟等,2023:24)。因此,翻译行业人员不可过分依赖ChatGPT,不应将其视为替代人工译者的最佳途径,甚至唯一选择。

海德格尔认为人类应当让技术回到为人服务、让人回到自己“此在”中去,回到“此在”本身是摆脱技术异化的根本(张天勇,2015:66)。在翻译过程中,人工智能系统根据译员已经译出的部分自动预测待翻译内容,并动态生成后续译文以供参考,交互过程一直持续到翻译任务完成。译员或接受系统提供的译文,或进行修改或提出新的译法,每一次输入都会被系统作为反馈进行深度“学习”并实时做出调整和更新,不仅可以提高翻译质量,也能避免译员因重复纠正同类机翻错误而受挫(王均松等,2023:16)。面对复杂的符号文本语境,译者要充分调用自己的语言知识、文化修养与思维能动性,进行多层次、多向度的阐释,还需确定文体风格、遴选翻译策略、组织译文语言,积极调动自身素养完成一系列复杂工作(李崇华、张政,2023:30)。文化差异是理解与传达意义的重要影响因子,涉及文化因素的翻译尤其体现了译者的主体性抉择(张政、刘晗,2020)。ChatGPT翻译更需要译者围绕原文的语言逻辑和社会文化语境,将翻译主体的意识反映于译作中,凸显译者的主体性创造价值。

(二)重视生成内容审核,提升译文准确度
译者需审慎地对待ChatGPT智能生成的语言,在交流中保持质疑态度,运用多种手段验证重要内容。ChatGPT是在大规模数据基础上对人类的语言行为进行模仿,并未真正理解聊天内容(冯志伟等,2023:23)。ChatGPT大型语言模型可能会产生似是而非的答案,而不准确的信息可能会导致译员理解偏差,形成不良翻译习惯。因此,在使用ChatGPT进行翻译时,要坚持核对、检查、验证。尤其是涉及非法或者政治敏感的话题时,ChatGPT可能会误判执行(焦建利、陈婷,2023:15),译者同时还必须提升信息素养,确保其生成的译文正确、合理、逻辑连贯。ChatGPT无法准确评估原文和译文在语言和文化方面的差异,故无法替代人类翻译员的角色(胡壮麟,2023:12)。

ChatGPT翻译质量的提升需从开发和使用两方面入手,开发者收集大量有效的数据,建立用户数据模型,在保护隐私的前提下优化算法,使已有应用更加个性化,并与用户需求匹配。而人工译者可通过强化ChatGPT对用户个性化需求的理解,使大型语言模型生成的内容更加准确、全面和多样化。如Open AI公司声明在Plus版中引入自定义指令,允许用户添加希望获得回复的偏好或要求,以便根据需求定制ChatGPT(Open AI,2023)(2)。随着基于深度学习的自适应技术的发展,调用GPT技术模型的交互式翻译工具以实现“数字共生”的翻译模式将成为可能。

(三)培养人机共生意识,规范行业翻译伦理
从翻译伦理视角来看,译者对于机器的态度,关乎人机关系的价值定位。在人工智能升级过程中,人和机器的关系沿“实现工具——合作者——伙伴——相互依存”的模式发生转变(秦颖,2023:25),更加符合人机共生的数字化生存模式。以ChatGPT为代表的人工智能工具以便捷、可解释的语言内容为人类提供友好服务,译员培养人机共生意识,落实协同发展,才能充分利用智能工具提升翻译生产力。

翻译伦理需要国家、机构和译员多方维护。AI时代需要具有前瞻性的政策法规,明确技术的应用范围、使用规范和安全措施等。同时建立监管机制,委派专业机构对相关企业进行审查监管。译员可使用ChatGPT无法实现的增加前言、注释、评论、附录等“丰厚翻译”(Thick Translation)策略,把译者的声音带入描述中,充分体现其文化立场(李红霞、张政,2015:37)。人工译者必须敏锐甄别,对译文的意识形态严格把控,以免ChatGPT被用于制造乌有信息、虚假新闻、舆论操纵等,甚至危害社会稳定和国家形象。

四、结语

在AI技术浪潮的冲击中,ChatGPT可视作支持性工具,而不是完全取代传统翻译方法的颠覆性器具。大型语言模型优势在于对真实互动情境的模拟,为译者提供更具主动性的使用体验,更好地提升翻译质量。如果使用者缺乏批判和自控能力,过度依赖甚至被ChatGPT反噬,对译者本体、语言客体和翻译伦理都有百害无一利。翻译从业者需要明确专业价值所在,重视“器”的实用价值,深谙“道”的形上功能,推进人工智能辅助翻译实践中“道”与“器”互动融合,以“数字共生”为核心理念营造人机交互、内容可信、监控有序的人工智能翻译新生态。


原文来源:王贇,张政.ChatGPT人工智能翻译的隐忧与纾解[J].中国翻译,2024,45(02):95-102.

译匠
深耕各专业行业的外语和翻译
 最新文章