生成式人工智能影响下的国际传播:实践进展与影响路径

学术   2024-08-08 09:33   北京  

【内容提要】本文从多语言信息搜集与核实、多模态内容创作与翻译、多形式内容分发与消费等三个方面探讨生成式人工智能在国际传播中的应用实践进展;并从新型行动者、新认知模式、新的真实性、新型国家能力等四个方面剖析生成式人工智能对国际传播的影响路径。面对生成式人工智能的发展,国际传播行动者需要拒绝技术迷思或恐慌,以价值理性引导工具理性,推动其促进国家之间的平等交流和相互理解。

【关键词】生成式人工智能 国际传播 大语言模型

以ChatGPT为代表的新一代生成式人工智能(Generative Artificial Intelligence,GenAI),表现出在高质量对话、复杂推理、语境学习、跨任务泛化(包括多语言任务)等方面的强大能力,并呈现出从自然语言交互向多模态交互发展的趋势,由此具有影响国际传播的潜力。本文将首先探讨生成式人工智能在国际传播的多语言信息搜集与核实、多模态内容创作与翻译、多形式内容分发与消费等三个方面的应用实践进展;进而从新型行动者、新认知模式、新的真实性、新型国家能力等四个方面剖析生成式人工智能影响国际传播的主要路径。

一、国际传播中的生成式人工智能应用实践

国际传播是跨越国家或地区边界,在不同地域、政治、社会与文化系统之间沟通交往的过程,因此其所要克服的障碍不仅是地理意义上,更是语言与制度、文化意义上的。生成式人工智能可以凭借其强大的多模态理解力和生成力,为克服国际传播中的语言障碍和文化差异提供帮助。目前,生成式人工智能已经开始参与新闻、播客、影视等各类文化产品的全球生产和国际传播。

(一)多语言信息搜集与核实

首先是多语言的信息搜集与摘要工作。最新信息的获取对于国际媒体和跨国传播主体(如“出海”企业)尤为重要。生成式AI拥有从非结构化数据中提取信息的出色能力,特别是针对多语言、多模态的任务。例如,“数矿”(Dataminr)为“德国之声”“自由欧洲电台”(RFE)等国际媒体和戴森、空客等跨国企业提供全球突发事件预警和事件进展描述。该人工智能平台接入了全球百万个公共数据源以获取150多种语言的文本和多模态的数据;通过大模型运维(LLM Operations,LLMOps)集成多个定制化的基础模型,能生成关于事件进展的实时描述;还可以根据关注的地理区域定制突发事件预警的范围,助力国际新闻的快速报道和跨国企业的业务协调。

另一些媒体更注重对全球多元观点的整合。例如,新闻网站“信号灯”(Semafor)秉持区分事实和观点的报道结构,推出了信号(Signals)模块,由记者确定报道的核心事实,再结合生成式人工智能从全球新闻来源中整理出不同的观点。它通过OpenAI的“GPT构建者”(GPT Builder)创建了名为“多语言洞察搜索优化器”(Multilingual Insight Search Optimizer,MISO)的工具,将搜索引擎必应(Bing)接入ChatGPT,快速检索、筛选以多语言发布的新闻报道并生成内容摘要(目前支持英文、中文、西班牙语)。当输入新闻事件后,如“ 英美打击胡赛”(US and UK strikes on Houthis),MISO首先生成英文提示词(prompt)并在Bing中检索、筛选出4份报道并输出其媒体来源、日期、摘要和链接;然后生成中文和西班牙语提示词并分别输出检索结果,从而辅助增加“信号灯”报道中多国别来源的观点。

不过,这并不意味着MISO完全克服了偏见。在MISO给出的英美打击胡塞事件的检索示例中,我们可以发现,MISO更倾向于给出它更熟悉的媒体来源,在中文检索结果中排列前位的首先是中东媒体半岛电视台和“德国之声”的中文报道,其次才是中国媒体新浪财经和央视。生成式AI输出的结果也将经过记者的二次编辑。在2024年5月2日Semafor的7条“信号”报道中,引用了41个来源,只有4个来自英美以外的国家。

生成式人工智能也可以辅助多语言的信息核实工作。大模型驱动的生成式AI大都有较强的多语言任务完成能力,可以对不同语言的新闻来源可信度进行评级,使其成为新闻记者处理国际新闻或多语言信息的重要辅助工具。研究显示,GPT3.5对新闻来源的可信度评级与专业机构的评级有一定的相关性,在英语、法语、德语任务中的表现较好,完成意大利语任务的表现则较差。通过GPT3.5评估7500多个新闻来源大约需要两个小时,成本仅约为3美元,是新闻机构和记者能负担且易协作的助手。

(二)多模态内容创作与翻译

在国际市场中,扎根于本土文化的作品可能较难被其他国家或文化体系中的受众认可,产生文化折扣。因此需要积极推动不同国家间的文化背景阐释与交流。其中,历史、神话、信仰等成为了国际传播中的重要话题——它们构成了不同国家的文化符号和集体认同,是文化背景阐释的重要部分;由于其神秘与陌生感,也能够引发异国受众的好奇,甚至促成异国创作者的自发生产与传播。生成式人工智能在大规模语料的学习中涌现的创造力,大大提高了文化背景信息的可获得性和相关产品的生产效率。在优兔、TikTok等国际视频平台上已经出现以各民族的历史知识或神话故事为核心内容的人工智能生成内容( AI Generated Content, AIGC)频道。它们使用AI生成神话和历史图片、视频,推动了不同国家受众对异国文化的了解。例如,使用视频生成AI“跑道”(Runway)为各国历史故事生成视频的“历史精要”(History In a Nutshell),使用“达利3”(DALL-E-3)为非洲传说配图的“奇的非洲故事”(African Tales by Chi),使用“中道”(Midjourney)速览各国文化的“玩转AI”(Fun with A.I)等。其中,“Fun with A.I”围绕近百个国家的历史风貌和文化背景,在各种主题下进行图片生成与对比。

我国媒体也在积极展开基于生成式AI的传统文化国际传播实践。中央广播电视总台密集推出多部生成式AI作品,并由中国国际电视台(CGTN)发布英文版作品,其中包括中国首部文生视频AI系列动画片《千秋诗颂》(Poems of Timeless Acclaim)、首部AI译制的微纪录片《来龙去脉》(On the Trail of the Chinese Dragon)、首部AI全流程微短剧《中国神话》(Chinese Mythology)等。这些作品分别围绕文学经典、历史故事、图腾信仰、神话传说等,借助AIGC拓展人们的想象,同时展现故事背后的民族精神。不过,这些AI全流程视频目前还处于探索阶段,需要在“提示工程”和后期制作中付出不少人力。

语言障碍也是造成国际传播中文化折扣现象的主要原因。因此,对内容进行本地化翻译是国际传播的重要环节。研究显示,GPT4等大语言模型(Large Language Model, LLM)驱动的生成式AI,在完成高资源语言(如英语、中文、西班牙语)的文本翻译方面,已经能与传统的神经网络机器翻译(Neural Machine Translation,NMT,如谷歌翻译、DeepL)媲美;但在低资源语言的翻译中仍然落后。也有研究提出,基于LLM的语境学习能力,通过优化提示(解释翻译任务、提供上下文等),能提升LLM的翻译效果。除了最基础的文本翻译,生成式人工智能还提供了跨模态的翻译和转换功能。如Meta推出的“天缝翻译”(SeamlessM4T)支持文本和语音间的跨模态翻译,在输入一段语音后,模型能够即时输出目标语言的文本(反之亦然)。

同时,生成式AI也提供了在多个模态中对翻译进行优化的功能,包括语音克隆、视觉配音等,以减少短视频、影视剧等文化作品因翻译带来的生硬感。在语音克隆方面,包括十一实验室(ElevenLabs)、纸杯(Papercup)、深度配音(Deepdub)、语音重塑(Respeecher)等初创公司,开放声音(OpenVoice)、GPT-SoVITS等开源项目,都推出了语音克隆功能,可以提取声音特征,学习原有音色(或适配音色类似的AI声线),并以多语种生成语音,还能根据语境调整节奏、情感、语调等细节。AI翻译配音乃至语音克隆技术已被广泛应用于新闻、播客、影视等文化作品的翻译和跨国传播中。例如,“纸杯”为彭博社(Bloomberg)、内幕(Insider)等新闻媒体的英文视频提供西班牙语的翻译配音服务,为奥利弗(Jamie Oliver)等优兔博主提供阿拉伯、葡萄牙、印地等多语种配音;Spotify与OpenAI合作开发了克隆主播声音并生成翻译语音的功能,目前已推出弗里德曼(Lex Fridman)等主播的英语转西班牙语频道播客。

在视觉配音(visual dubbing, vubbing)方面,修改唇部动作、使之匹配语音的功能开始被应用到影视作品的翻译中,如无暇智能(Flawless AI)、变革娱乐(Adapt Entertainment)、口型配音(LipDub)等。Flawless AI推出的精准同步(TrueSync)软件可以提取演员的面部特征,进行少样本的面部关键点定位,并通过生成对抗网络(VQ StyleGAN)修改原始镜头中演员的面部动作,以适应配音发声。14Adapt Entertainment利用柏拉图(PLATO)软件(通过自动编码和跟踪物体进行物理学习)的神经渲染(neural rendering)技术,捕捉演员在录制英文念白时的面部动作,从而调整原始镜头中的面部。基于这一技术,“变革娱乐”为巴尔切夫斯基(Maciej Barczewski)导演的《战俘拳王》(Mistrz)进行了从波兰语到英语的视觉配音。这为文化作品的国际传播增加了另一种可能——以较低的成本为电影重新配音并在国际市场中发行。

(三)多形式内容分发与消费

在国际传播层面,多语种的生成式AI新闻也开始出现,创新了新闻的生产与分发模式。例如新闻网站第一频道(Channel 1)希望根据受众母语、感兴趣的主题和区域等,构建个性化的新闻产品:它能够收集全球信源、翻译现场报道,生成文稿并由数字主播进行多语种的新闻播报,通过应用程序和流媒体平台进行分发,使全球用户都能获取语种、兴趣、主播风格等个性化定制的新闻。目前,Channel 1还未正式推出新闻产品,但从它发布的英、法、德、日、韩、俄等种语种的试播视频中,已经可以一窥生成式AI将为国际新闻的个性化消费带来的影响。

生成式人工智能驱动的聊天机器人增多,也为各国文化的国际传播提供了新的可能性。基于大规模知识库和检索增强功能,生成式AI对各国的文化背景都有所了解,能结合指令微调扮演特定角色,包括历史名人、特殊职业者、游戏非玩家角色(NPC)等。例如,OpenAI推出的GPT Builder使用户能自由创建、分享不同版本的ChatGPT。其中,基于中国八卦风水知识的“AI算命”和“八字算命”(Chinese BaZi Fortune Telle)等已获得了近万次聊天。角色.智能(Character.ai)中的AI“老子”(Laozi)、“孙子”(Sun Tzu)、“成吉思汗”(Genghis Khan)和“道德经”(Tao Te Ching)已经与用户开展过万次乃至百万次聊天。

生成式AI也能将书籍转变为互动游戏,由AI扮演游戏NPC。例如,新加坡国家图书馆基于OpenAI推出了“游戏国书馆”(Playbrary)。在其中,用户可以通过GPT4与自己选择的书籍互动;也可以参考游戏图书馆给出的提示词格式,自行调整书籍名称和交互风格。用户通过与AI的聊天、交互,可以探索各国的文化故事,推进不同文化之间的传播交流。基于聊天的形式,生成式AI还可以帮助用户学习外语、提供作品背景解读等,从个性化的新闻消费到聊天式的文化传播,生成式人工智能为国际传播提供了新的体验形式。

二、生成式人工智能对国际传播的影响路径

(一)新的国际传播行动者

生成式人工智能的兴起使国际传播生态中出现了新的行动者。根据行动者网络理论(Actor-Network Theory, ANT),无论人还是物,都可以成为行动者,且具有能动性,“能将其他人的意志转译(translate)成自己语言的元素”。它们不是处于某个位置以完成预设功能的占位符,也不是单纯的中介者,而是能制造差别、改变状态、留下痕迹的转义者。生成式人工智能超越了单纯功能主义视角下的工具或中介角色,它作为非人行动者的引入,改变了传统的国际传播模式,促使新的国际传播行动者网络的形成。在这个多元、动态的网络中,政府、媒体、企业、个人和生成式AI相互作用、相互影响。例如,生成式AI的开发、实践和内容产出受到科技公司、政府、个人等传统行动者的影响;同时,它的算法逻辑和运作(如社交机器人)也在影响个人的认知模式、重塑国际交流格局。

(二)新的知识获取与认知模式

生成式人工智能正在成为一种新的知识获取模式(mode of knowing)。它既为在国际传播中理解他国形象提供重要机会,也可能传递其中存在的偏见。

对AI生成结果的审查显示,生成式AI可能在代表性、情感、刻板印象等方面产生国别偏见。例如,研究显示,GPT2在生成文本时,倾向于将低收入国家与更负面的情绪相关联;在此基础上,进一步的定性评估也发现,对比文本情绪更负面的组1(阿富汗、突尼斯、利比亚、苏丹、塞拉利昂)和情绪更积极的组2(英国、法国、芬兰、爱尔兰、圣马力诺)两组国家,GPT2为组1国家生成的文本往往与军事战争、恐怖主义、暴力袭击相关,并使受访者产生更深刻的刻板印象记忆。GPT3.5在回答环境保护问题时,对高收入国家的提及频率是低收入和中低收入国家的7.8倍。即使经过了算法的调整,GPT3.5和GPT4仍然会生成基于国别的刻板印象,例如,叙利亚人被认为是无家可归、不学无术的;印度人被认为是不讲卫生、不爱护环境的。

(三)新的真实性问题

生成式AI的幻觉问题和深度伪造能力,使国际传播中的真实性建构面临新的冲击。例如,GPT3.5在回答各国生态保护的经验时,会产生幻觉:在81个作出土地恢复承诺的国家中,有近四分之一没有被提及,其中大多是低收入和中低收入国家;与之相对,它提及了40个没有做出官方土地恢复承诺的高收入国家。

AI的生成能力可能被用于虚假和有害信息的生产。信息核查机构“新闻守护者”(NewsGuard)发现,要求ChatGPT根据已被证伪的100条虚假信息进行文本生成,GPT3.5和GPT4分别对其中的80个和100个任务作出回应,生成了鼓动性短消息或是权威口吻的长新闻,其中包括俄罗斯策划了马航坠毁、美国策划了叙利亚化武袭击事件等国际阴谋论。

深度伪造技术进一步增加了虚假信息的模态。生成式AI能优化文化作品的多模态表达,也能伪造公众人物的行为、虚构危机事件,从而在国际传播中造成误导和混淆。有报告显示,2023年,推特上由人工智能生成的虚假信息(特别是深度伪造图像)的数量平均每月增长130%。例如,一张五角大楼发生爆炸的伪造图片在推特上出现,不仅引发当日美股震荡,还迅速被“今日俄罗斯”(RT)和印度媒体共和电视(Republic TV)转发报道;随着巴以冲突加剧,拜登着军装指挥作战、以色列军队受到夹道欢迎等伪造图片也在网上流传。在国际传播中,由于地理距离和语言文化的阻隔,确证事实变得更加困难。

(四)新的国家能力

在传统的政治学讨论中,媒介并不被作为国家能力的维度之一,而是在相关论述中被偶尔提及。随着技术的演进,媒介对于国家能力的影响愈发凸显。部分学者也在国家能力的构建中加入了新的媒介维度,例如“国家数字能力”。

作为数字时代重要的交流媒介和基础设施,生成式AI正在成为国家数字能力的重要组成部分。受限于高昂的大模型训练成本、薄弱的底层技术积累等,在发达国家积极提升国家数字能力的同时,许多发展中国家只能持续追赶或被动接受。据统计,2023年,美国发布了109个基础模型,接着是中国的20个、英国的8个。由此可见,生成式人工智能的变革并未抹平世界差距,反而拉大了数字鸿沟。在国际传播环境中,传播秩序是参与主体之间的国家能力博弈的结果。因为不同国家的数字能力存在差距,国际传播信息流动的“中心-边缘”结构可能依然难以撼动。

三、小结

面对国际传播中的生成式AI技术,我们需要拒绝技术迷思或恐慌,推动其促进国家之间的平等交流和相互理解。

首先,生成式AI目前的理解和生成能力仍是有限的,更多扮演辅助性角色;其次,生成式AI并不生产事实,而是循环转译数据,其中还可能导致偏见和虚假信息等问题;另外,生成式AI也无法弥合数字鸿沟,使每个国家平等地接入生成式AI。因此,生成式AI并不能带来国际传播的“乌托邦”。也因为生成式AI的局限性,我们不必陷入技术恐慌。我们应该以开放的心态与生成式人工智能展开交互,探索其在国际传播中的应用实践。

在工具理性的逻辑下,生成式AI的开发和国际传播实践往往追求效率和影响力的最大化,甚至试图控制思维,而忽视传播行动应该承载的价值,包括平等、尊重、包容等等。因此,我们需要重申价值理性在国际传播中的重要性。国际传播中的AI开发与实践,应以促进国际交流、相互理解与文明互鉴为目标,以价值理性引导工具理性,并以AI与人类智慧的结合防范利用生成式AI实施的欺骗、操纵与控制。在人机共生的基础上,应充分发挥生成式AI的能力,以生成式AI辅助实现国际传播的理想愿景。

本文系国家社科基金人才项目(22VRC186)、复旦大学文科先导和创新团队项目(IDH3353070)的阶段性成果。

周葆华系复旦大学信息与传播研究中心研究员,复旦大学新闻学院教授,全球传播全媒体研究院研究员,复旦大学国家发展与智能治理综合实验室研究员;吴雨晴系复旦大学新闻学院博士研究生

关注获取更多信息

扫码订刊

对外传播
《对外传播》以提高中国对外传播实力和影响力为目标,关注当前传播研究和实践领域的发展趋势,研究全球化时代媒体的传播规律,探讨传播实践中的重要和紧迫性问题,介绍传播理论与实践创新的成果与经验,是对外传播的学习交流平台和思想库。
 最新文章