本文原刊于《现代传播》2024年第6期,第148-157页。
此处转载,注释从略。参考、引用请依据原刊。
次生口语的学理逻辑与传播形态:
从WEB2.0到 WEB3.0
翟羽佳 赵英乔
【内容摘要】诞生于电子媒介的“次生口语”以新的形式在数字媒介环境中扮演着关键性的角色,影响着媒介信息的传播、文化思维的塑造以及社群关系的凝聚。沃尔特翁的“次生口语”理论奠定了新媒介话语演变的基本逻辑和动力。基于“后文字”“后语言”“社群传播”的学理基础,“次生口语”在WEB2.0时代表现为更具互动性、游戏性、视听耦合性的“数字口语”;在WEB3.0时代则演化为为用户提供“具身”模拟并增强现实传播体验的,基于人工智能算法的“元口语”。当前,耳朵经济、多模态大语言模型、虚拟数字社区已然成为中国媒介话语实践的重要角色,立足于媒介演进历史的动态性特征,“次生口语”理论将为新媒介话语生态的发展、现代传播经验的时代症结的解释提供契合的理论钥匙。
【关键词】次生口语;数字媒介;口语传播
作者简介:
翟羽佳,女,1989年出生,山东大学文艺学博士,山东淄博人,山东理工大学文学与新闻传播学院副院长,教授,硕士生导师,主要研究方向文艺传播、新媒介研究。
赵英乔,女,1998年出生,中国海洋大学文学与新闻传播学院硕士研究生。
次生口语强调附加聚合、社群空间、移情参与、情景沉浸等当下文化症候,关切人、媒介、社会、文学、政治经济的共栖关系与互动活动,次生口语不再是单一的话语现象,它更是传播要素、逻辑观念和意识形态,是了解这个媒介时代合身的理论钥匙,拥有强大的研究容量和活力。次生口语强调“赛博空间”“口头程式”“部落化”“群体感”“数字化”等传播概念,改变了传统媒介史观的静态思维,扩展了媒介环境学在互动式数字时代的研究思路和话语资源。随着虚拟现实(VR)、增强现实(AR)、人工智能技术(AI)的不断进步,新的交互方式和话语形式在这些媒介中涌现。从原生口语到数字口语再到生成式人工智能,新的内容增量反映了人类思维方式的变化,不仅在概念上体现,还需要在无限延伸的媒介传播环境中实现。
次生口语引导和推动了中国新媒介话语生态的发展,它不仅构成了中国媒介话语由WEB1.0向WEB3.0演变的底层逻辑,还为不同时代的媒介话语赋予了独特的特质。近年来,中国正快速步入智能互联的时代,新媒体带来的话语革命尤为突出地表现为新媒介的口语进程。在WEB1.0时代,中国网民们每天在聊天室、论坛、贴吧中输出了庞大的交流语量。而当下中国的WEB2.0时代,智能手机、微信等社交软件的全民普及,口语化的片段以数以亿万兆计的形式存在于新媒介的话语中,构成了我们鲜活的口语生态场,巨大量级的话语实践建构着世界范围内的特殊性、民族性和前沿性。随着web3.0时代的到来,中国的媒介话语实践进入了数字“元口语”时期,口语向算法的转变成为开启交互空间的关键,麦克卢汉预言的“寰宇”意识初露端倪,次生口语为中国新媒介话语生态找到了与时代症结相契合的理论钥匙,并提供了具有中国经验的口语传播范式。
一、次生口语的学理逻辑:“后文字”“后语言”与“社群传播”
从口语传播与社会互动的角度来看,沃尔特·翁(Walter J.Ong)的理论无疑是开创性的。传播学、人类学、历史学等多个领域的学者通过深入探讨口语文化的历史演变,以及与新兴媒介、技术之间的相互作用,试图理解口语这种交流实践如何在传播中塑造人类认知及相关经验,包括我们对于信息的接受方式以及与社会的互动方式等方面的影响。通过深入挖掘“次生口语”理论背后的学理逻辑,我们能够更清晰地了解这一理论的深度和广度,分析其在当代传播环境中表现出的灵活性、适应性,为其在当代传播领域的持久价值提供更为深刻的认识。
(一)“次生口语”在“后识字社会”的有效适应性
作为由电子媒介催生的一种口头交流形式,“次生口语”代表了文字社会中的口头文化向数字时代的新型口头交流的转变。事实上,口头文化本质为非文字世界的产物,“次生口语”的产生不仅是一场媒介形式的变革,更是文化传承与表达方式的重构。而对于口头文化的传统如何被当代文化社会中被改变和塑造的,这个学理逻辑是需要被研究并解决的。沃尔特·翁主要从媒介技术的角度分析了口语自诞生以来的发展及演变过程,认为口语传播地位的改变首先是在文化与媒介的互动中逐渐演进和适应的。“次生口语”的产生应当放置在“后识字文化”的大背景下去讨论。
“后识字文化”这一概念是由美国学者君特·托马斯(Thomas G) 提出的,他用“后识字文化”一词指代超越书面传播主导地位,深受电子媒体和数字技术影响的文化。君特·托马斯不断地洞察传统形式如何被重新配置以及新的形式在“后识字文化”背景下出现并扩展到实践的领域。从先民时期到文字发明,从机械时代再到电媒时代口语的发展,我们实际上已从一个以书面文化为中心的世界走向了后识字社会的时代。后识字文化中表现出类似于口头交流的特征,如即时性、公共参与和感官参与,以及当代社会中口头、书面和电子形式的交流共存和互动。诞生于“后识字”社会文化背景下的“次生口语”,与原生口语(文学前文化的语言)共享一些语义特征。他们都强调话语的意义和它们发生的语言外情境之间的内在联系。在逐渐被视觉文化符号所取代的口语传播方式中,口语重新以“次生口语”的形态出现,这一现象与“后识字”文化背景下现代传播的效率有着深刻的联系。如媒介心理学家艾玛·罗德罗(Rodero E)就认为在现代社会时间被逐渐压缩的境况下,通过语音与数字设备进行交互是最快最简单的方法。因此,在其中扮演着重要角色的声音对当今的文化艺术产业包括视觉艺术、表演艺术、文字艺术产生着越来越重要的影响。此外,“后识字文化”中不同文化团体的口头实践、读写能力都与新媒介之间发生着重要互动,如丹妮拉·莫罗拉(Merolla D)分析了新语境中具有创新性口语风格的内容,包括非洲嘻哈音乐和新型剧院演出等,这些口语形式巧妙融合了音乐和数字语言,他强调了这种不断变化的口头体裁并试图让我们理解不同的文化团体如何在“后识字文化”的时代背景下借助新媒介形式重新定义、发展口语传统。
通过上述分析我们发现,“在标准语发展的每一时代,都有一定的言语体裁起主导作用,而且不仅有第二类体裁(文学的、政论的、科学的体裁),还有第一类体裁(一些口头对话的类型,如沙龙的、社团的、家庭生活的、社会政治的对话)。” 而如今,与鲜活的口语相比,书写是“一种第二手的交流模式,是言语的苍白的机械的转录,因而总是与我的意识隔了一层。” 可以说,“集合口语和书写特征的移动多媒体文本成为一个不可逆转的历史实践的补偿性选择。”
(二)“次生口语”对“后语言论”边界的突破性
“次生口语”在很大程度上受到了书面文字的影响,并且其发展在“后识字社会”的文化背景中得以展开。这一口语形式一方面表现出与书面语和原生口语截然不同的语言特点,同时也应当置于与“话语”相关的范畴中进行深入讨论。关于语言与话语问题,索绪尔、福柯、巴赫金等人都提出过明确的主张。巴赫金尤其强调“交际”的关键地位,而“对话”则是交际的关键形式。关于交际,在巴赫金(Mikhail Bakhtin)看来,语言的真正实现则是言语的相互作用,即话语——连续的言语交际。话语是以“社会交际”为核心特征的表达,“每一个话语都是各种社会声音混杂和斗争的小舞台” 。“话语主要是生活交际的材料。名为口头的言语及其形式正式属于这一领域,生活中的思想领域。” 可见,巴赫金的“交际”和“对话”就是强调社会性及其中的参与性就是话语的极为重要的特点。他还说“生产关系和由它直接决定的社会政治结构决定着人们一切可能的话语交往,决定着他们话语交际的一切形式和方式。” 。从人类生产史的规律来看,社会实践与发展的动力还是以语言为传播轴心的,从言语开始,人类发明的语言自然成为思想的外壳,比如用语言传递的观念能够通过组织行为产生一种社会力量,或者是一种话语所形成的氛围链接出一场轰轰烈烈的事件。
声音作为口语的媒介,使口语“透明化”而让人得以充分的传达信息或表达意义。即使后结构主义语言学试图寻找“超越的能指”(transcendental signifier)来涵盖所有符号的终极意义,但最终还是不得不承认它的虚构性,这种目的论的探求告诉我们,并不存在稳固规则与体系的语言,更没有先验的意义之意义,任何的概念都会在开放的结尾中迷失甚至是颠覆自己。那些鲜活的声音也会在传递中失去最初的能指而转向下一个所指,在这些串联循环中生产出新的意义,这与当下的次生口语是极为相似的,所以说,德里达对口语地位的重新审视,正是后结构主义语言学在话语表达中所展现的时代张力。事实上,当下的媒介话语正在不断突破“后语言论”的实事边界。
部分亚文化口语实践一直在上述口语框架中运行,扬·芬巴克(Fernback J.)在对网络环境中一种特定类型的口语形式——城市传说的分析中指出,“次生口语”的特点在城市传说的类型中呈现得极为明显,口语从前文字社会到文字社会的时间进程中,语言本身的性格发生了强烈变化。而这种从原生口语到印刷文化再到以电子媒介为基础的“次生口语”的语言表达已经深刻地改变了语言艺术的进程,在城市传说中情节的发展和人物塑造中表现得尤为明显。不管是表演取向还是材料取向,媒介话语正是这些文化表达的镜像输送。而如今,我们正面临一个语言表达的电子变革时期,特别是涉及语言和现实、空间和文化之间的关系转型问题,语音更是后人类主义语境下媒介传播的重要内容。语言学家卢卡·诺莱(Luca Nobile)就将这种在数字时代里充分整合的口语声音象征融入语言理论,并提炼了数字化语言的四个特点:数字技术的使用、大规模的远程传输、发布内容的主体决定性以及互动的可能性。
(三)次生口语对“社群传播”的阐释性补偿
“话语的场景语境更是深受主导性媒介制约。场景语境为人的话语行为提供框架基础”,如果说原生口语文化是“现场性”媒介语境中的话语活动,那么当前的次生口语文化就是虚拟媒介语境中的话语活动。因此,我们发现口语化的特性与主导性媒介紧密依存。“‘媒介’一词在使用过程中侧重意指居于中间是两者发生关系的中介,即一种中介化的实践。” 符号论同样认可这种说法,认为媒介就是符号意义被感知的中介。因此,无论从“媒介论”还是“符号论”的视角,媒介在本质上就是交流与传递。这种特性无论是在口传文明时期,亦或是书写文明时代,都不可避免的被赋予社交属性。而在今天,媒介被技术力量顶上云端,将这种社交性充分发挥。但口语是群体社会性交往的基本,哈罗德·伊尼斯(Harold Adams Innis)更强调口语文化在民主生活、公共领域发挥的重要力量。数字媒介话语作为正在发展的新语言,在形式上模拟了自然的会话流程,这是不仅是对口语传统的向往、对社区恢复的渴求,更是一次群体性社交的口语回归。
事实上,“次生口语”这一概念吸引了许多试图理解当代传播语境的学者们。早在1992年,戴尔·贝特尔森(Bertelsen, D. A)就指出文化形式与主导的通信技术相关,“次生口语”可以作为我们理解当代参与式民主的一种方式,电子文化的交流技术提供了一种类似于口头文化的社区意识。而在2004年安德鲁·费伯格等(Feenberg A)继而提到数字媒介所催生的虚拟社区提供了一个灵活的交流空间,印刷文化相对于口头文化更加具有个人主义和线性化思维,而口头文化的虚拟社区显然更允许足够积极的受众以无限多的公共方式来进行阐释。在考察口语文化与印刷文化的交替时,大卫·阿泰德(Altheide D.L)尝试在媒介环境学之外的范畴来理解当代社会秩序,他主张不要过分强调这一过程中所包含的的“信息传递”的成分,应该将讨论重心转向社群互动的沟通过程是如何由信息技术、逻辑和格式塑造的。
按照沃尔特·翁的理论逻辑“次生口语”对应于麦克卢汉所说的“重新部落化”时期,文字创造的环境使得我们进入了非部落化的进程,而早期电子媒介的发展开启了“重新部落化”的时代。次生口语作为一种在数字时代崛起的口语表达形式,强调直观、简练、即时的语言,更贴近原始口语的特点。在信息超载和快速传播的环境下,人们更倾向于使用简短而富有表达力的语言形式,这与“重新部落化”的理念相呼应。重新部落化意味着人们在虚拟社群中重新建立更为亲密的联系,而次生口语作为一种直观的表达方式,有助于加强社交媒体上的沟通与互动。与此同时,次生口语在社交媒体和在线社群中得以广泛传播,成为数字时代人际交往的一种突出方式。通过新的表现方式如评论、分享、表情符号等形式,人们在虚拟社群中展现了一种更加贴近原始口语的交流方式。这种口语的复兴反映了人们在数字化社会中寻找更为真实、直接的社交体验的渴望。
二、数字“纹理”、空间耦合、拼写挑战、视觉修辞:次生口语的WEB2.0形态
“次生口语”的本质是口头的,它聚焦于口头言语、即时性以及公共互动,并将书面文字的特点如文本的持久性、信息存储和广泛传播融入其中。沃尔特·翁所处的时代,“次生口语”仅限于早期的电子媒介如电视、广播等形成的口语形态。然而随着WEB2.0的迅速发展,“次生口语”的范围扩展至更多数字交流形式,包括社交媒体、视频会议、播放软件以及其他视听平台等。在WEB2.0的发展下,众多学者指出用“数字口语”来概括新的媒介形态下“次生口语”的表现形态更为恰当。这一转变使得“次生口语”不仅仅是早期电子媒介时代的产物,更是数字时代中口头表达的重要代表,呼应着当今数字社会中信息传播的多样性和即时性需求,强调了口语在数字环境中的独特地位。
中国的新媒介话语也广泛融入了口语文化,在WEB2.0时代的数字传播中,次生口语展现了令人眼花缭乱的创造力,通过将数字技术与口语形态巧妙结合,深刻地塑造了WEB2.0时代中国媒介口语生态的面貌,甚至影响了“Z世代”的交感系统。这一代人不仅在弹幕讨论中进行口语化的社群交流,还通过数字口语媒介获取咨讯、了解法规、学习知识等,展现出人类社会正在兴起的新视听方式与“软件结构”。
(一)WEB2.0时代的“次生口语”是基于大数据技术的口述和次生口述混合的数字衍生物。
在沃尔特·翁之后,以洛根为代表的一批学者提出了“数字口语”的概念,作为对“次生口语”理论的一种补充和发展。这一概念的提出将“次生口语”理论从电子媒介时代延伸至以WEB2.0为代表的数字媒介时代。“数字口语”与“次生口语”产生于不同的媒介环境中,由于口语形式的交流特性,将会使得不同时代的审美或语言偏好嵌入到当时的社会文化或政治叙事中,此时语言就会呈现出因交流形式所具有的独特“纹理”。“数字口语”所具有的知识交流形式的独特“纹理”被帕帕查里西(Papacharissi Z.)称之为“大数据” 。通过最大化技术领域的计算能力和算法精度来收集、分析和比较大数据集,将人际关系与大众个人叙事实践相融合,使得在WEB2.0之后的知识叙述中出现了大数据这一独特的“纹理”(texture)。每个时代都有其独特的口头特征,而大数据呈现了具体现实的叙事,构建并再现了更大容量的社会现实。它们指向了社会文化、政治或经济的趋势,并将这些假设嵌入到分析模式中。因此,大数据对WEB2.0时代的叙事实践做出了独特的贡献,为知识的叙述提供了一种独特的纹理,这种纹理可以理解为“数字口述”。数字平台依托大数据和各种类似的分析公式,将人际关系和大规模讲故事的实践多种多样地融合在一起,数字口述肯定了声音,提供了进入故事的数字化途径。在原始口述强调声音的同时,数字口述在传播声音的同时保留了它们原始的主观性。数字口述系统围绕着语音组装,同时具有原始性和多样性的特征。它推动了一种数字形式的故事讲述,是主要口述和次要口述混合的衍生物。
结合国内特有的数字平台内容,在广播剧中,人们通过丰富的语音表达和生动的配音,将故事情节传达给听众。抖音的短视频也充分利用语音、音效和表情符号,为用户创造了一种富有情感和趣味性的互动体验。这些数字平台的引入使得用户能够更积极地反馈和对话,通过用户的点赞、评论和转发,从而呈现出广泛的交互性和参与性。哔哩哔哩等播客平台可以通过评论、弹幕等方式与创作者互动,从而形成更加开放和互动的数字口语社区。除此之外,这些“数字口语”还呈现出多媒体和多模态的特点,融合了文本、图像、音频和视频等多种交流模式。喜马拉雅不仅有生动的语言表达,还有音效、背景音乐等元素,丰富了听觉体验。中国的广播剧、音频平台等媒体通过数字手段,使得信息能够立即在全球范围内共享、转发和传播,推动了中国在全球数字文化传播中的迅速崛起。
(二)WEB2.0时代的“次生口语”实现了声觉与视觉空间、虚拟与人际空间的耦合
梅罗维茨(Joshua Meyrowitz)提醒我们电子媒介并不是通过内容本身,而是通过重组社会生活的“场景地理”即媒介的空间属性来影响人们的社会性行为。兰斯·斯特拉特(Strate L)在讨论互联网空间界定的相关问题时认识到,网络空间比起视觉空间更像是声觉为主导的空间,基于声音再现技术的发展,“次生口语”得以回归声学空间,这种声学空间往往以参与者为动作中心,被整体听到的听觉环境所包围。WEB2.0时代的“数字口语”占据了特定的文本空间,不仅仅是声觉空间的回归,更是对多元空间属性的关注和利用。数字媒体平台的不断演进不仅提供了更多的空间形式,还创造了更加丰富和立体的沟通体验。在这个数字门户和用户交互的场景中,人们通过文字、图像、音频和视频等多模态表达方式来共享信息和交流,从而形成一种数字化的社交生态系统。用户个体与数字门户之间的互动不再仅限于信息传递,更成为一个动态的、双向的接口。这种数字介质的核心,使得人际互动在虚拟环境中变得更加紧密和实时,并在本质上体现了“数字口语”的空间耦合性。
“数字口语”的空间属性可以包含主体的内在空间及平台化的客体空间两部分。数字网络平台为用户提供了多维空间,数字平台的用户得以实现在线网络平台中个体身份经验的流动性跨越。Darvin据此指出“数字口语”由于兼具语音的交互性质和写作的文档能力,因此在两种语言模式之间建立了一个互动空间,在线用户不仅能够轻松的制作和分享文本,同时可以即时性反馈来修改这些文本,使得人们成为反身性社会的积极创造者。以全球音频平台的代表喜马拉雅FM为例,马拉雅FM作为次生口语文化生态的重要表现者,其新变化和特征体现了“耳朵经济”和中国口语传播的新业态。喜马拉雅先进的口语传播模式,不仅为口语表达提供多样的功能性,还构建了一个以声觉为中心的人际交互平台。这种独特的交互性使得听众在沉浸于内容的同时能够参与其中,更加深刻地体验到声音所带来的情感和知识。喜马拉雅的评论区不仅是听众交流的主要场所,更像是一座连接听者与作者之间互动的桥梁。在深度沉浸于内容的同时,评论区还成为了听众积极交流的核心部分。随着文字在评论框中的编辑和发布,听者之间以及听者与“作者”之间的精彩互动得以全面展开。在这个由互联网构建的虚拟空间中,听众借助平台改变了口语交流的时间和空间组织形式,以虚拟在场的方式与其他聆听者共享由声音带来的情感体验。
(三)WEB2.0时代的“次生口语”表现出了书面语的口头表征、受众的建构参与、拼写的游戏挑战等特征
媒介传播研究者索弗(Soffer O.)认为以计算机中介通信(CMC)和短信服务(SMS)为基础的口语化交流也具有“数字口语”时代的特征。CMC和SMS在人际交往中发挥着越来越重要的作用,而互联网的大规模普及为CMC提供了进一步的可能性,其中包括聊天和即时通讯系统(IM)。索弗的研究深入挖掘了“数字口语和“次生口语”的差异,包括形式、叙事模式以及受众几个层面。首先在CMC和SMS等数字化媒体中,“数字口语”并没有像过去的口语时代那样在书面范围内具有口腔或声学特征。这一观点呈现出一种悖论,即数字口语的口头特征在书面表达中得到了体现。对于“数字口语”而言,其在书面文本中的表达并非仅仅是传统意义上的书写,而是融合了口头氛围的影响。其次,在文本所包含的明确的叙事结构层面,“次生口语”主要依靠文本中的内容建构叙事,而“数字口语”在书面领域中表现出人际关系、非正式的口语对话,主要依赖读者来建构叙事。“次生口语”和“数字口语”的另一个重要区别在于受众的规模。“次生口语”作为大众传播文化的一部分,拥有大量的受众,而“数字口语”发生在相对有限的社群框架中——在人际互动中或在相对较小的参与者群体中。在文本的明确叙事结构层面,“次生口语”主要依赖文本中的内容来构建叙事,而“数字口语”则在书面领域中展现出人际关系和非正式口语对话的特点,主要依赖读者来参与叙事构建。另一个显著区别在于受众规模。“次生口语”作为大众传播文化的一部分,拥有广泛的受众,而“数字口语”则发生在相对有限的社群框架内,例如在人际互动或较小的参与者群体中。
“数字口语”的特征不仅显现出媒介技术更新的结果,它们还普遍性地反映了对现代主义文本感知的语言挑战。“数字口语”呈现出的这种混合了“口语—符号”的语言风格可以延伸到更为广泛的后现代和后结构运动的文化背景中,即它体现了一种文本的异质性和个体的主体创造力。在《流动的语言》(2012) 中,索弗将数字口语描述为一种参与性的拼写错误的自我意识实践,这种拼写实践在他看来与后现代、后结构主义的主张相一致,旨在远离形式和意义之间的稳定联系。他描述了数字口语的三个类别:词汇替换(10דTHANKS”),创造了“新意义”的符号(Z zzzzz=Zzzzzz=snoring)和首字母缩写(OMG,“OH MY GOD”)等,这些新的口语形式对僵化的二元语言结构提出了挑战,故意远离标准书写形式的实践可以被看作是对能指和所指关系的一种突破。通过“数字口语”这种具有挑战性的表达方式,我们接收到了一种以社会群体差异和游戏化创意为基础的真实个体声音,以及对印刷文化时代束缚的象征性不满。
(四)WEB2.0时代的“次生口语”创造了数字文本的多模态写作与视觉修辞的新实践
传播媒介的改变使得使用者不断发展数字化思维,包括操作数字媒体工具的能力,并在相关应用条件下适应媒介的变化,从而形成特定的文字风格以驾驭新的人际环境。事实上,“次生口语”的瞬时互文性本身就是对中心性的挑战,这种超文本的挑战能力只有在WEB2.0的情境下才能实现更大的权重。文本意义编码与解码的过程,需要使用者的数字素养以及通过数字实践来构建和维护个人关系及身份的数字能力。琼斯(Jones R H)试图将与WEB2.0媒介相关的交流、联系、思考及写作实践,以及受到数字媒介及口语文化影响的写作风格定义为“数字文本” ,这意味着数字文本不仅仅是语言的演变,更是一种创新的表达形式,以适应数字时代的沟通需求。
“数字文本”的口语化表征同时对WEB2.0的写作实践产生了重要影响。数字文本具有计算机提供的写作优势和可能性,表现为文本组织的易于修改及编辑,以及音乐、图像、视频等多模态形式的插入。这些音频、视频、图片的不断登场都流溢出口语化的表征。同时,在线平台的出现支持作者与读者间的实时协作和反馈,从而形成新的协同写作实践形式。正如史密斯(Smith R)所言,“数字文本”激活了写作主体在社会群体中的参与度,加快了社会话语的即时性讨论。“数字文本”的诸多特征影射了口语文化形态的各个方面,数字技术提供了一个与口语发声形式相似的条件,“数字文本”模仿口头语,模拟其自发性,并表现出可开放和可渗透的文本形态。这些电子符号作为公共的和私人的图标,它们被重复且通过数字媒介的方式强化,而不是通过口头的形式强化。读者的阅读体验也会受到新风格和惯例的影响,当然,这同样使得写作者的写作模式发生改变。因此用户的数字素养,即能够在数字环境中有效地导航、评估和创建内容所需的技能和知识,在数字化文本的生产过程中变得尤为重要。
数字文本实践以WEB2.0为基础,定位于一个二维的、可重复的空间,其更加注重利用视觉元素和符号传达信息。因此,如何巧妙运用修辞技巧和策略来表达观点、影响读者,已成为“数字文本”视觉修辞需要认真考虑的关键要素。在沃尔特·翁有关口语文化修辞讨论的基础上,新媒体声音与文化研究者霍克斯(Hocks M E)指出数字文本的组织在很大程度上依赖于视觉修辞学,并详细阐述了视觉修辞学的关键特征。视觉修辞学通过视觉策略在超文本和多媒体写作中变得尤为重要。随着交互式媒介的发展,文字与视觉效果在数字写作中难以分离。交互式数字文本融合文字和视觉效果,使视觉修辞学成为设计数字文本的变革性过程。这个过程注重视觉元素与文字的互动,提升数字文本的影响力和吸引力。视觉修辞学在数字文本设计中成为关键手段,增强了沟通效果和创意表达。
三、算法口语、具身模型、增强现实:次生口语的WEB3.0形态
上文我们尝试梳理了不同媒介形式中的口语形态。如果说“次生口语”反映了受印刷文化影响的早期电子媒介中的口语表达,并且表现在早期电子媒介中,那么“数字口语”则是伴随着WEB2.0时代兴起的,具有“次生口语”特征的互动式网络空间中的文本形式。尽管超文本中涉及到其他模态以及非线性的叙述方式,但不论是早期电子媒介中的“次生口语”还是WEB2.0时代的“数字口语”,主要涉及的是受媒介变迁影响的语言内部,特别是语体间的相互作用。保罗·莱文森在《新新媒介》一书中断言,“新新媒介的出现和演化都很快,其相对重要性的变化也快到你读本书的时候,我所论述的新新媒介的重要性可能或多或少有所变化。此外,我写书时不存在的新新媒介却有可能在扮演重要的角色了” 。莱文森对“新新媒介”概念界定截至到2010年左右,如其所述,新媒介技术时至今日又发生了巨大的变化。随着web3.0时代的到来,口语与音乐、视频等多媒体形式相结合形成全息化的沉浸式环境,人工智能、语义网络建构等正在实现人与网络的全新链接。口语在WEB3.0时代不仅限于语言层面的作用,而是作为一种“元语言”成为多模态交互的纽带。WEB3.0中的虚拟数字人实现了沉浸式的口语交流和体验。星期六公司基于明星的粉丝效应成功延伸了以区块链为核心的NIF,实现了数字虚拟人的IP创作,类似的还有佳创视讯发布的虚拟数字人幻小佳等。此外,虚拟社区的构建创造了全景交互式的元宇宙口语交互环境,包括佳创的虚拟交互社区幻境线以及浙文米塔的数字艺术社区等。这些数字资产的资源整合,涵盖了影视、电竞IP等领域,吸引了众多平台用户,并为未来WEB3.0时代的用户生产提供了丰富的交流契机。
(一)基于人机对话的AIGC丰富了WEB3.0时代“次生口语”的相关传播内容
与传统的用户生产内容(UGC)、专业生产内容(PGC)相比,“生成式人工智能”(AIGC)更加满足了内容匹配生产的扩张需求。人工智能正在引领新一轮文化生产的巨大变革,而对AIGC中蕴含的口语要素、算法逻辑的考察则是我们分析新一轮媒介技术革新的有力切入点,更是理解WEB3.0“次生口语”形态的关键钥匙。如果说沃尔特·翁侧重于对人与人之间口语对话的考察,那么AIGC则成功实现了人机交流的可能性,进一步丰富了web3.0时代口语传播的相关内容。传统人工智能多是分析型人工智能,主要用于分析现有数据,执行分类和回归等。而AIGC则主要依赖于生成型人工智能,通过理解文本指令创造新的内容。过去文本、图像、视频等内容的生产往往要求操作者具备相关的专业技能,然而AIGC的出现却打破了这一技术壁垒,用户仅需口语指令输入便可取代过去复杂的数字代码生成相关内容,显然准确完整、逻辑丰富的口语指令显得尤为重要。人工智能语言生成主要包括两个方面:从人类指令中提取意图信息,并根据提取的信息生成相关内容。NLP与机器学习算法充当了人机交流的介质,口语通过数字模拟呈现出新的样态,并转化为一种“元口语”,成为人工智能的指令目标,实现了世界范围内“元口语”的数字混融。当生成型人工智能通过一系列技术手段识别人类语言之后,则需要依靠AIGC生成算法将提取的信息生成相关内容,这些算法可以通过预测时间序列、解析空间分布等,实现内容鉴别以及合成更加真实的内容的能力。
如果说修辞在口语文化中占据着重要位置,那么AIGC生成算法则可称为人工智能技术的“修辞”方法,它影响着人机交流的有效性,以及内容生成的合理性及信息接受的有效性,整合推优的算法能够生成更符合人类口语习惯的最大公约数。AIGC技术不仅实现了在口语化语境同机器对话的可能性,同时使得单一的文本形态能够转化为多种媒体样式、如图片、3D模型、音乐等。AIGC的诞生不仅大幅度提高了信息传递的效率,并且推动了信息在多媒体形式中的转化,从而使得信息在传播中的呈现方式变得更加多元化。通过在短时间内个性化的内容定制,以及多种媒体传播样式的结合,AIGC极大提升了信息对用户的吸引力,并满足了不同人群对信息形式的个性化需求。2024年2月15日,OpenAI最新发布的视频生成软件Sora让我们瞥见未来,“真实世界”的边界正逐渐消失。通过口语这种自然而直观的语言交流,使用者能够编织关于自己的独特故事。在GPT和DALL-E强大的语义理解能力基础上,Sora能够创作出融合丰富语义和独特风格的视频作品,而人工智能的预测效果则使得这些视频更富趣味性。在视频的细节中,Sora能够完美地复制现实世界的质感和物理世界的规律,同时展现出独特的创作风格。这种融合了口语表达和先进技术的交汇,为我们打开了一个全新的视觉体验之门,使得创意和现实之间的界线变得更加模糊。
(二)通用人工智能多模态、多语言、多场景融合的发展趋势体现了WEB3.0时代“次生口语”新的应用范围和传播形式
大语言模型(Large Language Model,简称LLM)是当下人工智能发展的关键,语言模型根本在于对语言意义的理解与呈现。目前,多模态多语言融合的通用人工智能是大语言模型的发展方向,“多模态”的需求源于人类丰富地感知和认知能力,目的在于更细致的了解、贴合人的各种意图。“通过融入更多的图片、语音等高质量模态信息,要求语言模型能够理解和生成不同语言的文本,并在文本生成过程中兼顾不同语言文化背景。” 从文化传播层面来看,大语言模型本质上是基于人工神经网络的语言模型,为了支持不同语言、语境间的对话切换,它更是一个基于“具身模拟”的转换器,不断地强化训练是以模拟人类真实会话为导向和目标的,而这种亲历感正是来自于口头的意义和韵味。
文本AIGC模型生成式预训练转换器(GPT)就是在人类生成的相关文本(如书籍或文章)的大数据集上进行训练的,它是根据序列中前一个单词预测下一个文本从而实现文本的生成。2023年7月19日,国内首个网文大模型“阅文妙笔”正式发布,这款模型作为辅助功能嵌入到阅文作家创作应用端“作家助手”里使用。为了解决作家“灵感枯竭”“新手入门”等创作痛点,这款模型还可以生成与文本故事应景的图像,被称为“最懂网文”的LLM。当然,它还可以应用于网文漫改,提速了网文IP的开发产能;在几分钟内把作品翻译成各国语言,为网文出海提供极大便利,甚至可以看到,未来的网文将是图文音同频的阅读。从通用大模型到行业大模型,web3.0时代的“次生口语”正在不断拓展应用范围。2024年1月17日,新一代大语言模型书生·浦语2.0(InternLM2)在上海发布,这款LLM具备较强的口语化共情能力和丰富的结构化创作能力,它的核心理念就在于“回归语言建模的本质”。口语再次成为web3.0时代的重要参与要素,也标志“次生口语”在数字交流和信息处理等领域取得的新的传播形式。
(三)增强现实与虚拟现实为web3.0用户创造了更真实、更具沉浸感的口语传播体验
随着增强现实和虚拟现实技术的不断进步,用户在虚拟空间中的交流方式更加注重口语化。这一趋势体现在各种应用场景中,包括语音聊天和虚拟社交互动等方面。通过使用语音输入和输出,用户能够更自然地参与虚拟环境中的互动,仿佛置身于现实生活之中。语音聊天不仅使得虚拟社交更加生动真实,还加深了用户之间的情感联系,提供了更为丰富的沟通方式,允许他们以更自由、自发的方式表达自己的思想和情感,这种口语化的交流方式使用户能够在虚拟世界中更丰富地表达个性和参与各种数字生产活动。总体而言,AR和VR技术的发展为语音交流在虚拟社交中的作用带来了新的层次和可能性。
与此同时,虚拟现实和增强现实在包括剧院在内的声音表达领域展现出独特而重要的作用。这两种技术已经成为创造沉浸式戏剧的创新选择,通过运用特定的空间、一对一表演以及双耳音频等多种手段,它们成功地打破了观众与表演之间的隔阂,为带来沉浸真实的听觉体验。设计师们通过巧妙地结合声音和音乐,创造出能够更好地支持故事叙述的环境。同时,沉浸式剧院将声音与触觉相结合,如长廊剧院通过精心设计的灯光引导观众在空间中从一个声觉场景移动到另一个声觉场景,以形成一层独特的听觉体验。
事实上,AR和VR技术的发展不仅为声音展览带来了体验革命。从另一个角度来看,“次生口语”就是web3.0的媒介逻辑和传播内核。2023年4月20日,由中国移动咪咕推出的将AR、VR技术应用于新形态城市阅读的“比特书房”,还有为网文内容创作者打造的虚拟写作空间 “比特创作岛”,这些“云空间”破解物理和时空限制,融合比特分身、数智推荐、书友社交于一体。当然,在模拟场景的虚拟培训行业,这些技术也在发挥引领作用。通过录制学生的个人演讲并在虚拟环境中进行回放,可以有效地促进自我评估 ,从而培养学生对自身表达能力的反思技能,并进一步提高口头演讲的水平。此外,虚拟环境中的任务设置还能够促进实时反馈的提供,帮助学生更好地实现口语交流的过程。同时,语音识别技术的进步也使得虚拟教育环境可以提供实时反馈,帮助学生改善发音和语法,从而促进口语传播的有效学习。
次生口语的发展受到语言演变规律和媒介技术推动的共同影响。网络文学、社交媒体、语音社交应用等媒介形式,以及人工智能、语音识别等技术,丰富了口语的表达平台和内容。随着数字时代的发展,口语在多媒体环境中的融合与创新将继续为口语文化带来更多可能性。
END
欢迎扫码加入微信读者群获取更多信息(备注:群)
扫下方二维码加入qq群聊,获取更多资料。
推荐阅读: