《江海学刊》‖ 余乃忠 宫曼露丨大语言模型下文化认同的发生、型构与再序

文化   2024-07-28 09:26   江苏  



本文刊于《江海学刊》2024年第3期

转载请注明来源

文末附电子版下载链接


摘要

ABSTRACT

文化认同是塑造民族共同体、维护国家统一的心理基础,也是推动世界文化多样化、构建人类命运共同体的实践路径。随着信息技术带来的时空延伸和文化全球化加速演进,大语言模型成为文化信息代谢的重要器官,也是文化认同产生、深化和发展的重要媒介。在大语言模型迭代发展的背景下,从介质、技术和主体角度理解文化认同的发生局域,从基因、情感和能量角度挖掘文化认同的价值局域,从认知、算法和场景角度研究文化认同的实践局域,可推动文化认同广泛形成、价值实现和再造转化,有效防止信息共享传播中的文化霸权发展、信息失衡加剧、意识形态渗透等问题,为全球文化多样性发展凝聚人类共识

关键词

KEYWORD

大语言模型 文化认同 语言载体 信息技术 价值共识

作者

AUTHOR

余乃忠
长沙理工大学马克思主义学院教授、博士生导师

宫曼露
长沙理工大学科技哲学与科技伦理治理创新研究中心特约研究员


文化认同是最深层次的认同,是民族团结之根、民族和睦之魂。文化认同对巩固国家、民族及发展道路的认同至关重要。近年来,以ChatGPT为代表的大规模语言模型(Large Language Models,LLMs,以下简称“大语言模型”)基于海量的自然语言、多模态数据集、数以万亿的模型参数和强大算力系统实现了类人化的语义判识、信息处理、内容生产、图像视频解读与生成等功能,GPT-4、Groq等更具备了社会规范认知、物理化学常识等,其语言多样性、信息多元性和认知规范性为世界文化发展突破地域阻隔、空间扩展、种族界限等提供了强大技术支撑。然而,全球近60%的网站均基于英文,中文占比极少,因此更利于英语世界AI的搭建及语言霸权强化。同时,大语言模型使用的语料为网络中大量的非结构化数据,国内社会交往活动所产生的数据多存在于“内圈”,无法在搜索引擎上建立索引,导致AI训练模型难以抓取和吸收这类内容。在此背景下,突破语言壁垒、拓展文化认同的局域是增强政治认同、民族认同、国家认同的基本要求,也是推动大语言模型进一步规范社会认知、发挥认同价值、指导实践进路,进而推动文化认同长期发展的重要依据。   

底层变局:语言的环在与训练

人们越来越需要寻找一种文化认同,无论它是塑像还是旗帜。塞缪尔·亨廷顿认为:“以文明为基础的世界秩序正在出现:文化类同的社会彼此合作。”人们更强调“我们”、“你们”和“他们”,在文化融合的同时更强调对主体文化身份的认同。大语言模型作为自然语言处理(Natural Language Processing,NLP)技术的最前沿,利用神经网络模型对人们投喂的大量语言文本进行处理形成参数与数据,再基于亿级参数、数据与结果设问进行学习、理解和生成人类语言,推动人类文化交流、传播与创新,进而影响文化认同的局域结构。文化认同作为最深层次的认同,是凝结文化共同体的基础,其形成离不开语言介质、信息技术与主体反思。

(一)认同触发:语言文字的范式奠基

语言是社会文化发展的产物,从语源、姓氏、地名、造词心理等方面反映着社会文化的发展历程。美国语言学教授萨丕尔(Edward Sapir)认为:“语言也不脱离文化而存在”,所谓文化就是社会遗传下来的习惯和信仰的总和,由它可以决定我们的生活组织。柏默(L. R.Palmer)也认为:“语言的历史和文化的历史是相辅而行的,他们可以互相协助和启发。”因此,语言既是创造文化、传播文化的重要工具,也是文化认同产生的重要载体。马克思认为:“思想、观念、意识的生产最初是直接与人们的物质活动,与人们的物质交往,与现实生活的语言交织在一起的。”即语言根源于现实世界,与人类的思想和意识具有密切关系,是认识世界的钥匙。只有通过语言的内在逻辑分析才能证明语言或思维与客观世界同构。语言文字兼具工具性与人文性,作为文化的基础要素、主要标志和传承媒介,是文化认同产生的“奠基石”。全球化背景下文化在“融合”和“互异”的共同作用下流动,既强化了部分主流语言的存在,也给某些国家的母语带来了冲击,甚至出现语言濒危现象,民族认同、文化认同面临断裂危机,各民族开始在文化霸权的冲击与垄断中不断追寻和构建本民族的文化认同,如法国的“文化例外”政策、韩国的“HAN Style”项目等。   

在维特根斯坦看来,“语言的重要任务是肯定或否定事实”。语言的规范与运用影响文化认同的内容、形式与立场。人们从社会演变发展的过程中总结出语言文字的产生、发展及使用规律并逐渐形成范式。根据规范化语言信息反映的客观事实、思想情感或观点概念等对信息进行判断与选择,进而降低或避免文化信息传输出现受损、分歧或失序的现象。不同文化的表象差异与深层差异都凝聚在语言上,实质是一种世界观的差异反映。语言的规范与运用能缩小差异所带来的影响:在内容方面如文化符号、历史记载和价值观念等;认同方面如事实认同、概念认同、情感认同和思想认同等;立场方面如个人立场与群体立场、民族立场与国家立场、普遍立场与特殊立场等。

马克思说:“语言是思想的直接现实。”语言的数量与质量影响思想文化认同的时间、范围与程度。作为思想文化的重要载体,国家通用语言文字是文化认同的基石。中国主张既要高质量推广国家通用语言文字,又要科学保护各民族语言文字,注重主体性与多样性的有机统一。当前,世界各国不断确立和巩固国家主体语言文字的地位与功能、维护世界语言多样性发展,增进国际文化认同,如日本《日语教育推进法》、法国《国际外语教育计划》、联合国《国际本土语言年计划》等。语言的数量变化正是社会政治历史文化发展的反映,语言的种类数量、通用数量、内容数量关系着文化认同的产生时间、范围广度、准确程度,而语言的质量通过人工评价反馈及数字系统判断,反映了信息的时效性、精准性、科学性等,也关系着文化认同的时间尺度、范围深度、高低程度。   

大语言模型正是以语言文本数据、模式和结构为基础,根据问题训练理解和生成人类语言。作为现代的罗塞塔石碑,大语言模型可保留世界各类语言符号的独特语法与词汇,推动人类思想文化交流与意义世界同构,强化语言文字范式在文化认同中的基础性地位。

(二)认同装置:语料清洗的拟合训练

信息技术是人类社会物质和精神文明演进的重要推力,为文化的传承、转化、创新与输出提供重要方法和手段,是产生文化认同的“助推器”。正如霍克海默等人认为,文化生产一旦与科技结合,形成产业体系,就会产生影响社会的巨大力量。基于Transformer架构的预训练语言模型(Pre-trained Language Models,PLMs)从第一代学习词嵌入、捕获词义到第二代专注学习上下文词嵌入,不断强化计算机的类人化语言交互和文本理解能力。得益于深度学习技术以及互联网海量的文本数据,NLP领域内大语言模型爆发式增加,如GPT-4、BERT、GalacticaLLaMA等。其主要的技术路径为数据收集、自然语言处理、深度学习、算法优化、模型评估及持续更新等,通过信息的输入、重组、输出反映思维建构,实现文化互动,在不同事物同一化的过程中重置文化认同。

美国学者认为,人不可能不进行交流,谈话都包含内容信息和关系信息,交流者将相互作用融入有意义的模式之中,人使用数码类比两种代码进行传播、相互作用中的信息配对与信息捕捉。大语言模型作为信息交流的重要工具,通过“把关人”角色将网页、图像、书籍、对话音频和文本等一般性语料和多语言数据、科技语料等特殊语料加以清洗和预处理,在保证泛化能力的情况下合理调节不同来源的语料,利用NLP技术将语料进行句法拆解、词法分析、语法运用、词句转换。基于自注意力机制(self-attention mechanism)的神经网络架构Transformer对大量神经元参数进行拟合训练,自主学习“语言的内在表示”,通过系统内部的反馈回路将信息整合输出并推动系统本身的进化,实现信息的有效传递、共享与交换,以作用的形式如语言、行为等表现出来。   

技术更迭使数据信息处理方式与性能转变升级,突破了人类文化发展的时空界限,对原有交往方式、思维方式、价值建构形成冲击。而人类在控制和通信中,一直与组织性降低及含义受损的自然趋势作斗争,亦即要和信息增熵趋势作斗争。大语言模型通过Hebb学习、纠错学习、记忆学习、随机学习、竞争学习等算法训练解决通用语言问题,如文本分类、问答、文档总结、文本生成及图片解读等,产生新的“元话语”,实现与外界信息等量或超量交换。同时,个体作为信息加工的主体,通过从人类的反馈中强化学习(Reinforcement Learning from Human Feedback,RLHF)机制将其纳入训练过程来增强学习代理的训练,这一过程中所馈进的系统外的信息使文化得以吸收新语料,实现新发展,也产生了更加具有专业性、针对性的大语言模型。随着模型迭代,未来也将产生更多开源的,具备多语言、多图像、多视频处理能力,能够与社会应用场景相结合的大语言模型和视觉模型,推动全球海量的文化资源整合并精准输出,使文化发展与时代发展、国家发展、民族发展相协调,形成更广泛的文化认同。

(三)认同增强:标注数据的回旋反思

信息全球化时代,文化认同是东西方文明交流过程中产生的价值失落感和自我反思的必然产物,它被迪尔凯姆称为“集体的良知”。在他看来,文化认同是民族和国家的一种心理活动,也是一种将不同地域的人们团结起来的内在凝聚力。“认同”(Identity)最初由埃里克森提出,在拉丁文中表示“同一事物、同一特性”,指在所有时间、所有场合,人和物都保持同一性。在语言基础、技术加成的前提下,文化认同受人们生活的社会环境、教育背景、价值观念等要素影响,经过对文化内容的对比鉴别、价值判断、自我反思进而产生意向性认识与同一性认可,是一种文化与价值归属的自我确定。在此过程中,主体的回旋反思能够使人们产生体认、模仿他人或群体的态度、观点和行为,推动文化升华并回旋成个人人格的一部分,实现文化的塑造作用,是文化认同产生的“增强剂”。   

主体的回旋反思能够更好地回应自我意识和对象意识矛盾的问题,这是文化认同的核心问题。文化认同涉及一种比较性思维,本身暗含了一个主体的理解和自我理解的辩证法,它们力图围绕或通过他者来重新界定自我。大语言模型下,西方文明的冲击更为明显,ChatGPT在信息交流中的话语导向、地域歧视、性别或种族歧视、文化偏见等问题不断暴露,以英语为主的语言偏见尤为突出。在既定文化阈限、文化秩序被打破的当下,受大量信息“裹挟”的人们面对“认同危机”时进行自我反思能够帮助自身采取自我抽离视角,保持心理距离,客观审视、分辨、思考信息内容是否符合“主观认知”抑或“共有认知”,是否属于“自我认同”抑或“普遍认同”,是否具有“特殊价值”抑或“共同价值”等。通过自我反思对事物存在的认识进行选择,从直接性认识上升到间接性认识,形成个体文化认同,或进一步肯定普遍统一的价值标准、生活理念等形成群体文化认同。

主体的回旋反思能够更好地强化文化自觉、明确认同状态,是文化认同的必要内容。费孝通先生说:“文化自觉只是指生活在一定文化中的人对其文化有‘自知之明’,明白它的来历,形成过程,所具有的特色和它发展的趋向……自知之明是为了加强对文化转型的自主能力,取得决定适应新环境、新时代时文化选择的自主地位。”文化自觉和文化自信是文化认同产生的前提。在使用大语言模型的过程中,RLHF机制中利用人类标注数据对机器进行有监督训练,通过人类与机器互动学习,无论是正向信息的强化,还是反向、偏向信息的干扰,主体的反思行为都能够使人类把“不同的表象把握在一个意识中”,对信息的确定性进行自我抽象并发现其固有的内在逻辑,进而准确辩证看待和强化文化自觉。同时,基于玛西亚的认同状态研究,主体反思能够促使人们识别信息,确认认同状态为“认同达成”“认同延缓”“认同拒斥”或“认同混乱”,针对不同情况调整信息反馈,以便大语言模型进行自我学习、改进,输出新的文化信息。

密码塑局:基因的凹凸与构序

新技术革命的时代,基于地域、历史、民族、宗教差异的各国文化因经济、科技实力的影响受到不同程度的冲击,同时,西方国家的普世主义加剧了文明间基因凹凸的冲突,但越来越多文化类同的国家逐渐走向合作,共同维持全球政治的多文明特征。深植于历史和文明根基中的文化认同正是建立合作的关键桥梁,是个体之间、个体与群体之间以及由群体所构成的民族国家所共同传承及建构的文化理念、思维模式及行为规范的同一肯定。人们对于信息反映的文化认同态度是赓续文化基因、牢固文化情感、推动文化实践的核心力量,大语言模型则为信息交换向信息重新构序提供跨界的技术支撑。

(一)认同塑形:储存、过滤、整合的阶递

大语言模型作为信息“储存器”,实现文化基因的价值延续。文化基因(meme,“mimeme”的缩写)最早由英国生物学和行为生态学家R.道金斯(Richard Dawins)在《自私的基因》中提出,将人类与其他生物的独特性归结于“文化”,阐释了文化是具有基因色彩的独特遗传因子,能将长期积累的共识在个人或群体中不断传承延续下去,人们通过自身积累和模仿获得遗传性特质密码形成文化基因。文化基因源自人类生命在文化系统中绵延存在的基本理念、习惯和模式,具有遗传性,通过人类语言文字表达并因自然环境、社会环境变化而更新换代,实现文化延续。个体或群体根据元始文化认同将大量来自跨时空、超国度、多学科等蕴含着各类文化因素的多元信息进行初步筛选、整合并传送至大语言模型,使其成为一定意义上的文化基因库,通过基因复制、选择与重组形成新的信息流,进而实现文化基因的长期储存、横向传递和延续发展。

大语言模型作为信息“过滤器”,推动文化基因的融合或裂变。“因素因子论”强调,不是所有文化因素都能成为文化基因,但文化基因必须在文化因素上构造。文化因素通过语言文字信息表达,是构成文化基因的根本要素。符合当代主流价值观的文化因素是文化基因生成的基本条件,文化认同则是筛选文化因素的重要前提。在大语言模型中,以语言文字信息为载体的文化因素需经过三轮筛选。首先,基于群体文化认同将从互联网上抓取大量文本创建基础的、最大的语料信息,经清洗、筛选后形成训练语料库及相应“黑名单”;其次,根据个体文化认同与集体文化认同相结合的方式,利用RLHF机制中人类反馈信号进行信息修正,优化语言模型;最后,大语言模型接收信息的群体依据个体文化认同筛选与当代文化相适应、与现代社会相协调的文化因素并使其作用于个体本身,基于基因遗传存在的变异性,文化基因在文化因素的作用下实现融合或裂变。   

大语言模型作为信息“整合器”,形成新的文化基因复合体。有学者在论及构成人类文化基因的四种“碱基”,即本能文化、权能文化、智能文化、类能文化时,强调了四种文化所蕴含的“四种能力”及其“内在生命力”,通过内在动力进行自我催化、合成层层进化,体现了文化基因甚至整个社会系统的进化过程以及文化认同的产生过程。另一方面,文化相对主义的核心是尊重差别并要求相互尊重的一种社会训练,文化基因通过大语言模型进行模仿复制、选择融合的过程也是文化相对主义的一种表现。由此可见,文化的发展创新本质上是文化基因与文化认同相互作用的结果,尽管不同文化基因间存在着不可通约性,受其影响下的文化认同合理性有限,但在文化基因繁衍的过程中,大语言模型的训练作用使文化基因在文化认同影响下持续传输、扩散与整合,推动文化基因融合强大并产生可超越时空界限的、新的文化基因,形成广泛意义上更具合理性的文化认同。

(二)认同图谱:情感、理性、思维的优解

文化认同深化情感体验反馈指导工具设计。大语言模型的研究与发展为全球化时代文化多样性与差异性造成的文化对话、文化耦合困境提供了有效途径。用户在与产品交互时,发挥作用的不只是产品的可用性和易用性,还有情感体验,它支配着人们的行为模式。人们使用大语言模型时的情感体验主要来源于信息反馈的质量与效率,但随着工具功能迭代升级、高质量数据训练与规模效应的形成,文化认同通过文化的感召力、吸引力和影响力加深使用者对信息内容的理解、情感体验并深化认知观念,同时加强对工具的认可度、辨识度。针对大语言模型市场中目前出现的同质化现象,文化认同由一元向多元的转变使人们在使用工具时更加注重相通的文化认知和情感体验,在强化人类主体性的同时,也为未满足人类思想活动和感知体验的产品提供了反馈与改进方向,指导产品的创新与再设计。   

文化认同引导技术过滤与价值浸润的统一。当前大语言模型已能够应用于聊天机器人、计算生物学、编程、创作、法律、医学、推理、心理学、合成数据等领域,关于技术批判和质疑也随之产生,基于“信息茧房”和“回声室效应”的负面影响,帕利泽提出的“过滤气泡”(filter bubble)更是强调了信息过滤对用户的影响,指出算法通过了解用户偏好进而过滤异质信息,在为用户打造个性化的信息世界的同时构筑“隔离墙”,阻碍多元化观点的交流。在结果导向、算法影响、信任心理等因素的共同作用下,人们在使用工具时更注重工具理性并造成一定的信息窄化,文化认同通过对人类社会的、历史的、政治的多领域多视角多层次文化进行系统性认同构建,使人们在使用工具时更加关注信息内容的多样化、多元化及全面化,突破工具主导的制约,进而实现技术过滤和价值浸润相协调。

文化认同推动人机交互思维的转变与进化。黑格尔认为,“人的一切文化之所以是人的文化,乃是由于思想在里面活动并曾经活动”。人机交互的本质是共在,即把人的思想、优点、需要与机器的理性、功能相结合,将人们产生的信息转换为计算机能理解的数据。近些年人机交互领域的发展使机器思维由被动式转为主动式,可主动识别、准确判断用户意图并生成最优解。动态而多元的文化认同在人类进行思想活动和社会情境交互的过程中形成并发展,使人的联系性思维、辩证性思维、发展性思维产生了内生式发展,文化异质排斥更多地转化为异质相容并作用于大语言模型的训练结果。同时,大语言模型输出信息的真实性、合理性、可信度对人类逻辑思维、批判思维及循证思维等也有所影响。未来人类将基于最广泛的文化认同建立与交互情景有关的知识图谱,形成关于人、物、环境的整体认知,计算机模型通过感知到的信息及时更新实时图谱甚至主动交互以确认推理结果的可靠性,在互动的过程中使人机交互思维得以丰富和发展。

(三)认同向量:动能、势能、热能的转生

文化认同推动信息动能、势能、热能转换,传递并扩散信息能量。信息的流动性及不同语料的信息载量差异是信息能量传递的基本前提,因此信息存在动能、势能、热能之间的转化。当两节点的信息存在势能差,则会向邻居节点进行传播,两节点之间处于传播运动状态,此时信息能量全部转化为信息动能,信息到达节点并进入静止状态后,信息动能将转化为信息势能。热点信息具有热能,可快速转化为传播的动能。从实质上看,文化认同存在于不同文化信息的交换过程中,也是信息动能、势能与热能相互转换的结果。广泛的文化认同必定基于自身的文化自觉和自信,建立于长期、巨量、高质、高热度的信息交换之上。在大语言模型中,存在不同时空、领域、类别的信息能量转换,而文化认同是个体对多元化信息能量进行判断的潜在标准,能够推动信息能量转换以便吸收、重组并建构新的文化认同,同时也推动信息能量传播效能最大化,促进全球文化共同体发展。

文化认同加强类反信息与寄生信息阻截,防止或清除信息负能量。由于网络信息的复杂多样,大语言模型的训练数据集中可能存在部分被嵌入的类反信息,如具有语言、性别、地域或种族偏见信息、宗教引导信息或政治诱导信息等,以及寄生信息,如钓鱼信息、赌博信息、色情信息等依赖于正常信息网站的非法信息、虚假信息等,对模型训练产生干扰甚至负面影响。对此,文化认同一方面是关于国家、政治层面身份认同、归属认同的问题,另一方面是关于社会层面价值观、种族认同的问题,它能够帮助个体判断类反信息与寄生信息,并在人工标注的过程中及时反馈、更改或阻截,基于修正后的标注数据再通过强化学习推动模型进行微调,进而直接改变模型决策的边界,消除负能信息并提高数据信息的准确性。   

文化认同激发信息内生能量的增生,促进能量循环新陈代谢。信息再生(information regeneration)是为了提高信息质量和效用而利用信息技术和科学方法对原信息进行再加工、处理进而产生新信息的过程,也是信息产生内生能量的过程。由于信息在能量转化时受个体理性排斥力和社会舆论场力的作用会消耗一定信息能量,并随传播链的延长而逐渐减小,因此,信息再生的能量对于弥补能量损失、促进能量循环及新陈代谢至关重要,文化的自为性也使其在人的对象化活动中不断超越和创造,推动信息的再生产。信息的再生产使信息加速传播、扩容、扩散,将引起主题升级、性质变化及结果转向,最后信息的能级与影响力越来越大。大语言模型的信息对话与输出过程是信息再生的重要环节,广泛的文化认同可以强化信息联系、催动信息再生,促进内生信息的信度、效度及传播速度的提升,进而维护信息能量循环、更新,充分发挥信息的长尾效应,同时,信息空间流通的“巴尔干化”问题也将得到进一步解决。

反冲破局:视界的扩域与映射

安东尼·吉登斯指出,现代世界信息技术的发展打破了现实中时空的限制,社会系统的“脱域”使社会关系和信息交流从地域性关联的互动中脱离,在无止境的时空跨度中重构,同时为它们的重新进入提供机会。知识计算时代,大语言模型的发展加速了社会脱域,海量信息的碰撞交融使文化发展呈现易变、不确定、复杂及模糊的VUCA(乌卡)时代特性,文化认同也因外部环境变化、文化交流等因素影响而处于不断被建构、更新和完善的过程中。在此背景下维护和强化文化认同具有必要性和迫切性,可从认知、算法、场景等方面突破文化认同的视域与境界,推进跨文化共容共融,为构建人类命运共同体凝聚价值共识。

(一)认知扩展:延拓文化符号时空界域,促进语义增殖与认同再造

加快文化基因储存、信息标识转化,推动文化认知理性融合、见长见广。文化在本质上是人类的一种完善,每种文化存在都具有特定的文化基因与文化范式,其历史演进也是人类意义世界的生成过程。在大语言模型发展下,客体文化突飞猛进,而人却越来越没有能力从客体的完善那里获得主体生命的完善。搭载文化基因的语言文字是完善主体精神的关键要素。通过语言文字数字化、信息化能够延续文化基因的特质,置换传统客体文化的存在方式,实现文化形态的转型并增进文化主体化。同时可突破时空的“约束性”,把基于原子物理的二维储存挪移到数字虚拟空间的“赛博空间”。一方面加快将有形的物质文化与无形的精神文化结合转化,实现文化从二维到三维的转型,如地理与历史信息结合、物质与非物质文化遗产结合、平面文化符号与抽象文化符号结合等;另一方面加强元文化与异文化的结合转化,实现文化基因溯源、融合及衍生,如原创文化与派生文化的结合,古语言古文字与各族语言文字、网络新词新语的结合等。通过完善数据采集规范,强化汉语的元数据获取,建立格式完善的全球化数字语料库,实现文化基因跨时空延续,推动文化标识扩散、认知拓展,奠定文化认同的发展基础。   

加强文化本源认同、意象感知构拟,推动文化情感价值抽绎、文本升格。人与文化最初是制造和使用工具意义上的工作人与工作文化,后来文化世界逐渐由工作世界拓展到衣、食、住、行等生活世界。本源文化与工具意义上的大语言模型发展为正相关,体现着人类与物质世界本质的关系,是文化认同产生的根源,语言文字与本源文化的结合可美化文化意象,深化文化情感。一方面,加强文化溯源意识,理解构词逻辑,将多义语音、语法、词汇的用法信息转化为数字符号作为语料进行训练,根据实际应用场景模型判断生成适意语言;另一方面,加强文化意象联结构拟,使大语言模型根据语境、图境、影境转换词语表达,如电影《Mr. Holland’s Opus》通过将人物文化意象进行拟物化、与中国本源文化相结合后译为《春风化雨》,运用比喻手法使语义增殖且更加饱满富有情感,通过对文化意象的补充、润饰与重构使语言文字更具归属感、代入感,使文化情感深化认同、指导实践。   

加深文化宇宙观念、价值内驱耦合,推动文化意志理性建构、认同再造。在过去,人类文化基本围绕现实世界、内心世界产生,如今虚实相融的数字生活方式使人类文化更多地在融合世界变革中发展,加剧主客观层面的信息摩擦。数字个体在进入数字技术所建构的虚拟空间中,当其无法快速适应或过度依赖虚拟建构的情境时,便会产生一种自我发展受到威胁或原生秩序受到扰乱的感知。正如格奥尔格·齐美尔在文化悲剧论中指出的,主观文化和客观文化始终处于冲突之中,但客观文化的急剧扩张令人的精神生命对其存在只能产生有限消解。一方面,建立大语言模型与文化宇宙的联结探索,挖掘大语言模型为人类文化活动的元宇宙能够提供的语言通道、信息渠道及类人体验,如利用大语言模型模拟数字人的仿真对话、虚拟人的创造对话等,消解主客体之间的对立关系;另一方面,挖掘文化宇宙为大语言模型的链接、论证所能提供的内容、形态及技术空间,如数字藏品创作、制造或艺术层面一维向三维形态转换等。在文化宇宙观与大语言模型的融合中突出政治、民族、国家文化认同要素与人的主体作用,深化文化自觉自信,以文化价值推动文化内驱力发挥作用,进而塑造群体的文化意志,指导认同产生、更新与再造。

(二)算法扩容:强化文本多头注意机制,推动信息提质与认同增量

在信息处理层面,可从数据开源、文本精调和计算训练三方面提升文本准确性、可信度,进而增加文化认同。一是要加强数据采集,优化训练方案。现有大语言模型如通义千问、盘古PanGu-Σ、HunYuan-NLP 1T(混元)训练参数已达万亿级,但根据模型Llama2测算显示,即使在对2万亿个token(词符)进行预训练后模型仍无饱和迹象,未来仍有较大提升空间,因此仍需长期大量的数据投喂训练,同时需调整训练方案减少训练损失,降本增效。二是要突破长度限制,强化精调训练。Llama2预训练模型目前已能达到4096字符,可处理更多信息,且针对聊天的Chat模型精调训练数据超过100万人类标记数据,提高了词符的预测准确率。这为大语言模型中文化信息的精准输出、文化认同的扩展深化提供了更简便高效的途径。三是要提升训练速度,突出信息关注。通过混合精度训练(Automatically Mixed Precision, AMP)、提高硬件性能或增加运算设备等方式优化模型训练速度,减少显存占用并提高数据传输性能与文本信息处理速度;同时充分利用多头注意力机制(Multi-Head Attention)捕捉计算文本中的多种相关性,聚焦高相关性词语,使文本输出更精准高质且更具针对性,促进认同生成。   

在信息反馈层面,可从监督微调、人工标注、强化学习三方面提升模型帮助性与安全性,根据人类偏好提高文本质量及期望输出,进而增加文化认同。一是加强特定指令训练,调整模型输出。目前针对大语言模型的小样本学习(Few-shot Learning)和零次学习(Zero-shot Learning)的研究日渐增多,通过简单提示得出期望输出,因此可编写目标文本训练集合训练模型,加强发布正向文化指令,调整修正文本输出,进而减少或防止文化偏见及刻板印象。二是加强人类反馈,标注实时信息。通过提高数据标注员数量与文化素养对数据集进行实时有效标记与标注,并对标注数据进行审核、校对、统计和管理,保证标注数据的质量和准确性、时效性,推动模型实现高效学习、精准预测和动态更新,减少模型失调行为导致的不符合预期的输出结果。三是加强学习算法,优化参数减少偏差。通过优化模型中目标函数的奖励机制与惩罚机制,增强学习循环并缩小与人工值的差距,得出更符合人类需求和认知的结果,主动适应泛化场景。基于模型的问题反馈、自我调整和优化,使人们在人机交互中更易扩展和深化文化认同。

在信息测评方面,可从模型评估、实时评价、定制评估三方面精准判断模型认知能力,根据结果帮助使用者选择适合模型并得到精准输出,有效提高文化认同。一是优化评估方式,完善评估类型。为了充分评估LLMs认知能力水平,目前引入了一种新的评估模式——计算机自适应测试(Computerised Adaptive Testing, CAT)。通过建立自适应的、高效的评估框架优化测评,扩大和提高人们对于模型文化认知水平的认同。二是改善模型局部编辑,增强实时检索测评。信息的滞后性是现有多数大语言模型的主要问题,而文化随社会发展处于不断创新创作之中,由于资金、技术、人工限制模型无法全部实时更新,因此可通过设计模型局部创新实现部分实时更新,并对模型进行实时测评,更新数据和认知水平的评估结果。三是强化定制评估,建立标准题库。通过建立标准文化测试题库检测模型基本认知,防止出现文化偏差或与主流价值观不相符的文化认知,及时处理改进模型,同时通过专业性题库测试判断大语言模型的优势领域,提高文本输出的类人性、针对性、时效性,进而增进文化认同。   

(三)场景扩建:激活语言模型赋能生态,增强轨制效能与认同转化

在生活场景中,大语言模型的跨语言、多模态、轻量化发展促使数字技术赋能商业、汽车、医疗、法律、金融等重要领域,如法律领域的大语言模型“智海-录问(Wisdom Interrogatory)”、金融领域的“无涯”,医疗领域的“Med-PaLM 2”等,广泛应用于知识问答、文本创作、序列建模、司法案情分析、政策和研报分析、临床信息提取等方面。当下政务、文旅、交通、物流等行业需求也较为突出,如政务领域能够执行关于政务文本分类、政务问答、政务命名实体识别、舆情风险识别等功能的语言模型需求较为迫切。此外,在政治安全议题中关于网络政治参与、智能评价体验、虚拟空间主权占领等也是现代政治发展的需要。文化是社会存在与社会意识之间交互作用的结果,基于大语言模型广泛应用中的高需求量、用户量和信息量,人们强化了在现实文化世界的深层体认,推动群体文化认同在实践中转化,于同一性中发展并在斗争性中把握同一性。

在学习场景中,大语言模型广泛应用于学生教育教学、学科专业学习、心理健康辅导、计算机培训培养、图书馆管理等实践当中。如教育类大语言模型“子曰”,可用于问答、翻译、虚拟人口语教练、AI作文指导、语法精讲、AI Box六大方面。在心理领域,SoulChatSMILE等项目发布了具有共情和倾听技巧的模型“SoulChat”及“MeChat”,可提供人性化的、情感敏感的响应,有效提供情感支持对话、精神健康咨询,并具有良好的共情和倾听技巧。此场景中存在大量的信息交互与强化学习,开发空间和潜力巨大,是文化传播、交流和发展的重要场域。作为一种社会实践和社会生产,文化可在大语言模型的学习应用中表达和构造人类与世界关系的丰富内涵,在生产和实践中实现文化认同的转化和深化。   

在虚拟场景中,当前大语言模型主要集中在电商、数字人领域,未来在元宇宙空间、数字生命等场景中仍有较大市场空间,如历史场景可视、艺术作品可诉等,可进一步推动文化储存、传播方式的优化和转型,从视觉、听觉、感觉等方面增进文化认同。总之,大语言模型作为文化认同生成、深化和发展的重要工具,在文本输出、技术针对及模型应用中能够从认知上、情感上、实践上推动人们产生更多的文化认同,但我们也不应忽视首例“AI文生图”著作权案背后反映出的模型使用中存在的隐私和知识版权问题、制度保障问题、舆论操控问题等。因此,我们更应始终保持人的主体性,将人的创造力、判断力和价值观置于文化认同发展的核心地位。正如里德·霍夫曼所说:“我们必须始终坚持将GPT-4及其后继者视为我们的协作伙伴,而非替代品。”

结 语

马克思指出:“没有希腊文化和罗马帝国所奠定的基础,也就没有现代的欧洲。”今天欧洲人的整体认同意识本质上是对希腊文化的认同。文化认同是一个国家或民族核心价值观的重要体现,反映了文化的主体性自觉和历史意识。大语言模型内在具有强烈的意识形态逻辑,对语言洼地下的文化认同形成巨大的高频脉冲。中国道路是坚持文化自信、守护文化安全、推进文化认同的道路,是充分把握新技术革命机遇包括充分发挥大语言模型功能的道路。利用大语言模型的发展机遇,深刻把握其文化认同的局域范围,是推进国家认同、道路认同、制度认同、文化认同的重要前提。

*本文系国家社科基金重大项目“当代科技领域道德问题研究”(项目号:22&ZD044)、国家社科基金重点项目“人工智能自我意识的可能性及其伦理问题研究”(项目号:21AZX017)的阶段性成果。

▼点击下载原文电子版

· END ·


责任编辑 | 冯   潇

微信制作 | 静   姝

图文初审 | 丁惠平

审定签发 | 赵   涛


本文原载《江海学刊》2024年第3期,参考文献及注释参见本刊原文,欢迎转发与授权转载。如需转载请留言或联系025—85699971,联系人:胡老师。


声明:图片部分来源于摄图网,已获平台授权,转载请注明来源!


 ▼往期推荐▼

政光景 吕鹏丨生成式人工智能与哲学社会科学新范式的涌现


杨继文丨元宇宙证据:证据属性与适用规则


欧阳友权丨ChatGPT与网络文学的未来


孙伟平 || 人工智能与人类命运的哲学思考

江海学刊
《江海学刊》自1958年创刊以来,始终以“办传世名刊、载精品力作”为宗旨,执著追求“新颖、深邃、凝重、厚实”的办刊风格,组织学术讨论、引领学术争鸣,现已成长为展示江苏省哲学社会科学整体形象的重要窗口、国内人文社会科学对话与交流的高端平台。
 最新文章