曾军人工智能与AI人文研究专辑 | 曾军:算法阐释:人工智能时代的文论问题

文摘   2024-10-09 08:30   北京  

点上方中外文艺理论与文化研究” 可订阅哦!

“中外文艺理论与文化研究”由中国人民大学金元浦教授创办,杭州师范大学文化创意与传媒学院柴冬冬副教授任总编辑。本平台旨在传递国内外优秀文艺理论、美学、文化研究等领域的成果,搭建学术交流的平台。我们热烈欢迎广大读者订阅及赐稿!

以下文章来源于元浦说文。

文章来源:北京大学影视戏剧研究中心

选自《华中师范大学学报(人文社会科学版)

2023年第5期


算法阐释:
人工智能时代的文论问题

文 / 曾军

上海大学教授




摘要
ChatGPT和“文心一言”为代表的大语言模型展现了“AI生成”的巨大潜力。通过算法进行运算是计算机编程语言与人类自然语言的根本差异,这也是理解人工智能的重要维度。把算法引入文学研究,一方面需要理解算法背后的逻辑,另一方面还要理解文学研究自身不断“数”化的进程。文学研究对与算法相关议题的关注由来已久。20世纪80年代的“方法论热”不仅将与人工智能相关的控制论、信息论等作为重要的科学基础和思想来源,而且开始尽可能调用已有的文学和艺术资源,试图实现对“三论”中的观点和方法的文学化和美学化征用,这构成把算法引入文学研究的理论“先声”。研究算法阐释有两种路径。其一是将算法作为对象,通过辨析算法的运行逻辑及执行过程来与文学创作和文学研究的活动相比较,进而讨论以作为对象的算法阐释有何特点。基于20世纪以来西方文论相关理论思维,可以将算法作为对象的阐释命名为“人-机互动”的“可写阐释”。其二是将算法作为方法,通过对算法的数据处理能力的应用及其任务实现效能的评估,为文学研究这一此前纯粹属于精神生产领域的活动赋能,进而提高文学研究的效能。“数字人文”(“人文计算”)便是对这一辅助性方法的命名,且已经经历了近90年的发展。进入人工智能时代之后,文学研究有可能实现对文学意义的“总体阐释”。


      近年来,以ChatGPT和“文心一言”为代表的大语言模型先后横空出世。它们因具有了通用人工智能的某些潜能,而令几乎所有人文社会科学及自然科学研究者感到前所未有的冲击。其实ChatGPT和“文心一言”只是全世界数以百计的各类大模型中的一种。根据《中国人工智能大模型地图研究报告》显示,仅2021-2023年短短两年间,中国就自主研发了79个大模型,不仅有大语言模型,还有视频大模型、多模态大模型等。它们都聚焦“AI生成”领域,提供文本生成、图像生成、声音生成、代码生成,以及多模态之间的相互生成的解决方案。语言是人类思维的工具,经由“AI生成”的文本、图像、声音和程序直接“入侵”了人类精神活动最核心的领域,并开始表现出知识生产、艺术创新和思想重构的巨大潜能。
“AI生成”技术的出现带给人类的震惊及对未来的恐惧令每个人文学者被迫思考一个重要的问题:我们是否会被替代?在科技与人文的交锋中,人文学者一直处于弱势的、被动的、防御的地位。然而,作为正在进入人工智能时代的人文学者而言,简单的拒斥和回避是无济于事的。我们只有了解“AI生成”的技术与人类此前从事精神活动和艺术创作的手段之间的异同,才有可能较为深入地讨论“AI生成”给人文研究带来的影响。因此,将算法引入文学研究,实质上是对“AI挑战”的一种回应:人工智能时代文学研究将呈现怎样的新面貌?由此会发生怎样的研究范式转换

一、未来已来:算法逻辑及其被理论化的可能

将算法引入文学研究,一方面需要理解算法背后的逻辑,另一方面还要理解文学研究自身不断“数”化的进程。只有这样,才能实现算法的理论化。

计算机编程语言和人类自然语言的区别,根本在于算法。所谓“算法”,指的是一系列解决问题的步骤和指令集。它是一种能够被计算机程序所实现的、有明确规定性的计算过程。算法包含着一系列环环相扣的步骤,每个步骤又包含若干指令来规定着其任务的执行方向。根据最新统计,全世界的自然语言有7000多种,那么编程语言有多少种?目前为止还没有标准答案,但根据估算可能存在几百种编程语言。将人所使用的自然语言与在计算机中运行的编程语言进行对比,可以发现,编程语言中没有语音学、语言习得相关问题;与自然语言中存在语言的变异与演化类似,编程语言也有语言历史学、语义学、语法学、语言类型学、语言标准化相关的问题。唯一一个在自然语言中不存在,而在编程语言中存在的,就是算法。所以算法事实上是理解编程语言的过程中最重要、最特殊的内核。

从计算机到人工智能,算法经历了从“计算机辅助算法”到“AI辅助算法”的演变。所谓“计算机辅助算法”是非人工智能的,这其中人是算法的设计主体、任务主体,计算机则是算法的执行主体,二者间界限分明。“AI辅助算法”则与此不同,计算机不仅是执行主体,而且拥有了自我学习能力,进而拥有替代部分人的设计能力和任务能力,具有自主执行能力。ChatGPT的使用证明,人工智能的算法能够处理不确定性的信息,它具有数据驱动的模型,因而具有很强的适应性和自适应的能力。这里还存在人工智能专家也无法完全理解的算法黑箱问题。也就是说,人们并不太清楚算法到底是怎么实现既定的任务和目标的。最新的研究显示,OpenAI的设计师正在用GPT4去理解GPT3.5的运行,希望通过高级人工智能去理解低级人工智能,以破解黑箱的奥秘。要理解算法背后的逻辑需要从算法的技术原理和一般规律的角度出发。首先,算法种类多样,所有的算法都是为了实现特定目的而被制造的。如为了解决排序问题而设计的快速排序算法,为了解决最短路径的问题而设计的Dijkstra最短路径算法,为了挖掘关联规则而设计的Apriori算法等。其次,每一个有特定目的的算法都有特定的数据结构。如快速排序算法的数据结构是数组,Dijkstra最短路径算法的数据结构是加权有向图,Apriori算法的数据结构是事务数据集合等。最后,每个算法的执行过程也不一样。比如快速排序算法的执行过程就是先选取一个基准元素,进而将序列中小于基准元素的放左边、大于等于的放右边,最后再用递归处理两边的序列。Dijkstra最短路径算法的执行过程是首先将所有节点之间的距离初始化为无穷大,将起点的距离设为0并加入访问集合,进而更新起点与不同节点之间的距离并将其加入访问集合,最后通过不断重复上述过程,直到所有的目标节点加入访问集合或者待访问集合为空。因此,根据任务的不同,便会设计出不同的算法,如排序算法、搜索算法、图形算法、计算几何算法、加密算法、优化算法、机器学习算法、深度学习模型、神经网络、梯度下降算法等。简言之,算法首先要去理解其目的是什么,即要解决什么问题;然后理解数据结构、运行规则、执行过程分别是什么;最后还要问的是,这一算法是否有效。

怎样把算法引入文学研究?这需要实现自然语言的文学和编程语言的算法的“双向奔赴”。事实上,文学研究也经历了不断地被“数”化的历程。

第一阶段是指“数学化”,即用数学中的计算方式来理解文学。在《中国叙事学》一书中,浦安迪发现中国古代的四大奇书里有一个非常有趣的奇书文体的结构现象。他概括为“十回”的主结构,即百回的小说都是以每十回为一个单元,从而构成了十乘以十的叙述节奏。“十回”的主结构里又存在“三、四回”的次结构,也就是说“三三四”“三四三”或“四三三”的结构模式。这就是浦安迪从数学角度对四大名著早期版本所做的研究。从这里可以看出,数学化过程有助于以一种抽象化的方式来理解文学文本的特有规律。

第二阶段是“量化-统计化”,即不仅将各类文学现象量化,而且还用统计的方式实现对被量化的文学现象的规律性分析。中国古代文学研究学者陈大康是数学专业出身,他即是以数学的数理思维研究包括红楼梦在内的中国古代文学。他的博士论文《通俗小说的历史轨迹》就是用统计学的方法,对明清通俗小说的内容进行分析,辨析小说所反映的思想内容和形式风格。陈大康统计发现,明清通俗文学创作中,演述宋代的作品最多,达到了93篇,演述元代的作品为19篇,演述嘉靖朝以来的作品则相当少。这就是通过具体的量化分析,以统计学的方法所实现的文学现象分析案例。又如,美国学者丹尼·辛尼金(Daniel Sinykin)在其《经济学、种族和美国战后小说:一部计量文学史》一文中绘制了两幅图。图中,横轴为出版时期,纵轴为平均的经济程度,左幅为黑人作家,右幅为白人作家,实线圆点为黑人女性,虚线三角为男性作家。从大数据的角度去比较这两幅图中1950年到2000年间黑人作家和白人作家、女作家和男作家受关注度的差异。图表显示,白人女作家的受关注度基本保持不变,黑人女作家则在不同的时期受关注度不一样,呈明显的波浪性分布。这说明,大数据可以辅助特定的经济学、种族问题与文学的关系研究。

第三阶段,也就是现在所进行到的“数字化-数据化-向量化”阶段。所谓“数字化”其实就是将纸质的文本变成了数字形态所能够识别的文本,使其得以在互联网上传播。“数据化”则是进一步赋予被数字化的文本元素以特定的权重,形成可以进行检索与分析的数据库。到了人工智能的“向量化”阶段,文本所负载的位置标签、被赋予权重的各类数值越来越多,影响大模型运行的参数也越来越多。这一阶段文学“数”化的典型代表就是“AI生成艺术”的诞生。无论是“AI写作”还是“AI绘画”“AI音乐”以及“AI影视”,越来越多的人工完成的创造性活动被人工智能所替代。从前几年人工智能诗歌写作工具微软小冰和“九歌”的出现到现在以ChatGPT、“文心一言”为代表的“AI生成”技术的兴起,预示着人工智能开始从“专家人工智能”向“通用人工智能”的过渡。

通过对算法背后的逻辑以及文学“数”化进程的理解,可以实现计算机与文学分析之间的某种结合,从而为建构一种“算法阐释学”提供某种思路。在《真理与方法》中,伽达默尔提倡从游戏的角度去理解艺术作品,认为只有遵守游戏特定的规则,主体才能成为游戏中的人。因此,阐释也是要在这种特定的规则范围里展开讨论。美学和阐释学也有这么一个过程,所以伽达默尔提出“美学必须被并入到诠释学中”,即要纳入到相应的规则系统之中。套用伽达默尔的表述,以ChatGPT和“文心一言”为代表的人工智能技术正在创造一个全新的精神世界。它以“游戏”的方式,以“自由创造”的理念,以“与现时生命的思维性沟通”为特征,提出了重新展开对审美意识与历史意识批判的艺术真理的问题。换言之,人工智能技术提出了一个新的诠释学的使命。这一新的诠释学使命可以被命名为走向文论的“算法阐释”。


二、往事回首:“前”人工智能时代的“方法论热”

文学研究对与算法相关议题的关注由来已久。因此,在正式进入人工智能时代的文学阐释问题之前,还有必要对人工智能对人文领域的影响做一个历史化的梳理。这里最值得关注的就是20世纪80年代中国文论中的“方法论热”现象。

“方法论热”主要是指20世纪80年代发起于哲学领域尔后迅速向其他人文、社科领域滋生蔓延的研究方法讨论热潮。1985到1986年是方法论研究的爆发之年,因而1985年被称为“方法年”,1986年被称为“观念年”。其中最核心的就是“新”“老”三论的兴起,即以“老三论”为代表的系统科学理论引入人文研究尤其是文学研究。所谓“老三论”,即系统论、控制论和信息论;所谓“新三论”,即耗散结构论、协同论和突变论。“老三论”和“新三论”对文学研究的影响并不一样,前者的影响大于后者。就“老三论”内部而言,系统论、控制论和信息论也是从不同层面影响文学研究的。系统论从原则上为文学研究提供整体性、系统化的框架。因而,系统论往往是在文学的基本原理、文学研究的体系框架上产生影响。童庆炳的《文学概论》从文学活动开始,并将艾布拉姆斯的“文学四要素”作为提纲挈领的框架,这在一定程度上是受到了系统论思想的影响。控制论与信息论对文学研究的影响则带有碎片化的特点。换言之,某些学者只吸收了某些基本概念,继而将之横移到文学研究中来。整体而言,“新三论”并非“老三论”的替代,而是对后者的补充和延展,“老”“新”三论均非一般意义上的自然科学学科,而是其中的“横向科学”,在科技哲学或者科技观念的层面对人文社科研究产生影响和启迪。因此,与其说是“方法论热”不如说是“科学观念热”。

“方法论热”在文论和美学领域产生影响。1986年,黄海澄所著的《美学原理》的副标题即是“系统论、控制论和信息论”,在书中黄海澄明确提出“老三论”是本书重要理论参考。黄海澄本人曾言:“本书主体部分的初稿写于1980年秋冬”,这意味着“三论”早在改革开放之初就产生影响,并且不是文学简单地受到哲学影响,而是文学与哲学几乎同步受到“三论”的影响。那么,为什么1985年到1986年是方法论研究的爆发之年?对此,黄海澄在书中直言:“现在学术气氛变了”。所以,“方法论热”其实不仅是指发生在某个特定年份的事件,它的影响贯穿了整个1980年代这一时段。黄海澄的《美学原理》共十五章,与控制论直接相关的就有八章;其他章节偶有涉及系统论,而信息论则被放在附录中。因而,此书与其命名为“三论美学”,不如命名为“控制论美学”。这一现象也证明“老三论”对文论和美学的影响并不是等价的。其中,系统论具有研究的指导性意义,即它更多体现在“原则”“思维”“起点”等宏观方面;控制论具有研究的实践性意义,即能够具体落实到美学和文论的中观层面,与具体问题结合起来;信息论具有研究的认识论意义,即能够将文学文本转化为信息,引入编码/解码、输入/输出、处理、反馈等认识的微观过程并描述出来。黄海澄的美学研究偏重的则是中观层面的“控制论”。因此,“三论”对美学和文论的影响是复杂且多样的,不同学者各取所需,其运用侧重于思想启迪、概念平移、现象类比和观点印证等。

“三论”同样影响了文学批评。在《新方法论与文学探索》(下文简称为《新方法论》)一书的序言中,徐中玉提出了几个重要观点:一是实现文学研究方法多样化的一个途径是通过“移植”“交融”和边缘科学的研究,突破既有学科的边界和思想束缚。这是1980年代思想解放的重要体现,且与当下对将其他学科的概念平移到文学研究中基本上持反思性态度不同。第二是徐中玉认为,文艺理论不仅应该与社会学、心理学、美学、哲学等学科融合,不仅应该从“三论”中汲取营养,而且还应该在弄懂真相的基础上,大胆吸收改造外国一切文艺理论研究的新方法、新观点。可以说,徐中玉所著的序言包含了极大的解放思想、打破一切思想束缚的热情。从内容上而言,《新方法论》不仅关注了“新”“老”三论,同时还包括其他科学理论和西方文论思潮,如“测不准原理”“形式美与形式主义”“怪诞艺术”等。因而,从中观层面来看,文学研究中的“方法论热”不限于“老三论”“新三论”,还涉及对社会科学诸理论、西方文论诸思潮、现代主义诸流派的广泛借鉴。所谓的“方法论热”,其实就是“西学新潮”在文学研究方法上的反映。而“移植”“交融”“跨学科”“学科交叉”具有研究方法的思想解放意义。因此,“三论”对文论和美学的影响需要将之放在80年代学术思想潮流的“整体”中进行系统考察。

如今,人工智能时代终于来临。近几年来,几乎每年都有新的技术创新被赋予革命性意义,并随即引起广泛社会关注。例如2016年被称为AR、VR元年,2021年被称为“元宇宙”元年等。麦克卢汉早就预言:“在电力时代,我们的中枢神经系统靠技术得到了延伸。它既使我们和全人类密切相关,又使全人类包容于我们身上。”在电力时代之前,虽然有车轮替代脚、筷子替代手指,但这些媒介的“身体延伸”并没有产生革命性的影响。但由于数字技术、数字新媒体实现的是对人的中枢神经系统的延伸,它所带来的影响无疑是巨大的。对此,凯瑟琳·海勒(Katherine Hayles)也提出“为什么计算媒介不仅仅是另一种技术”的问题。在计算机背后,更重要的是它所包含的逻辑,这在人的思维、人与机器以及“它者”的关系的研究领域产生了全新的理论以及全新的问题。因而,控制论最核心的内容其实是对人与物之间的信息反馈系统的界定。控制论所强调的,是依靠信息的反馈和执行来完成任务,而这也是人工智能的核心内涵所在——机械自动化。根据凯瑟琳·海勒的描述,目前控制论技术已经进入第三阶段,它已超越自然科学内部,被广泛引入到社会文化研究中。正是在此基础上,控制论与人工智能时代给当代文论和美学研究带来了一系列新的议题,如“后人类”思潮(如主体、身体以及人机关系)、“技术主义”思潮(如对技术、时间与未来图景的关注)、“神经美学”(如审美认知、认知诗学等)等。

回顾“方法论热”这段历史演变不难发现,当前“AI生成”问题其实早就受到了文论学者的关注。与人工智能相关的控制论、信息论等不仅成为“方法论热”中的科学哲学的理论基础和思想来源,而且已经开始尽可能调用已有的文学和艺术资源来实现将控制论、信息论之中的诸多重要观点、方法的文学化和美学化。因此,“方法论热”成为当前“AI生成”问题文学研究化的理论“先声”。而只有当计算机技术普及化,人工智能技术向“通用人工智能”阶段发展,“AI生成”真正成为一个现实问题时,“算法阐释”才可能真正成为文论需要关注而且是可能关注的问题。

将算法引入文学研究,进而展开算法阐释的研究有两种路径:其一是将算法作为对象,通过辨析算法的运行逻辑及执行过程来与文学研究的活动相比较,进而讨论以算法作为对象的阐释有何特点;其二是将算法作为方法,通过对算法的数据处理能力的应用及其任务实现效能的评估,来为文学研究这一此前纯粹属于精神生产领域的活动赋能,进而提高文学研究的效率。


三、可写阐释:算法作为对象的算法阐释问题

“可写阐释”,就是将算法作为对象,对算法参与下的文学阐释活动的一种命名。这种阐释何以可能?回答此问题前,需要对“AI生成”算法做一个背景性的说明。

(一)首先,我们需要理解以ChatGPT为代表的算法“生成”与“转换”问题

“GPT”的全称是“生成式预训练转换模型”(Generative Pre-trained Transformer Model)。这里的“G”(生成)、“P”(预训练)和“T”(转换)成为理解基于大语言模型的“AI生成”特点的关键词。具体来说,ChatGPT的生成过程分为无监督学习、监督学习和强化学习三个阶段。在无监督学习阶段,程序员利用转换器(transformer)建立大语言模型。这个模型最初只是一个未经训练的数据结构模型。之后,程序员将收集到的所有相关文本信息全部“投喂”给此模型,同时只输入一些最基本的规则,让该模型自己对信息进行处理和学习。继而再由人来对数据模型中所包含的词进行向量分布,确定词与词之间的关系,形成“词向量空间”。这一词向量空间所形成的结构性关系,可以被理解为是宇宙中的繁星所构成的天蝎座、仙女座等星丛与星丛之间的关系。其次,是监督学习阶段。在这一阶段,工作人员给模型提供任务并判断模型的任务完成度。根据评估结果,人工对相关参数进行修正,从而调整词向量空间的关系。最后是强化学习阶段。在这一阶段,模型会被提供更多新的任务,并通过人工方式对其完成度进行评分。接着,ChatGPT会根据分数高低自动调整其人工标注。经过以上三个阶段的训练后,对ChatGPT的训练即基本完成。此后,ChatGPT采用一套被称为“基于自注意力机制的神经网络架构”加以运行。通俗来讲,这一运行过程可以被视为用词语接龙的方式完成对于下一个词语的预测。

不难发现,ChatGPT并没有所谓的“文本数据库”或“知识库”。它仅包含一个数据模型,其中又包含着已经被训练完成的词向量空间。这个数据模型的生成终止于其结束训练的时刻,如GPT-3.5的所有数据仅限于2021年。不过,到了GPT-4,该模型已具备联网能力,能够实现实时的数据库挖掘和反馈,其演化速度也会飞速增加,不确定性也将更大。这也是为什么马斯克等人对未来的GPT-5持担忧态度的原因。因为在人类还没有打开算法黑箱的情况下就贸然让它快速成长,将面临人类无法驾驭人工智能的危险。

Transformer大语言模型是一种经典的生成结构,已被广泛地用于大语言模型的执行过程。这一执行过程可被简单地视为包含一个编码输入和解码输出的过程。在此过程中,ChatGPT通过算法实现了对指令的有效回复。该模型通过输入嵌入层对输入信息进行编码,并将其嵌入位置信息。进而,模型通过多头注意机制和前馈,也即预训练系统所积累的“经验”,使用一套基于自注意机制的算法来反馈并确定其有效性,并根据反馈赋予其不同的权重。在对所有信息反馈进行加权求和后,最终导出的标准性结果即为所输出的内容。举例来说,假设在模型中输入“你吃”两个词,系统会调用现有的文本数据集,提取可能的后续词汇,如“饭”“菜”等。接着,模型通过编码的位置信息,即上下文语境,计算出每个词出现的概率,从而选择概率最大的词作为输出对象。

(二)将算法引入文论,需要有一个从理论想象到理论实现的过程

事实上,在20 世纪西方文论中,已有大量理解与人工智能算法相似或相关的某些理论思维。罗兰·巴特在《S/Z》中提出“可写性文本”这一概念,意为 “无小说的故事性,无诗歌的诗意,无论述的随笔,无风格的写作,无产品的生产,无结构的结构化”。它指的是一种被打散的结构,一种能以任何方式被重新解构的、具有可生成性潜质的文本。在传统的纸质书籍中,文本在被印刷出来时就已经被确定了。而罗兰·巴特尝试将文本从作品中解放出来——只有解放文本,它才能够被拆散和重组。在纸质的书写文学的时代,“可写性文本”可能难以理解,但在今天的数字时代,它就是现实。在罗兰·巴特发表了《S/Z》的前3年,卡尔维诺(Italo Calvino)发表了《控制论与幽灵(关于作为组合式过程的叙事文学的笔记)》,开始思考未来的以电脑作为工具的文学创作。他构想了一种新的文本,也即由香农、维纳的信息论、控制论所创造出的“文学机器”:“今天,我们倾向于将它视为一系列断续的状态,或者数量有限(一套巨大但有限的数字)的传感器和控制机构上面的脉冲的组合。电脑还远远不能行使人脑的所有功能,却已经能够为我们的记忆、思想上的关联、我们的想象,还有我们意识中最复杂的过程,提供一个令人信服的理论模式。……没有任何东西禁止我们想象出这样的一台文学机器:从某个时刻开始,它不再满足于自身的传统主义,于是提出对于写作的一些新的理解,并且彻底打乱自身的所有规则”。卡尔维诺认为,“那才是能够与假设的理论完全相符的文学,也就是终于成为文学。”值得注意的是,卡尔维诺写出这篇文章前后,法国的结构主义正达到顶峰,后结构主义正在兴起。在法国的文化理论从结构主义向后结构主义的转向过程中,克里斯蒂娃也提出了著名的互文性理论。卡尔维诺所探讨的“文学机器”观念与它们构成了共鸣、呼应与同构的关系。

结构主义与信息论、控制论的某些思想所具有的这种同构性并非只是个案。早在法国结构主义运动之前,普罗普的故事形态学研究已出现了类似的理论思维。除了耳熟能详的对“功能”和“角色”的区分外,普罗普对民间故事中“功能”与“功能”的衔接、“角色”与“角色”之间的转换以及“主题”及其意义在海量“功能”与“角色”中的不断生成和发展的描述,极其类似人工智能算法的“映射”和“迭代”。《故事形态学》的分析模式也与现在人工智能信息迭代的模式相似:所有的信息在不断迭代的过程中确定下一个向量的特征,然后实现意义的生成输出。结构主义的分析方法也为我们将语言理解为一种不断生成的过程提供了想象空间。在索绪尔结构语言学提供的能指和所指的结构基础上,罗兰·巴特增加了二级符号系统——“神话”。按照罗兰·巴特的理解,这种“神话”不是一次性完成的,不仅仅有二级符号系统,还可以有三级、四级以至于无穷的符号系统。这正是对符号及其意指实践的“生成性”的完美诠释。类似的理论在受结构主义影响下的经典叙事学研究中也能找到典型案例。当我们论及叙事学,通常会提及热奈特、托多罗夫,或者格雷马斯,但很少关注布雷蒙。在布雷蒙设计的“简单序列”模型中,所有的叙事都从基本的动力“可能性”开始。接着可分出可能性“变为现实/没有变成现实”,“目的达到/目的没有达到”的路径。值得注意的是,布雷蒙叙事理论中的“可能性”也与信息论中对未来的“预期”存在相同之处。所谓信息论中的不确定性,也即可能性的问题——当可能性大时,确定性也就越高;当可能性小时,不确定性也就越高。因此,将布雷蒙的可能性叙事结构理论转化为信息学或许是一个最为简单的途径。基于“简单序列”,布雷蒙进一步总结出了各种“复合序列”及其更为复杂的组合模式;他还为叙事循环设置了改善和恶化两个路径,等等。所有这些对叙事序列的描述都具有被置换为0和1的编程语言的可能。

进入20世纪70年代,随着大规模和超大规模集成电路被应用于计算机的制造,人类进入微型计算机的新时代。计算机的应用场景也从科学计算、事务管理和过程控制逐步进入人们的日常生活,甚至走进家庭,人们也开始尝试用计算机来从事文学艺术的创作。由此出现的新媒体艺术便具有了真正的“以算法为对象”的艺术活动的特征。在这一时期,斯图尔特·霍尔的“编码/解码”理论也成为理解文学意义生成过程的非常有效的理论模型。德勒兹的“块茎”思想如果仅仅被用于理解文学自身时会显得有些迂回,但若将其运用于理解新媒体艺术、数字艺术以及这个时代的发展,则显现出高度的契合性。围绕新媒体时代艺术的发展,也开始出现直接以算法为对象的文学研究,例如阿尔瑟斯(Espen Aarseth)的遍历文学研究和玛丽-劳尔·瑞安(Marie-Laure Ryan)的数字叙事研究。阿尔瑟斯用“ergodic”(遍历)来描述一种随机、自动、非简单重复的生成性文学特征。它不仅包括“基于文本的冒险游戏和自动生成故事和诗歌的程序”,而且还可能包含“其自己的机器来操纵它自己(例如计算机程序)”的情况。不同于阿尔瑟斯对遍历文学文本的完成性和封闭性的分析,玛丽-劳尔·瑞安认为应该“把叙事学看作一项未完成的项目。倘若说经典叙事学未能通过互动文本性的检验,那也并非意味着互动文本性也未能通过叙事性的检验”,因此,她主张拓展叙事研究的领域,将“数字叙事”“计算机叙事”纳入研究范围。为此,玛丽-劳尔·瑞安列举了出现在新媒体艺术中的各种模式组合的文本——讲述式、表征式、回顾式、脚本式、接受式、自主式、确定式、字面式等。她虽然描写并命名了不同的类型,但其实并没有提供一个统一的分类标准,有的只是根据不同的文本形态进行的命名。因此,玛丽-劳尔·瑞安的新媒体艺术的叙事分析虽然很专业,但并不很深刻。不过,瑞安确实已经将数字时代的叙事学理论往前推进了一大步,尤其是她在《故事的变身》中提出的互动性类型分析框架,将用户的参与纳入到叙事分析中,为互动叙事这一重要问题提供了基础。除此之外,列夫·马诺维奇的新媒体艺术研究也值得特别关注。在《新媒体的语言》中,马诺维奇提出了一个有趣的观点:数据库与叙述是相互对立的,但二者开启了交互性叙述的可能性。无论是玛丽-劳尔·瑞安还是列夫·马诺维奇,都向我们指出了从交互性理解人工智能艺术及数字叙事(更准确的说是“赛博叙事”)的重要性。

(三)在上述基础上,人工智能时代出现基于算法的“人-机互动”“可写阐释”现象

在人工智能时代的文学阐释中,人-机互动是最为核心的问题。我们不应将文学阐释简单地理解为文本性阐释,即从作家创作、作品完成,再到读者解读的过程。人工智能对文学的影响包括文学活动的作者、读者、文本、世界四个方面,同时也涉及文学创作和文学批评这两个层面。而人-机互动是最有助于我们理解AI 时代的文学阐释、文学算法问题的结构化因素。我们可以区分出四种人-机互动关系。第一,“人[生]-机[用]”,即人类创作,AI 评论。第二,“人-机[互生互用]”,即人提出指令,AI 执行。简言之,即是将人工智能理解为人类的一个智能助理。第三,“机-人[互生互用]”,即AI 自主生成,人成为被动参与。第四,“机[生]-人[用]”,即AI 写作,人类阅读、评论。到了这个阶段,就形成了无须指令的AI自主写作。我们尚不能确定最后两种关系是否在未来会真的实现,但至少从理论模型上可以推导出这两种可能性。

依托这个分析框架可以进一步探讨ChatGPT的文本生成属于何种人-机互动模式。在这个问题上,玛丽-劳尔·瑞安的《故事的变身》提供了一个新的解释方案,她将人-机互动的关系从两个维度分成了四种类型。一方面,瑞安区分了“外在视角”和“内在视角”。“外在视角”可以被视为“上帝视角”,即处于虚拟世界外部,而“内在视角”指的是以化身的视角处于虚拟世界内部。例如,在我们使用电脑时,我们外在地操作电脑系统,从而是一种外在视角。而当我们玩一个电脑游戏时,我们通过选择扮演某一游戏角色,以化身身份进入游戏的虚拟世界,从而处在内在视角。不过,目前的化身形式仅限于角色扮演的初级阶段。在新的阶段,如《头号玩家》、“元宇宙”的化身阶段,我们才能够真正实现内在视角,不过现在尚未实现。另一方面,瑞安又区分了“探索互动性”和“本体互动性”。“探索互动性”指的是用户只使用虚拟世界的视角,而不改变虚拟世界本身。“本体互动性”指的则是用户不仅使用,而且改变了虚拟世界的历史分岔。瑞安这一分析框架最大的贡献是将用户的参与纳入叙事分析。用户不再是一个被动的接受者(读者),而是能够去参与、改变、创造新的叙事的可能性的主体。但用户也并非凭空创造,而只能改变既有的文本,为其提供呈现的可能性。这就是一种互动的过程——这是此前所有的叙事文本理论都没有触及的新问题。

在这一“内生/外生”、“探索/互动”的分析框架下,我们可以初步做出以下判断:当前的人机对话是人类作为用户,以外在的方式探索ChatGPT,且由于人类并不改变ChatGPT,其生成的内容也不会进行自我保存,因而目前的人-机互动模式可能基本还处于外在-探索互动型阶段。不过,当GPT-4可以联网,可以自我更新迭代之后,用瑞安的理论,它就可能由外在-探索互动型演变为外在-本体互动型。当然,在 ChatGPT自身内部存在一个生成性的过程,我们可以称之为内生性过程。这一过程也包含探索性、本体性、外在性等方面。那么,我们可以进一步提问:未来的ChatGPT是否能够被塑形?也就是说,未来我们是否能够将ChatGPT装在一个机器人脑中,赋予它某种自主意识,让它能够自主控制机器身体,使其成为一个具有自主行动能力的主体?当下,这个问题尚待验证,目前人们只能尝试去推演它的存在过程。在这一推演过程中,玛丽-劳尔·瑞安探索新媒体叙事学的理论框架可能对理解人工智能人机互动的关系提供启示。

综合以上对ChatGPT算法的理解以及西方文论所提供的各种理论资源的调用,我们可以试图对ChatGPT算法的进行一种理论性的描述了。这一描述可以围绕三个关键词展开:转换器(transformer)、预训练(pre-trained)、生成的/有生产力的(generative)。

A. 转换器(transformer)。Transformer是一种大型语言模型,这与索绪尔所描述的基于规则的语法结构具有一定的对应性。Transformer模型通过词向量空间实现人机之间的互动过程,实际上就类似于通过问答实现言语交谈,而这两种语言生成过程都在一定的规则体系下实现。ChatGPT-3.5及之前的机器算法和编程语言是模式化、结构化的,这意味着这些机器语言的规则无法实时改变。但是到了GPT-4之后,这一语法结构具有了改变的可能性,具有更强的不稳定性,也就越来越像人类不断自我更新创造的自然语言。

B. 预训练(pre-trained)。预训练可被视为一种语言习得的过程。无论是监督还是无监督的预训练,实际上都参照了人类的语言习得过程。在这一过程中,我们将人类的各种日常语言、经验、先验知识、常识、前见、成规,以及语言使用和意义识别方式都灌注给了这个大语言模型。因此,大语言模型所有词向量中的标记其实都包含了人类的经验。因此,ChatGPT的预训练实质上是一个优化过程。正如艺术的熏陶是一种学习和成长过程,ChatGPT的预训练也是如此。一个可能性的结果是,ChatGPT在经过预训练之后能够完成对艺术、语言、审美、价值、意义、情感等因素的表达。但是颇为吊诡的是,ChatGPT没有情感、记忆和对自我行为的理解,那么,我们该如何认识ChatGPT的这种文学性表达?

C. 生成的/有生产力的(generative)。当我们持续输入和输出,ChatGPT会不断生成新的内容。这些内容是ChatGPT所征引的人类已有的知识,还是它创造的全新的知识?在此,我们可以暂时不去考虑基于传统的书面印刷文字而形成的属于知识产权范围的著作权概念。因为这一概念本身已受到了严重的挑战。我们仅仅从“创造”“创新”“创意”的可能性角度来思考:基于GPT所创造出来的文本、图像、音频、视频是否不仅仅是“前未有过”的,而且还是“颇有新意”的?

综合以上观点,一个可能的结论是:以算法为对象的文学阐释,是以经过优化的完成预训练的大型语言模型为语法,以“输入-编码”和“输出-解码”的问答式交互所生成的体现意图、创意和差异化的具有结构性和可写阐释性的文本为言语的文学阐释。借用罗兰·巴特“可写性文本”的概念,以算法为对象的文学阐释可以被命名为“可写阐释”。


四、总体阐释:算法作为方法的算法阐释问题

以算法作为方法的阐释即是将算法作为文学研究的辅助工具,以实现对一些简单、机械、重复、非创造性劳动的替代。如要统计一篇短篇小说中的某个虚词数量,仅靠人工数数就可以了;但是如果要统计一部长篇小说、甚至数以千计的宏大数据库中的虚词的数量,纯粹的人工数数就远远不够了。基于算法的词频统计软件的发明正是为了解决这个难题。因此,以算法作为方法的阐释正是文学创作和文学研究发展到一定阶段,为解决海量的信息处理难题而发明的辅助性方法。

“数字人文”(也称“人文计算”)便是对这一辅助性方法的命名,且已有了相当长的一段发展历史。早在20世纪40年代,人们已经开始尝试应用计算机来做文献的整理和分析了。1949年,意大利神父罗伯特·布萨(Roberto Busa)开始使用老式计算机制作出庞大的《托马斯著作索引》(该巨著直到1980年才编撰完成)。60年代,约瑟芬·迈尔斯(Josephine Miles)在《文艺复兴、十八世纪和英语诗歌的现代语言:列表视图》一书中提出了“中等距离”(middle distance)概念。2000年,弗兰克·莫莱蒂(Franco Moretti)发表了《关于世界文学的猜想》,并于2013年出版《远读》,提出了著名的“远读”(distant reading)理论。中国学者开始以算法为方法的研究可以从20世纪80年代开始算起。陈大康受美国威斯康星华裔学者陈炳藻的影响,用数学方法研究中国古代小说,在文学研究中融入了数学思想方法论。1990年代末,赵宪章也开始用文本调查的方式,编制了一个词频软件,应用语料库对高行健的《灵山》进行文本分析。他还对《美食家》小说中出现的由“食”组合而成的衍生词进行统计并得出分析。与当今正在如火如荼展开的“数字人文”研究相比,这种研究方法显然十分朴素,但它基于数学和计算思维,正是以算法作为方法的文论研究的起点。

以算法为方法辅助人类进行文本阐释是数字人文领域已经和正在实现的一种应用。不过,因为文学领域学者的研究还不够深入,而绝大多数开发这一技术的往往是理工科背景的学者,他们对文学的理解还仅限于比较基本的水平,因此目前这些阐释相对还比较初级。例如,较为简短且最具形式感的诗歌成为现在数字人文研究的热点问题之一,由此衍生出对节奏、韵律、对偶、意象、主题、情感等基础概念的考察。总的来说,目前数字人文的研究采取的处理方法还没有达到“高智能”阶段。它们大致可以概括为三类。其一,大规模的、可持续的语义分析。如傅君励在《中国历代人物传记资料库(CBDB)对历史网络的结构化处理、记录与分析》一文中,根据人物及其社会关系、社会身份、亲属关系等不同的维度,为他们打上不同的标签,从而建立一个完整的数据库。借助该数据库,我们能够进行人物与人物之间的关系匹配,从而挖掘有意义的问题。其二,自动化的文本分类和归档。该方法目前已在网络文学中被广泛采用,例如使用机器识别对网络文学进行类型化区分。另外,我们也可以根据文本中的关键词、特征、谓词等语言特征对文本进行情感分析。不过这在当前的文学分析中用得还不多,主要原因是文学在情感层面的循环分析过于复杂,而机器目前只能进行简单的正向和负向分类,并根据正向或负向赋予不同的权重,进而做出各种分析。目前来看,这方面应用比较成熟的是商业性的顾客心理的情感评价分析。其三,学习并自我完善的系统。虽然目前网络文学中已存在大量的人工智能写作,在新闻领域人工智能写作也已成为常态,但实现学习和自我完善的系统目前在文学阐释领域尚未出现成熟的应用。这方面较为成熟的技术包括语音识别技术(讯飞)、图像识别技术、翻译(谷歌)、推荐算法(TikTok)等。

传统的数字人文分析方法需要大量的人工操作。例如研究者收集大量文本数据后要对其进行人工的预处理,即为不同信息打上标签,最后对其进行意义分析。有了人工智能技术以后,大语言模型的预训练过程实现了对人工预处理的替代。当前以ChatGPT和“文心一言”为代表的大语言模型都是利用人类已有知识数据进行预训练的结果。因此,其“AI生成”的能力与预训练的数据性质、数据量有密切关系。如果我们可以将大语言模型通过预训练而获得的“词向量”视为索绪尔意义上的“语言”的话,那么,每次ChatGPT和“文心一言”通过人机交互的方式实现的对话输出则可视为“言语”。“词向量”是预训练数据中所包含人类知识、情感、价值、意义的集成;而“人机对话”则是依据特定的“提示”(prompt)而实现的概率化输出。这便是ChatGPT和“文心一言”的“AI生成”符合人类基本认知的“正态分布”,体现出人类“均值”特点的重要原因。这一“正态分布”或“均值”是否具有创造性并不重要。因为对这个问题的判断主要取决于人们对“创造性”的定义及其标准。更为重要的是,如果文学意义阐释的“正态分布”和“均值”的判断能够成立,那么,我们就有可能实现对文学意义的“总体阐释”。

“总体阐释”是由笔者在回应与张江《论阐释的有限与无限——从π到正态分布》引发的讨论中提出来的。在笔者看来,“‘总体阐释’并不想回到哲学阐释学,探讨阐释的‘放之四海而皆准’的一般的、普遍的通用的规律上去,而是想建立一种针对具体的现实的文学阐释实践的整体性的体系性的认识框架。这不是一种抽象的整体性,而是具体的整体性;这一‘总体阐释’也非‘部分阐释’‘个别阐释’的叠加和拼凑,所谓‘整体大于部分之和’就是这个意思。”为此,“我们需要建立起一种有关文学阐释意义的总体性观念”。这种观念同时将“作者意图”“读者阐释”“意思”“意念”甚至“道听途说”等各种因素包括其中。进而,我们就有可能实现对一个时期(时代)某个作家、作品或文学现象的总体认知。基于这一总体认知,我们便能判断其中存在哪些“共识”,包含哪些“歧见”?“共识”与“歧见”之间是否具有可通约、可转换的可能?等等。“总体阐释”的根本特点就是以“数字人文”(“人文计算”)这些以算法作为方法的辅助性工具突破个人的大脑对信息的处理能力,帮助人们在更大的数据量(海量数据)、更大的时空尺度(长时段、全球或世界)中展开文学研究。在研究对象上,“总体阐释”可以包括接受史、鉴赏史、批评史、研究史等在内的文学的阐释史;在研究方法上,则是基于数字人文方法的对文学阐释的情感、叙事、形式及其意义的均值、方差、分布、偏态的大数据分析。根据“总体阐释”的意义分布,进而能够测绘出不同的历史维度,从而去解决文学史、文学意义的阐释过程,分析不同时期文学阐释的共识和意义,把握它的主导倾向和影响因素,从而为总体文学的研究提供某种可能。这也便是莫莱蒂在试图重新理解和建构关于“世界文学”的想象时,倡导以“远读”作为方法的重要原因。

综上所述,人工智能时代对文学研究带来了冲击与挑战。这既包括对传统文学研究方法中的“非创造性活动”(如检索、校对、查询、统计,甚至是部分创作意图和学术思想的文字表述)替代,还包括计算机编程语言的“算法”成为文学研究的一个问题。算法的核心是“生成性”,从而使“可写阐释”成为可能;以算法为方法辅助文学研究的数字人文研究在实现人工智能技术的升级之后,也使得推进以文学意义的“正态分布”和“均值”为特点的“总体阐释”的文学研究成为可能。



作者简介









曾军,上海大学教授,博士生导师。《上海大学学报 (社会科学版)》主编、中国文艺理论学会常务理事、AHCI刊物Critical Arts: South-North Cultural and Media Studies编委。曾入选长江学者青年学者、文化名家暨“四个一批”人才、国家“万人计划”哲学社会科学领军人才、上海市曙光人才计划,上海社科新人等主要研究领域为文艺学和文化理论与批评。

版权声明


本公众号所登载之文章,仅出于传递信息之目的,其内容代表作者个人观点,仅供参考,文章来源均已注明。欢迎个人转载,转载请务必注明出处。文章版权属于原作者,部分文章因种种原因未能与原作者联系上,若涉及版权问题,请作者联系我们,我们立即处理。所用图片均来源于网络,其版权归原作者所有,本号不对图片的原始来源负责。


温馨提示

若读者想查看历史消息,请点击公众号右上角的标志,之后点击查看历史消息,在页面最上面有个搜索的框,直接输入关键字搜索即可。

 “中外文艺理论与文化研究 ” 微信公众平台由中国人民大学文学院金元浦教授创办,杭州师范大学文化创意与传媒学院柴冬冬副教授任总编辑。本平台本着传播最新学术思想,服务学术事业发展的公益精神,热烈欢迎各位读者订阅及赐稿!

联系邮箱:chaidongdong2006@126.com;

传播优秀文艺思想,推进文艺思想发展

中外文艺理论与文化研究

微信号 : zwwyllwhyj

小编微信(绑QQ):632183874





中外文艺理论与文化研究
传播优秀文艺思想,推进文艺思想发展
 最新文章