[关键词]数码物;数字人文;电影研究
[中图分类号]J905[文献标识码]A
随着数字技术的发展,自然语言处理、机器学习、数据挖掘等技术已经深度参与到人文学科研究之中。数字人文以数据作为研究的核心驱动,一切对象必须数据化,才能被计算和处理。被数据化的影片、图片、文献、数据库成为了数码物。数码物的出现既是数字技术发展的结果,也将物的讨论带入一个新的哲学领域。对于电影研究而言,计量电影学、计算机视觉、知识图谱、社交网络等数字人文方法的使用,不仅为电影研究带来方法论创新,同时也引起了电影研究的思维转换和范式转型。本文试图从数码物的产生及其本体特性出发,探讨电影及数据库的数码化存在方式,以及在电影研究中数字人文阐释框架的变化。
一、什么是数码物
数码物的出现让人重新审视“物”的本质。学界从实体物到数码物的讨论体现了从“主体—实体”到“关系—实体”再到“关系—存在”的一种本体论哲学思想的变化。从亚里士多德到笛卡尔、休谟、康德、黑格尔、胡塞尔等,西方哲学家多以“主体—实体”认识物的存在。“主体—实体”讨论的是物作为一种实体性存在,“可以理解为自然物哲学概念的核心问题”[①]。如亚里士多德《范畴篇》(Categories)中提出物是质料与形式的结合,主体通过感知形式认识物;康德提出“物自体”的概念,认为我们只能通过先验统觉来认识物的现象,而无法认识到物的本身;胡塞尔将一切看作“意向性客体”,主体的意向性行为指向客体产生了客体理念的显现。在这些论述中,物作为一种客体,是主体经验的客体,主体的任务是通过意识达成对客体的认知。“关系—实体”论则从关系或者环境出发认识物的本质,西蒙东(Gilbert Simondon)的《论技术物的存在》(On the Mode of Existence of Technical Objects)摒弃了从质料和形式的结合来认识物的思维,提出了“技术物”的概念,认为技术物是关系的统一体,关系是在技术成分到技术个体再到技术组合这一进程中建立的。海德格尔指出,物的意义只有在关系中才能呈现。比如,当一把锤子砸向钉子的时候,其意义才能显现。
20世纪,随着量子力学、计算机技术、信息技术的发展,人们重新思考所谓“实体”。事物存在于不同的现实级,物并不必然以可见实体的形式存在。电子、粒子、比特等是看不见的,但他们同样构成了物。人们对物的认识从“关系—实体”转向“关系—存在”。比如,以比特为单位的计算机信息出现。卢恰诺·弗洛里迪(Luciano Floridi)认为信息是一种遵循数学传播理论的数学存在物,他将数码化的世界称为“信息圈”(infosphere),认为真实的终极性质是信息,信息是由数字创造的新实体,信息以前人无法想象的方式与世界互动并操纵世界。[②]加斯东巴什拉( Gaston Bachelard)提出用存在代替实体。关系是中心,它依靠技术或观察工具而实现,而基于计算和网络的数码物是“由已形成的关系构成的技术系统,在此之中任何事物都有与其他事物连接的可能”[③]。许煜认为,计算机的出现与其被普及应用于处理大型数据标志着基于关系存在论的信息系统的出现。今天,人们已经身处数字化环境中,受算法控制。正如尼古拉·尼葛洛庞帝(Nicholas Negroponte)所言:“计算不再只和计算有关,它决定我们的生存。”[④]
在此逻辑基础上,许煜提出“数码物”的概念。数码物是一种“关系—存在”物,它不是实体,也不仅仅是信息,它是“一种新型的工业产物,遍布我们这个无处不在的媒体时代生活的方方面面——例如网络视频、图片、文字……它们既存在于屏幕上(我们可与之互动),也存在于电脑程序的后端或内部”[⑤]。从基本的计算层(包含编程、协议、处理),到组织层(数据的处理方案),再到输出层(界面、网络)等,都是数码物。从物所涵盖的量来看,数码物足以与自然物、人造物相比。我们必须从关系的角度来认识数码物,比如,下载、编辑、上传电影片段在胶片时代是不可能的,这些行为必须在网络环境下进行,因此这些片段就不再是电影胶片而是数码物。
数据成为“物”有三层含义:第一,从1946年计算机发明后,信息以计算机数据的方式存储与传播。尼葛洛庞帝在其《数字化生存》(Being Digital)中用“比特和原子”代表两种不同的“物”,“原子”是作为物理世界的物的最小构成单位,“比特”是信息的基本单位,没有重量、尺寸、颜色。与原子物不同,比特物非物理性存在,但也不是虚拟性存在或意识性存在,而是一种新的物的存在。数码物由数据、元数据以及数据方案(算法)组成,具有可计算、可编程、可编辑、模块化、自动化等特征。第二,这是一种物质形式的转化。如出版物、胶片、图片、声音的数字化。戴维·杰勒恩特(David Gelernter)在1991年提出“镜像世界”,他认为随着计算能力的提升和无所不在的链接,人类将用数据流和算法创造出一个真实世界的所谓模型,可以被理解、被操纵、被重新安排。“数码物”是物理现实的网络“镜像世界”。人们进入数码物的时代,是人类从过去单一的物质化生存向“物质化+镜像化(虚拟化)生存”[⑥]的复合生存的转变,这一过程就是“数码物”化的过程。简言之,数码物肇始于计算机技术,形成于互联网技术,与物理现实有着对应的关联性。计算机和网络构成了数码物存在的基础。第三,数码物是一种空间性和关系性存在。数码物存在于计算机信息空间,存储数据也需要空间(通常指本地空间和网络空间),其依赖于通用标记语言(GML)、超文本标记语言(HTML)、可扩展标记语言(XML)等语言和规则构建的数码环境,即弗洛里迪所谓的“信息圈”。数码物依赖于技术基础设施建设,如区块链技术、数字技术、计算机技术、网络技术等。
数码物不仅仅是数据或者信息,那么数码物如何被理解?许煜认为,数码物被理解需要经过两个运动:一是“数据的物化”,指将数据处理为映射或模仿系统,如用数据构成可理解的图像、数字电影等;二是“物的数据化”,指将标签附加到对象上,并将它们编码到数码环境中,如将一部影片或小说输入到某个特定算法编码的系统中,系统再将影片分解为可分析的数据。许煜认为,这两个运动过程有着非常重要的作用:“(1)它脱离了基于超链接的万维网而成为物的万维网;(2)它代表了机器更重要的角色,不仅仅是输入输出设备,也可以部分地作为‘思维机器’。”[⑦]“数据的物化”和“物的数据化”,最终指向的都是现实的存在。因此,数码物作为物的形式呈现了人类的经验,表达了一种整体的存在的观念。
今天,数码物为我们提供了一个理解数字人文的新视角。数字人文已经以一种不可阻挡的趋势进入了人文艺术研究领域,目前学界对数字人文的认识呈现出两个极端:一是认为数字人文的内核是计算性,对数字高度热情,言必称数据;二是认为数字人文仍是人文学科,因为数字无法呈现真理和意义,计算“抽象或简化原本复杂的文学现象,使得文学作品失去了其丰富性和独特性”[⑧],因此应对数字抱有必要的警惕。应该说,这些讨论仍然在认识论的视角下将数字视为一种工具,本质上仍将研究对象视为一个传统意义上的客体。将数码物引入数字人文的讨论,是在本体论观照下对研究对象的重新审视。正是基于数码物的“双重运动”特性,一切文本、影像、印刷物、图片等,必须成为数码物,才能成为数字人文的研究对象。同时,通过特定的算法,将其数据化、图谱化、可视化,成为可阐释的数据经验,这些生成的数据不仅是特定数码物的意义阐释,也是数码物的存在形式,意义产生于对象的存在结构中。这就为数字人文的阐释打开了新维度。计算机网络构建了一整套语义网络和话语系统,这个系统以算法为语言,发展出一套不同于传统人文学科的阐释方式,这个阐释方式不仅仅是数字的,而是关于存在、意义和价值的,是数据经验与人类主体经验的统一。
由此,“‘数据界’与‘自然界’和‘社会界’一样可以成为一个独立的研究对象”[⑨]。“研究对象的变化是整个变化链条的基石”[⑩],当胶片的电影变成了“数码物”史料并以数据库的形式存在,知识生产的方式就发生了根本性的变化。
二、作为数码物的电影与数据库
海德格尔认为,物性只能根据与其环境相关的关系来考虑。物的秘密在于它不能被认为是对立的关系——对象——而应被理解为存在物的集合,存在(Being)在其中自我解释。电影的拍摄方式、存储介质、放映方式、传播与接受方式等规定着电影的物性,作为数码物的电影和数据库规定了数字时代电影研究对象的基本特性。
胶片时代的电影生产流程为:胶片拍摄—拷贝洗印—拷贝物流—拷贝放映。胶片拷贝需要较高成本,而且每进行一次拷贝和放映,都会对胶片造成一定的损耗,原初的胶片电影就具有了“此时此地性”和“原真性”。本雅明(Walter Benjamin)在《机械复制时代的艺术作品》(The Work of Art in the Age of Mechanical Reproduction)中认为,艺术品正是由于有“此时此地性”和“原真性”,才能使其保有“灵光”。随着胶片的破损和消逝,“灵光”也消逝不见。录像带和DVD等新的载体的出现使经典电影得以“复活”。但DVD仍需借助特定的设备存储与放映,传播范围也较为有限。老电影的“灵光”仍面临随着载体的损坏而消逝的风险。同时,传统环境下电影编辑与分析的难度仍然较大。电影的存储介质、存在环境、传播环境以及编辑环境规定了传统电影研究的基本范式,即主体(观众)通过感性经验认识和阐释文本(电影)。也正因此,传统电影研究多聚焦于叙事研究、文化研究,阐释多依赖感性经验,对电影本体的分析受限。
胶片数字化是将图像和声音构成的电影场景转化为一套计算机代码,以原子为单位的胶片被以比特为单位的数据所取代。经典电影的数字化包含三种情况:一是针对胶片局部污损、褪色、丢帧、抖动等问题,通过算法来检测损伤和进行修复,尽量“恢复”老电影的原貌;二是通过深度学习技术将黑白电影转换为彩色电影,或进行重新编辑;三是对经典电影进行3D再创造,如对老电影《大闹天宫》原片进行重新剪辑并进行3D制作,《天书奇谭》经过4K高清修复后,3D转制也在计划中。胶片的基本原理是复制,强调影像与现实的索引关系。而数字影像以像素的形式呈现,损耗胶片数字化后,由像素进行填补、修复、亮度调整、转彩等。从本质上说,修复电影是由比特组成的混合物,其基本特点就是普通用户可编辑、可存储、可传播。“比特没有重量,易于复制,可以以极快的速度传播。在它传播时,时空障碍完全消失。原子只能由有限的人使用,使用的人越多,其价值越低;比特可以由无限的人使用,使用的人越多,其价值越高。”[11]当在线电影片库取代了线下的物质存储,电影进入计算机“输入(物的数据化)—输出(数据的物化)”系统,用户成为影像的生产者和传播者。胶片的数字修复、再剪辑以及在此基础上的3D制作,都变为数码物。
作为数码物的老电影不再依赖于原作的“此时此地性”和“原真性”,通过网络存储与传播,吸引了新生代观众的观看,促进了电影观众的迭代。经典电影在数字环境下继续被讨论和被阐释,形成新的意义和解读,增强和延长作品的意义链,延续了经典电影的“灵光”。同时,作为数码物的电影进入计算系统可以反复被编码、被编辑、被重组、被计算、被评论,形成数据的数据。电影文本与生成数据都成为研究的对象,计算机工具、网络工具和研究主体共同生成主体经验。进入计算机系统的电影文本经过计算,呈现为一系列数值,这将我们引向电影的内部结构、文本风格特征和电影的发展趋势分析。数据经验参与到主体对文本的阅读中,弥补了电影阐释的感觉化和模糊性。数字时代的电影与电影研究正实现着从微观到宏观层面的“从价值论到本体论的思维转向”[12]。
再来看作为电影研究资料的数据库,在线数据库典型地体现了数码物“关系—存在”的本体属性,从电影资源到电影研究,各类网站以链接的方式形成一个庞大的网络世界。以电影史料为例,除影片本身外,它还包括与电影相关的学术文献、报刊资料、口述史与回忆录、书信、日记、公司记录、音频、图片、视频、图书、海报、剧本,等等,这些内容正加速数据库化。第一类是文献数据库,如中国知网、《申报》全文数据库、香港旧报纸、中国电影学术网等。这类数据库主要是将纸质资料或者整理后的文献信息输入计算机中,实现文献信息的检索。第二类是量化数据库,如巴瑞·索特(Barry Salt)的Starword平台、戈内斯·塞维扬(Gunars Civjans)与尤里·齐维安(Yuri Tsivian)等创建的Cinemetrics平台、杰里米·巴特勒(Jeremy Bulter)开发的Shotlogger平台、中国学者田丰创建的电影数据分析平台等。此外,猫眼、灯塔等以票房为主要数据的在线数据库也属此类。这类数据库以数据统计和分析为特征,可在线形成各类数据和可视化图表。第三类是综合类数据库,如加州大学伯克利分校太平洋电影资料馆电影研究中心网站、中国电影知识体系平台等,呈现出一种互联性强、开放性高、参与性广的“泛在学术”特征。平台为数据库提供了管理框架,实现了数据的可交互、可编辑以及学术的再生产。此外,基于链接的ChatGPT、百度百科、维基百科等实现了大数据的即时编辑与整理,海量大数据的指数级增长和信息地理等空间数据库进入电影史研究,图片、视频、文字等都参与到数据库的构成中,电影与数据库的存在越来越空间化。数据库不再是一种研究的工具和对象,而是以一种以“镜像”的方式呈现的“拟形化历史”[13],是一种与我们的存在融为一体的数码物。数据库不再只是数据,而是一种基于关系的存在物。
作为数码物的数据库不仅仅是数据库,还可以生成数据的数据,以一种结构化、关系化的方式呈现数据,如知识图谱、社交网络、地理信息系统等。
知识图谱的概念2005年由大连理工大学陈悦等人引入中国并命名:“科学知识图谱是以知识域(knowledgedomain)为对象,显示科学知识的发展进程与结构关系的一种图像。”[14]以CiteSpace为代表的文献分析软件,成为绘制知识图谱的流行软件。该软件能够快速在海量文献中对关键词等信息进行信息提取,该软件还可以将提取信息进行统计分析,将学科结构、规律和分布用可视化的方式呈现出来,具有“图”和“谱”的双重性质。该软件的开发者陈超美认为:软件的目的是让使用者通过知识图谱的绘制,看到知识图谱将会如何改变人们看世界的方式。[15]
影人年谱是电影史研究的核心之一。李道新认为,影人年谱应“在最大限度还原社会历史面貌和体认影人生命轨迹的过程中,为中国的电影史研究提供必要的知识积累和价值导向,并为重述中国电影史以及构建‘中国电影学派’奠定不可或缺的学术基础”[16]。大数据可视化语言方式可通过信息地理和社交网络等方式“还原”影人生命轨迹和社会历史面貌。社交网络理论的核心概念是结点(node),即网络中的行动者。结点可以是人、组织、地点等,这些结点通过边缘联系起来,形成一个复杂的社交网络。[17]社交网络理论在电影人物关系和历史档案人物关系方面应用广泛。如檀秋文通过对20世纪20年代史东山的交际网络进行考察,发现史东山与晨光美术会艺术家和鸳鸯蝴蝶派文人交往密切,影响了史东山20世纪20年代的电影创作风格。[18]中国电影知识体系平台专设“社交网络”二级系统,在这个界面可以直观地看到影人的创作及其社交圈(见图1)。
图1中国电影知识体系平台社交网络图例
地理信息系统(GIS)是一种以计算机技术为基础的处理地理数据的理论和系统,现在已经普遍应用于社会的各个领域。目前,地理信息系统已经普遍应用于历史研究,其最大优势在于可以追踪历史的动态事件。将其应用于影人年谱的编撰中,能够动态追踪影人、影事的社会影响因素,能够更好“体认”影人的生活轨迹和情感变化,以此作为基点,能更为客观地讨论影人创作思想和创作风格的变化。
通过特定的算法,电影数据库正深刻影响着电影的创作和传播。如根据特定电影数据库提供的数据,电影制作公司和发行商利用算法提取相关信息,分析电影市场和观众,以预测电影的票房和口碑。算法可以用于电影推荐系统,通过分析观众的浏览和观影记录,给用户推荐符合其喜好的电影。电影公司还可以根据算法提供的结果选择演员、推广策略以及营销方式。从电影制作上来说,在技术的加持下,算法可以用于制作电影特效和丰富视觉效果,通过计算机生成图像和合成技术,创造出各种虚拟场景和特效,甚至可以生成新的算法电影。由“记录”“复制”为核心词的电影制作正在被“生成”“合成”所取代,这也带来了一系列美学上的变革。
大数据的本质不是数据,而是“人类的社会生存方式从单一的物质实体生存向物质实体生存及其镜像化生存融合的社会综合生存方式转变”[19]。海德格尔因图像技术的出现指出世界以图像的方式显现自身。在不久的未来,当数据量足够大,数据内容足够多样(文档、照片、视频等),历史就会以“镜像”的方式存在于界面上。因此,无论是基于知识图谱的文献分析,还是基于社交网络、地理信息系统的影人年谱编撰,体现的是一种面向未来的整体化和关系性思维,是一种为历史构建“镜像”的方法和工具。通过不同层级的数据,将碎片化历史记录描述为一个结构化的“谱系”和“镜像世界”。我们不仅能够从自身“经验”出发去体验影人的生命轨迹,还能够抽身出来,站在一个“巅峰视角”,从历史视野洞察其规律与真相。
三、电影数码物的数字人文阐释路径
本体论的“它是什么?”和认识论的“如何表示?”密切关联。数字人文为描述和解释数码物提供了一种系统的语言和方法。数码物“存在于以算法运行的递归函数构成的自动化环境中。算法隶属于语法化(grammatization)进程的历史:完全网络化的数码环境乃是语法化的最高阶段”[20]。算法是数码物的基础语言,通过算法,计算机能够进行数据的分析、图像的识别、语义网络的构建乃至情感的表达。列夫·马诺维奇(Lev Manovich)认为,人文学者在论证文化图像时,从内容、视觉风格、作者意图、观众接受、意义、情感效果等方面对图像的创作传播进行分析和解读。他们所使用的语言主要是自然语言,自然语言并不能代表模拟维度上的微小差异,如颜色、纹理、时间节奏、运动等,而恰恰是模拟维度定义了艺术的审美和体验。数字人文描述与分析电影数码物的语言归纳起来,一是影像的数值化呈现,二是计算机视觉。
电影计量包含一个“物的数据化”和“数据的物化”的过程。数字影像进入计算机输入系统,表现为一系列数据,数据具有了可编程性、可编辑与可计算性,再经由算法设计进行输出,形成一系列代表着特定含义的可分析数值。如通过Cinemetrics视频捕获软件输出一系列有关镜头描述的数值——ASL(平均镜头时长)、MSL(中位数时长)、SLs(影片镜头分布曲线)、LEN(影片时长)、MAX(最大值)、MIN(最小值)、NoS(镜头数)、CS(剪辑摆幅)等,这些数值可以被看作描述文本的数据或者影像的数值化表示。将这些数值输入EXCEL、R语言程序、SPSS等软件中,即可生成关于电影结构、剪辑、节奏的可视化图表。
电影计量可以被比作一个透镜,既可以是“显宏镜”,也可以是“显微镜”。所谓“显宏镜”,是通过对电影长时段数据的可视化,呈现电影节奏的发展趋势,如范倍、郭柳蹊通过对第五代、第六代导演共计267部影片的镜头数据进行计算,发现第五代电影的平均镜头长度 约为 7.11秒,剪切摆幅为9.80,第六代电影的平均镜头长度为9.66秒,剪切摆幅为16.50,从而得出第六代的影片节奏要慢于第五代的结论。[21]所谓“显微镜”,是通过对某一位导演或者某部影片内部结构进行数据分析,考察导演的个人风格。如陈刚通过对费穆电影相关数据的分析,探讨了计量电影学视角下费穆电影结构的可视化路径;[22]李春芳通过计量分析了电影《阮玲玉》的叙事结构、剪辑特征和人物关系;[23]笔者通过对史东山从1926到1951年6部电影的ASL/MSL、景别分配、运动镜头占比、长镜头分布等数据进行分析,考察了史东山电影的主流民族风格;[24]此外,还有学者运用计量电影学方法对中国早期武侠电影的类型风格进行了探讨,试图探寻中国武侠类型风格生成的“元数据”,等等。
计算机视觉是理解电影数码物的另一种语言,它包含获取、处理、分析和理解图像或更高维度的数据处理方法。计算机视觉在21世纪初应用于艺术研究领域,大卫·斯托克(David G. Stork)等人利用图像处理、计算机视觉和计算机图形学的方法对艺术图像的特征(如笔画、灯光和构图)进行数字描述。列夫·马诺维奇在2007年创建文化分析实验室,将计算机视觉应用于几十个文化数据集。[25]计算机视觉在电影领域最开始主要应用于对老电影进行无损智能化修复。对于电影风格研究来说,通过计算机视觉技术,使用JAVA、Python等编程语言,由代码进行逻辑语言架构,进而对电影中的特定影像进行识别,经过自动化处理,以图像序列来呈现影片,这样就“创造了一种对整个电影或对我们感兴趣的电影语料库的视觉指纹,仅仅从影像的蒙太奇就能获得至少是表面上的视觉洞见”[26]。这对于传统的只能用自然语言来描述电影风格的研究产生了革命性影响。同时,通过计算机自动识别,可将运动的镜头分解为离散的图像进行分析,也可以抽取影片中的特定信息进行分析,研究者既可由此获得对整部影片的宏观视觉印象,也可从微观层面对影片进行研究。计算机视觉意味着影像的图像化呈现,是一种用图像描述影像的新语言。2016年,德国学者赫夫伯格(Adelheid Heftberger)出版了《数字人文与电影研究:吉加·维尔托夫作品的可视化》(Digital Humanities and Film Studies: Visualising Dziga Vertov’s Work),该书是最早系统使用计算机视觉进行电影研究的著作,对计算机视觉语言的探索具有奠基作用。如运用计算机视觉识别早期苏联电影《第11年》(The Eleventh Year,1928)每一个镜头的第一帧,然后把镜头进行排列,从而获得整部影片的视觉印象。有意思的是,观看电影是一个时间行为,而通过抽取每个镜头的第一帧进行排列,以语料库的方式观看电影,时间行为转变为空间行为。观看方式的改变也影响着电影研究的方式,如果说电影计量善于描述电影的时间特征,计算机视觉则擅长处理空间问题。对于研究者来说,这种方式能够从整体视角对文本的景别、空间、景深、人物、构图等进行全面的“细读”,进而揭秘导演如何独特地使用各类镜头。同时,研究者还可以通过影像来探讨导演的电影观念与电影理论之间的关系,从而使文本解读进入电影史纬度。
计算机视觉在国内电影研究中刚刚起步,目前还处于软件研发阶段。中国传媒大学李春芳团队研发出“场景边界检测算法框架”,该算法能够自动对镜头进行分割,可以通过物体识别、场景识别对镜头特征进行提取。上海大学田丰团队开发了电影数据分析平台,平台包括电影色彩全局量化和可视化两大模块,包含帧分割、基础图像特征、增强图像特征、纹理数据、边缘数据、音频特征数据、人脸熟练检测、主角人脸识别、景别识别、镜头分割、运动识别等功能,可按电影时间序列展示整部影片受关注的色彩、运动、信息、主角、景别、镜头、音乐、音效等。[27]此外,北京邮电大学吕金娜等人用人脸识别和字幕实现了一个故事角色网络,可以自动构建影视剧的人物关系;北京工业大学毋立芳等提出一种基于特征融合的渐进镜头边界检测。[28]电影计量和计算机视觉连接了数码物的客体存在与主体感知,它们不是自然语言的符号和语义系统,对于电影研究来说,电影计量和计算机视觉更容易体现研究的动态过程,在此过程中,数据不仅仅是一种工具,也是一种可理解和可阐释的语言。
作为数码物的电影至少包含着两种特质:一是作为数码物,电影物质构成单位由原子变成比特,按照现代数学编码而运作;二是作为艺术,其形式、情感的内涵规定了电影艺术保其所是的边界。电影数码物的数字人文阐释路径也发端于两种经验,一种是由数码物自身的计算性和网络性所产生的数据经验,一种是由电影作为艺术所产生的人类主体经验,前者是计算机阐释,后者是人文阐释,这两种阐释构成了一个螺旋结构。数字人文导向何处取决于采用何种阐释框架。
在人文艺术学科的解释传统中,人类主体经验占据核心地位。阐释学(hermeneutics,又称解释学)一词从词源上看来自希腊神话中为诸神传递信息的神使赫耳墨斯(Hermes)。赫耳墨斯往返于人神之间,向人间传递着神谕,他说的话模棱两可,需要经过辨析才能理解。因此,“阐释学的一个基本前提就是对语言抱审慎的态度,认为语言虽有传达意义之功能,但语言表述和意义之间,往往无可避免有不同程度的差距”[29]。德国思想家施莱尔马赫(Friedrich Schleiermacher)认为,读者之所以能够理解一篇文章,不仅是因为读者和作者之间使用了相同的语言,而是他们拥有共同的人性。在此基础上,施莱尔马赫建立了阐释学的普遍性原则,也建立了阐释学与生命体验的联系。从生命体验来认识阐释活动影响到了海德格尔,他认为存在的事实是一切意识活动的前提,而解释和理解在很大程度上依赖于直觉的作用,因此阐释具有主观性。伽达默尔(Hans-Georg Gadamer)的《真理与方法》(Truth and Method)从语言的本体意义来证明阐释的本体论和现象学,将“人类经验”区分为科学经验和非科学经验,而艺术经验是一种非科学经验,他认为,科学并不能通达真理,只有人的精神活动才能通达真理。由此可见,人文科学阐释学关心个体感受的主观性,强调语言的模糊性和语言与语义之间的不对等关系等问题。
人文学科强调人类主体经验的优先性,潜在地将技术塑造为文化的对抗物,并在此基础上发展出一套阐释学的理论框架。经典阐释以文本、作者、读者为中心,以作品和实践为基础,构建了经典的阐释理论与方法。但如果过于强调脱离本体的主观阐释,甚至主张“作者已死”,则容易使电影研究走向歧途。1960年代以来,流派庞杂的当代西方文化批评进入电影研究领域,产生了所谓“宏大理论”。苏珊·桑塔格(Susan Sontag)就曾明确提出“反对阐释”,她反对的并不是阐释本身,而是脱离文本的过度阐释。1980年代以来,中国电影学术界大规模以西方文艺理论为思想资源阐释本土电影,虽拓展了电影研究的深度和广度,但也产生了电影研究脱离电影实践的“概念解说”“场外征用”“主观预设”“非逻辑证明”等“强制阐释”现象。[30]尤其是在面对中国电影的经典文本时,借用西方理论的讨论更多的是从概念和范畴出发,而不是从文艺经验和实践出发,这造成了理论与创作、理论与本土电影实际脱节的情况。“‘强制阐释’真正恶劣的影响,不只是对文本或作者的误读,或者不良的文学生态或学科发展,而是在‘阐释形成认识’的关系结构中,我们不再具备理解力,不再拥有认识能力,甚至不再产生追求真理的兴趣。”[31]将电影研究从“概念出发”的“强制阐释”拉回到电影本体研究,需要新的方法、新的材料、新的范式。
到了计算机大数据时代,数字人文阐释学应运而生。由算法生成的数据具有“去人类中心”的特点,强调以“科学经验”为中心。数字人文中的“信息可视化”不仅为人文学科提供了一种清晰的解释支撑,而且促成了一种与传统人文研究截然不同的意义阐释和知识生产方式。计量电影学、计算机视觉、知识图谱、社交网络等形成的语言系统呈现了意义的生成过程,“这些意义生成过程是构建在其结构中的”[32]。如根据《二对一》的所有镜头时长绘制的电影镜头长度分布图(SLs)(见图2),从中可以看出声音进入电影后导演对电影节奏的考量:对话镜头时间长,峰值高,导演将其安排在影片前6分钟和故事的前半段,随着故事的进展,影片节奏逐渐加快。如果没有这样的可视化呈现,影片节奏很难得以清晰表达,早期电影中声音对电影节奏的影响可能由于工具的问题被遮蔽。同样,可视化的散点图、树状图、网络图、气泡图以及知识图谱、社交网络、地理信息系统都可以被看作呈现意义的修辞方法。由图表所呈现的“并列、层次、顺序、接近、连续、断裂、位置、比例、方向等基本特征对已经确定意义如何产生的指令进行编码,而这些基本的图形原则构成了意义”[33]。因此,计算机阐释虽在一定程度上对传统的基于人类主体经验的人文阐释产生了“验证、修正”的作用,但其阐释的目的并不是为了验证某种人文预设,也不在于修正某个错误的观点,而是构建一种新的阐释框架。如果说人文阐释追求的是加深对语言模糊性、意义多义性的解读,最终追求通向人类真理和价值之路,计算机阐释追求的则是意义生成过程的精确性以及内容的细微性和关系性。同时,计算机阐释仍需结合人文阐释才能形成意义表达,如需要借助特定语境才能理解《二对一》镜头长度分布图对于电影研究的意义。由知识图谱来表达的特定数据库的语义结构也需要进行人文解读。同时,计算机阐释并不必然准确与客观,认为“自动化分析比传统研究方法更为客观或更少偏见”[34]是一种错觉,因为计算机识别的算法也由人工设定,而一些统计数据存在着相当多的错误和无效数据,数据有效性的前提依然需要某种假设。计算机阐释与人文阐释只是阐释框架不同,但殊途同归,都服从于人类特定的研究目的。
图2《二对一》镜头长度分布图
史蒂芬·拉姆齐(Stephen Ramsay)提出了“螺旋解释学”,他认为,“更多数字数据的可获得性在本质上并没有改变人文学科的解释学假设……现在的解释学和以往一样,仍然需要在过多的信息中找到一条明确目的的、有选择的以及主观的路径”[35]。对于电影研究来说,数字人文阐释把电影研究重新拉回了电影本体。在文本解读的具体实践层面上,“量化研究”“计算机视觉”“数据细读”等方法通过其自身呈现出文本的特征,“还原电影原初的生存状态,区分大众/个人、社会心理/精神实体、非艺术/艺术,等等。……在大量的文本现象及其实践中发现真正的学术问题”[36]。在史料梳理上,“知识图谱”“关系网络”“地理信息系统”等“数据的数据”从整体性和关系性视角形成了关于中国电影史的叙述,能够有效解决史料的杂乱无序性,从“原子化”“离散化”的各类材料中找出它们之间的联系,形成一种知识性表达。在中国电影研究的语境下,数据经验与人类主体经验构成了文本阐释的螺旋结构,共同服务于建构中国电影知识体系这一明确的目的。
结语
从“关系—存在”本体论出发审视当前数字人文的研究对象,可以发现作为数码物的电影及数据库与传统电影研究存在着巨大差异,计算机自动化生成的数据与电影文本都成为电影研究的对象。同时,这些工具又是电影文本的阅读者,数据经验进入到研究主体的分析中,成为人类主体经验的一部分。数字人文不仅是一种研究人文艺术的工具和方法,也提供了一种具有范式意义的阐释框架。计算机阐释不会改变人类主体经验对真理和价值的追求,而是在人类主体经验未能通达的地方以数据经验为依据呈现意义。随着计算机大数据技术的飞速发展,计算机视觉识别能够完全根据人的意志完成各类“细读”,基于关系的数据库处理能够生成各种可视化分析。那么,计算机阐释将导向何处?对于中国电影研究来讲,应在构建中国电影知识体系的主轴下展开数字人文的有效阐释,为“建立电影语言的认知系统”“电影意义的阐释系统”“电影历史的鉴别系统”与“电影批评的评价系统”[37]提供方法论支持,并在此基础上彰显电影的中国价值。
(责任编辑:陆晓芳)
作者简介:乔洁琼,女,文学博士,青岛科技大学传媒学院副教授,青岛市签约文艺评论家。
基金项目:本文系国家社科基金艺术学一般项目“数字人文与中国特色电影史学建构研究”(项目编号:23BC039)和泰山学者工程研究专项“中国当代文化建构视域下的新主流电影”(项目编号:tsqn202211386)的阶段性成果。
[①] 许煜:《论数码物的存在》,李婉楠译,上海人民出版社2019年版,第6页。
[②] 参见Luciano Floridi, “Against Digital Ontology,” in Synthese, Vol.168, No.1 (2009), p.151.
[③] 许煜:《论数码物的存在》,李婉楠译,上海人民出版社2019年版,第22页。
[④] [美]尼古拉·尼葛洛庞帝:《数字化生存》,胡泳、范海燕译,海南出版社1997年版,封面。
[⑤] 许煜:《论数码物的存在》,李婉楠译,上海人民出版社2019年版,第2页。
[⑥] 贾利军、许鑫:《谈“大数据”的本质及其营销意蕴》,《南京社会科学》2013年第7期。
[⑦]许煜:《论数码物的存在》,李婉楠译,上海人民出版社2019年版,第44页。
[⑧]Heather Love, “Closebutnot Dep: Literary, Ethicsand the Descriptive Turn,”转引自李天:《数字人文方法论反思》,《中国文学批评》2022年第2期。
[⑨] 贾利军、许鑫:《谈“大数据”的本质及其营销意蕴》,《南京社会科学》2013年第7期。
[⑩] 李天:《数字人文方法论反思》,《中国文学批评》2022年第2期。
[11] [美]尼古拉·尼葛洛庞帝:《数字化生存》,胡泳、范海燕译,电子工业出版社2017年版,前言第51页。
[12] 李道新:《数字时代中国电影研究的主要趋势与拓展路径》,《电影艺术》2020年第1期。
[13] 徐之波:《拟形化历史与结构化知识:数字人文视野下影人年谱研究》,《电影评介》2023年第1期。
[14] 陈悦等:《CiteSpace知识图谱的方法论功能》,《科学学研究》2015年第2期。
[15]参见刘则渊、陈悦、侯海燕等:《科学知识图谱:方法与应用》,人民出版社2008年版,“序言二”第5页。
[16] 李道新:《影人年谱与中国电影史研究》,《当代电影》2019年第1期。
[17]参见林聚任:《社会网络分析:理论、方法与应用》,北京师范大学出版社2009年版,第50页。
[18]参见檀秋文:《晨光美术会和鸳鸯蝴蝶派——从交际圈看史东山20世纪20年代的电影创作》,《南京师范大学文学院学报》2023年第1期。
[19] 鲍宗豪、宋贵伦:《重视大数据时代的社会治理创新》,《红旗文稿》2014年第11期。
[20] 许煜:《论数码物的存在》,李婉楠译,上海人民出版社2019年版,“前言”第4—5页。
[21]参见范倍、郭柳蹊:《风格的代际转移:中国第五代、第六代导演的计量学研究》,《贵州大学学报(艺术版)》2021年第3期。
[22]参见陈刚:《计量电影学与费穆电影结构的可视化路径》,《电影艺术》2020年第4期。
[23]参见李春芳:《〈阮玲玉〉计量分析与中国早期影人图谱》,《电影艺术》2022年第4期。
[24]参见乔洁琼:《重写电影史视阈下史东山电影风格的计量学考察》,《当代电影》2023年第4期。
[25]参见[俄]列夫·马诺维奇:《计算机视觉、人类感官与艺术的语言》,李鹤伊译,《当代电影》2021年第10期。
[26] [德]阿德莱德·赫夫伯格:《物质性和蒙太奇:电影研究、数字人文与运动影像的可视化》,张斌译,《北京电影学院学报》2020年第12期。
[27]参见田丰、华旻磊:《当代知名电影色彩模式研究》,《电影文学》2020年第10期。
[28]参见李春芳:《〈阮玲玉〉计量分析与中国早期影人图谱》,《电影艺术》2022年第4期。
[29] 张隆溪:《阐释学与跨文化研究》,生活·读书·新知三联书店2014年版,第5页。
[30]参见张江:《作者能不能死:当代西方文论考辨》,中国社会科学出版社2017年版,目录。
[31] 赵坤:《“唤醒现象世界的此在经验”——基于阐释学普遍原则的文学批评观察》,《文艺争鸣》2021年第6期。
[32][美]苏珊·施莱布曼、[加]雷·西门子、[美]约翰·安斯沃斯编:《新数字人文导论》,尹倩、肖爽译,北京大学出版社2023年版,第309页。
[33] [美]苏珊·施莱布曼、[加]雷·西门子、[美]约翰·安斯沃斯编:《新数字人文导论》,尹倩、肖爽译,北京大学出版社2023年版,第310页。
[34] [美]苏珊·施莱布曼、[加]雷·西门子、[美]约翰·安斯沃斯编:《新数字人文导论》,尹倩、肖爽译,北京大学出版社2023年版,第434页。
[35] [美]苏珊·施莱布曼、[加]雷·西门子、[美]约翰·安斯沃斯编:《新数字人文导论》,尹倩、肖爽译,北京大学出版社2023年版,第430页。
[36] 陈林侠、林邦:《中国电影学派的学理性:从方法、电影史经验到观念性实体》,《民族艺术研究》2023年第1期。
[37] 贾磊磊:《电影学的渐进计划》,《艺术学研究》2022年第5期。