当文学邂逅数学:从“远读”到“文学数学”

文摘   2024-09-17 14:22   陕西  

近年来,数字人文领域蓬勃发展,人工智能技术也逐渐渗透到人文学科的各个角落。然而,如何将量化方法与人文学科的传统研究方法相结合,一直是数字人文领域备受关注和争议的话题。Michael Gavin 的新作 Literary Mathematics (Quantitative Theory for Textual Studies,文本研究的量化理论)正是试图在这一领域搭建一座桥梁,探索如何利用数学模型来描述和解释文学现象,并提出了一个新的理论框架——“文学数学”。

(相关资料:人文研究中的量化方法 与 定性的数字人文研究方法

一、读(Distant Reading):数字人文的一个突破

“远读”的概念由 Franco Moretti 于2000年提出,其核心思想是通过量化分析大量文本数据来揭示宏观的文学模式和历史趋势。这一方法的出现,为文学研究带来了全新的视角,也引发了关于量化方法与传统“细读”方法之间关系的激烈争论。

支持者认为,“远读”可以帮助我们突破传统研究方法的局限,揭示人工难以观察到的宏观模式,从而对文学史进行更加全面和深入的理解。例如,通过分析大量文本中的人物、主题、风格等元素的分布,我们可以揭示文学流派、作家群体、社会思潮等宏观现象的演变规律。

然而,批评者则担心量化方法会简化甚至扭曲文学作品的复杂性和丰富性。他们认为,文本的意义不仅仅体现在词频统计等量化指标上,更重要的是其内涵的深度、情感的表达、修辞的技巧等难以量化的方面。

二、从“远读”到“文学数学”:深化数字人文理论基础

Gavin 认为,尽管“远读”的实践已经取得了诸多成果,但其理论基础仍然相对薄弱。他指出,学者们常常将“远读”与“细读”对立起来,并执着于争论哪种方法更好,而忽略了一个更重要的问题:量化方法究竟能为文学研究带来什么?我们该如何理解量化分析的结果?

为了回答这些问题,Gavin 提出了一个新的概念——“文学数学”。他认为,文学数学不是数学的一个分支,而一种将数学应用于文学问题的实践,其核心是将关键概念用形式表达式来描述,并揭示文学数据的底层结构

三、差异的分布:文学数学的核心实践

Gavin 认为,学数学的核心实践是描述“差异的分布”。他指出,在任何一个文本集合中,都存在着各种各样的差异,这些差异可以体现在词汇、风格、主题、元数据等各个方面。通过量化分析,我们可以描述这些差异的分布规律,并将其与历史语境相联系,从而揭示文本背后的社会文化意义

为了实现这一目标,Gavin 借鉴了网络科学、计算语言学、地理空间语义学等多个学科的理论和方法,将语料库视为一个拓扑空间,并利用矩阵代数、图论、概率论等数学工具来分析文本数据的结构和关系

四、相似的词往往出现在具有相似元数据的文档中:文学数学的核心理念

Gavin 认为,文学数学之所以有效,是因为它基于一个核心理念:“相似的词往往出现在具有相似元数据的文档中”。这一理念源于语言学中的“分布假设”,即词义与其在文本中的分布模式密切相关。

Gavin 将这一理念扩展到更广泛的语境中,他指出,文本的元数据(如作者、出版时间、出版地点等)也反映了文本的语境,因此,相似的词往往出现在具有相似语境的文档中。

这一理念为我们提供了一个理解文本与历史关系的新视角。它意味着,通过分析文本的词汇特征和元数据,我们可以揭示文本背后的社会文化语境,以及文本是如何参与到历史进程中的。

五、EEBO案例研究:文学数学的应用实践

为了展示“文学数学”的应用价值,Gavin 以早期英语书籍在线 (EEBO) 语料库为例,进行了一系列案例研究。他展示了如何:

  • 利用网络科学分析出版元数据,揭示了早期现代书籍贸易的结构和演变。

  • 利用计算语义学分析单词的含义,并展示这些含义是如何在时间中变化的。

  • 利用地理空间语义学创建早期现代世界的“概念地形图”,展示地理位置是如何影响单词含义的。

这些案例研究表明,通过量化分析,我们可以获得对早期现代英语文学的全新认识,并挑战传统研究方法的局限。

思考:数字人文视角下的“文学数学”

从数字人文的角度来看,Literary Mathematics 的重要意义在于:

  • 深化数字人文理论基础: 该书对“远读”的理论基础进行了反思和拓展,并提出了一个更加严谨和可操作的分析框架——“文学数学”。

  • 拓展数字人文研究方法: 该书借鉴了网络科学、计算语言学、地理空间语义学等多个学科的理论和方法,为数字人文研究提供了更加丰富的工具箱。

  • 推动人工智能与人文学科的深度融合: 通过将数学模型应用于文学研究,该书为人工智能技术在人文学科中的应用提供了新的思路和方法。

Literary Mathematics 是一部极具开创性和启发性的作品。在人工智能时代,人文学科面临着前所未有的机遇和挑战,而“文学数学”或许可以成为我们迎接这一挑战的利器。未来,随着人工智能技术的不断发展和数字人文研究的不断深入,“文学数学”将拥有更加广阔的应用前景。


智能数字人文
人工智能与数字人文