人文研究中的量化方法

文摘   2024-09-04 14:40   陕西  
Quantitative Methods in the Humanities: An Introduction (2019) 不仅为人文研究提供了丰富的量化方法,更重要的是,它强调了这些方法背后的核心理念和潜在问题,这对于数字人文学者批判性地运用量化方法有重要意义。
一、摆脱数字崇拜,回归源材料批评
作者首先批判了两种极端倾向: 一是对数字的盲目崇拜,认为数字能够直接揭示真相;二是对量化方法的完全排斥,认为其与人文研究格格不入。作者指出,数字并非万能,量化方法也并非洪水猛兽,关键在于如何合理地运用它们。
作者强调,源材料批评是历史研究的基石,同样适用于量化研究。数字人文学者不应将数字视为理所当然的“given”,而应将其视为需要仔细解读的“capta”(Drucker 2011)。他们需要追问数字是如何产生的,这些数字代表了什么,以及这些数字背后的潜在偏见和局限性。例如,在分析过去统计数据时,不应将其视为完全客观的记录,而应将其视为特定历史背景下,由特定人群出于特定目的而产生的产物。作者以Joan Scott (1986) 对19世纪巴黎劳工统计数据的分析为例,说明了统计数据中隐藏的社会和政治偏见。需要对这些数据进行批判性的解读,才能揭示其背后的真实含义。
二、构建语料库:目的明确,兼顾可比性
作者认为,构建语料库是量化研究的第一步,也是至关重要的一步。人文学者需要根据研究问题,选择合适的资料,并将其整理成可供量化分析的数据集。作者提出了构建语料库的四个基本原则:
  • 任何类型的资料都可以量化: 从统计数据到个人记录、文本甚至图像,都可以进行量化分析。
  • 比较是理解数字的关键: 只有通过比较,才能理解数字的含义,并避免过度解读。
  • 避免对少量资料的过度分析: 少量资料之间的细微差异可能并无实质意义,应避免过度解读。
  • 学会合理采样: 当资料数量庞大时,合理采样可以有效地减少工作量,同时保证结果的可靠性。
三、数据分析方法:从描述到解释
作者介绍了多种数据分析方法,并将它们分为两类:描述性分析和解释性分析。
  • 描述性分析: 主要用于揭示数据的基本特征和结构,常用的方法包括列联表分析和因子分析等。列联表分析(Cross-tabulation Analysis)可以帮助研究者了解不同变量之间的关系,例如社会出身与职业之间的关系。因子分析(Factor Analysis)可以帮助研究者从大量变量中提取主要特征,并构建类型学。
  • 解释性分析: 主要用于探索变量之间的因果关系,常用的方法包括回归分析(Regression Analysis)事件史分析(Event History Analysis)等。回归分析可以帮助研究者了解一个变量是如何受其他变量影响的,例如种族、性别和教育程度对工资水平的影响。事件史分析可以帮助研究者了解事件发生的时间和原因,例如影响个人迁徙的因素。
作者强调,不同的分析方法适用于不同的研究问题和资料类型,人文学者需要根据具体情况选择合适的方法。
四、网络分析与轨迹分析:超越个体,关注结构
作者认为,网络分析(Network Analysis)轨迹分析是研究社会关系、历史进程等复杂现象的有力工具。网络分析可以帮助研究者了解网络的结构和个体在网络中的位置,例如政治人物之间的关系网络。轨迹分析可以帮助研究者了解个体生命历程的模式和变化,例如个人职业生涯的演变。
五、文本分析:挖掘文本的隐藏信息
作者认为,文本分析方法可以帮助研究者从大量文本资料中挖掘隐藏信息,并进行更深入的分析。常用的文本分析方法包括词频统计、文本距离计算和主题建模等。词频统计可以帮助研究者了解文本中哪些词汇使用频率较高,从而推断文本的主题和风格。文本距离计算可以帮助研究者比较不同文本之间的相似度,例如不同作者作品的风格差异。主题建模可以帮助研究者从大量文本中自动提取主题,并分析主题之间的关系。



智能数字人文
人工智能与数字人文