陈春声 | 统计分析方法在史学研究中的应用

学术   2024-10-10 09:27   江西  

陈春声  中山大学历史学系教授


 19世纪60年代以后, 欧美的一些学者已在人口史、农业史、价格史、商业史等领域运用数字材料和一些初步的统计方法, 但系统的计量分析方法应用于史学研究中开始于20世纪50年代。美国是最早采用计量方法研究历史的国家,其运用范围的广度和运用方式的多样化在西方史学界居领先地位。1957年9 月, 哈佛大学经济史学家阿弗雷德·康拉德(Alfred H.Conrad)和约翰· 梅耶(John R.Meyer)《经济理论、统计推定及经济史》一文率先提出推测统计学也适用于历史研究, 可以用数量方法理解历史事件。此后, 越来越多的经济史学者把数量分析方法运用于对美国工业革命、南方奴隶制、税收制度等的研究, 形成一个颇有影响的“ 新经济史” 学派。继之而起的又有所谓“ 新政治史” 和“ 新社会史” 学派。前者着重于用计量方法分析立法、司法机构的表决和竞选运动中选民的投票情况; 后者则把数量方法应用于对不同社会集团的人种学和人口学结构, 人口流动和家庭问题等的研究中。后来, 法、英、日、澳、苏等国的一些史学家也在他们的研究中应用了数量方法。
用计量方法研究史学, 习惯上被称为“ 计量史学” 或“ 历史学计量学派” 。它所用的数量方法,包括: ①利用电子计算机系统地积累、贮存和利用史料, ②进行统计分析, 特别是运用推测统计学的分析方法; ③建立数理模型。三者中统计分析方法的地位最重要, 作用最大。
史学研究中的运用统计学分析方法对促进历史研究的深入开展具有明显的益处。
第一、在历史资料的整理、发掘方面, 统计学以处理大量数据见长, 统计分析为处理大量数字型的历史资料提供了一种比较便利的方法, 从而使许多过去难以使用的史料可能为人们所利用。在美国, 正是由于统计分析和其它数量方法的使用, 像国情调查原始记录、财政部及其它政府机关的记录文件、教会记录、死亡证明书、家谱、教区簿册、学校出勤簿等许多过去从未被利用过的资料都开始被用于历史研究。数理统计的抽样法和假设检验也为判断统计资料及其计算结果的可靠程度和其它性质提供了一整套独特的方法,有助于我们对历史统计资料及所得出结论的可靠性进行较严格的定量分析。例如, 我们经常根据一些零散的数字估算某一时期某一地区的平均产量、平均地租量、人均粮食占有量、人口密度等等总体平均数, 如果把用于估算的数据看作抽样指标, 我们就可以用抽样估计的方法确定在一定概率保证程度下, 总体平均指标的误差范围, 这个误差范围可以精确到小数点后若千位。这样的分析比起简单地下一个“ 比较可靠” 或“ 存在一定误差” 这样的结论要更严密一些。统计分析还能利用不够完整的材料建立数学模型, 再用数学模型的推导来补充资料的残缺部分。美国新经济史学者就认为, 在厉史数据贫乏的情况下, 可以利用复杂的统计方法推算出所需的历史数据。笔者在研究清代广东粮价间题时, 也曾试用线性回归和内插法对一些缺乏资料的月份的米价数据进行增补。这种增补历史资料的方法, 是传统的史学方法所难以做到的。
 第二、历史研究中利用资料进行推理, 提出论点的过程可以成为统计分析方法应用的更重要的领域。首先, 运用统计分析方法有利于我们更严密地对历史发展进程进行细致的数量分析。在一定条件下, 定量分析的程度是衡量一门学科发展水平的重要标志。目前我们的历史研究还基本上局限于定性分析的阶段, 所采用的主要是文学性的复述和评论的方法。由于社会历史现象的极端复杂性, 在现阶段想把史学研究中的定性分析完全建立在定量分析的基础上, 是不现实的。但为了历史科学的发展和未来, 我们也必须在可能的情况下尽可能多地采用定量方法, 这样做可以开辟新的研究领域, 有助于提高定性分析的科学性,使得出的结论更富于逻辑力量。
 其次, 运用统计分析方法有助于我们从偶然的历史现象中发现其必然性, 从特殊的历史事件中把握其内在的一般规律。数理统计是建立在概率论基础上的, 以概率论著名的“ 大数法则” 是应用数学方法的理论基础。“ 大数法则” 认为, 在大量偶然因素的集合中, 通过大量的观察使之互相抵销, 互相平衡, 就可找到大量偶然现象或事件客观存在的集体规律性, 即概率规律性, 或叫统计规律性。根据这一法则, 数理统计学研究并且提供了从各种偶然现象中寻求统计规律性的一系列方法。例如, 统计学可以把现象间的联系分成两种不同的类型: ① 函数关系。它反映现象之间严格的依存关系, 在这种关系中, 对于某一变量的每一个数值, 都有另一个变量的确定的值与之相对应。这种关系可以用一个数学表达式反映出来。例如, 在全电路中, 电流强度、电阻和电动势的关系就可用下式表示:; 在资本主义社会, 剩余价值率、剩余价值和可变资本则有如下关系: 。②相关关系。这种关系的主要特征为某一规象的标志与另外的标志之间存在一定的依存关系, 但这种依存不是确定和严格的, 某项标志的每个数值可以有另外若干数值与之相适应, 在这些数值之间表现出一定的波动性, 但这种波动又总是围绕着各个数值的平均数并遵循一定的规律进行的。大量的社会现象之间的关系都属于这种关系。统计学把研究这种关系的内在联系和表现形式作为自己的重要任务, 其回归分析和相关分析方法都以这种关系为主要研究对象, 它能确定随机变量之间是否存在相关关系, 并且以数学模型测定现象之间相关的密切程度。

 第三、国外一些学者认为, 统计分析方法还可以用于对可能发生的历史事件进行“ 预测” 。统计预测是统计学的重要内容, 它用建立适当的数模型的方法来模拟一个资料的一般变动结构, 通常应用的有固定平均数模型, 移动平均数模型,近期趋势模型, 周期变动模型, 回归模型, 随机模型等。统计预测方法己被国外计量史学家用于历史研究中, 这方面最典型的是所谓“ 反事实度量法” 。这种方法先假定一个历史事实是不存在的, 然后预测在这种假定条件下可能出现的情况。例如, 美国新经济史学家福格尔和恩格尔曼假设美国南北战争未曾爆发, 根据这个假设得出的结论是, 南方奴隶制有利可图, 奴隶是有一定劳动积极性的, 因而奴隶制可以延续到1890年,而且比1860年处于更有利的地位。由于“ 反事实度量法” 得出的结论有许多不合常规之处, 这种方法一直受到国外传统史学家的抨击和反对。由于接触的材料不多, 笔者目前还难以对这种方法是否可取作出明确判断。不过, 如果有正确的世界观作指导, 全面系统而不是断章取义地使用材料, 严格遵循统计预测的科学方法, 这种方法也许能为我们所用并得出一些有启发性的结论。事实上, 我们过去的史学研究也用过类似的思维方法, 例如, 毛泽东同志指出如果没有西方资本主义入侵, 中国也将逐步发展到资本主义社会, 有人断言如果清朝不闭关自守, 中国历史的发展将会走上另一条道路, 有的同志提出太平夭国如不定都天京, 继续北伐, 则可能推翻清王朝; 等等。这些都是对历史发展的另一种可能性进行推断,只不过没有使用定量方法而已。在中国历史的研究中, 一些外国学者也运用了统计分析方法。就笔者所知, 美国知名经济学家, 哈佛大学教授珀金斯在其有名的《1368-1968年中国农业的发展》一书中, 就大量采用了统计分析和数理模式推导的方法; 1980年哈佛大学举办的一次以中国历史上粮食和饥荒问题为内容的学术讨论会上, 有的学者提出了计算一个国家人口大量死亡后恢复到原有水平所需时间的数学模型, 香港中文大学教授全汉昇和美国哈佛大学博士克劳思在合作研究清中叶米价问题时, 也把经济统计学的移动平均趋势_剔除法用于对米粮季节差价的分析中。
在肯定统计方法对历史研究的作用的同时,必须指出, 历史研究中运用统计分析方法是有一定限度的。它多只适用于有较明显数量关系存在的场合, 而且使用统计分析方法, 对史学工作者收集史料、考据辨伪、比较分析等基本功方面也提出更高的要求, 只有大量、准确地占有材料, 从历史本身出发进行分析, 才能把握历史发展的内在规律, 避免用某些现成结论去套历史规律或用几个时髦的现代科学术语为历史事件和历史人物贴标签这种庸俗的做法。
 在国内, 在史学研究中系统地、科学地在史学研究中运用统计分析方法的论著还几乎没有见到。虽然一些学者在讨论史学方法论问题时强调要重视计量研究, 但真正扎扎实实这样做的为数不多。这种局面必须尽快改变。我认为, 我国史学计量研究虽然起步较晚, 但并不是不具备进行这种研究的条件。
 首先, 我们有马克思主义的辩证唯物主义和历史唯物主义作指导, 可以把定量分析和定性分析更科学地结合起来, 从量变和质变的辩证统一中研究历史事件的演变过程, 避免西方计量史学研究者经常出现的“只见树木, 不见森林”的偏见。
其次, 中国浩如烟海的历史资料, 为我们进行统计分析提供了丰富的资料基础。正史、政书、笔记、文集、档案、方志、簿记等文献资料中保存的有关人口、土地、赋税、地租、物价、仓储、货币金融等等问题的极其大量的数据, 可以直接为我们的研究所利用, 尤其是大量历史资料中没有用数字形式表现出来的各种数量关系, 更值得发掘和研究。例如, 有的同志按理论、实验和技术三个部分, 对19纪以前两千五百年间中国的近二千项科学成果进行统计, 求出了中国科学技术水平的累加增长曲线和绝对增长曲线, 把它与西方进行对比, 以此说明中国近代科学落后的原因。
 再次, 计算机的普及和推广, 为我们运用统计分析方法提供了重要的工具。20世纪60年代以后国外计量史学的发展与电子计算技术的普及有直接关系, 正是有了电子计算机, 人们才可能以前所未有的规模和速度进行历史的计量研究。例如, 从1969年开始, 美国300多位各种专业的学者在宾夕法尼亚大学教授赫什伯格的领导下, 利用计算机, 对1850年 、1860 年、1870年、1880 年四个国情调查年份中住在费城的250万人口的调查资料进行了统计分析, 以反映该城市在19世纪50-80年代社会的发展情形。这种涉及极大量人口统计的研究工作是用传统方法所难以完成的。
最后, 国外计量史学的研究成果和其它学科对统计分析方法的应用, 可以为我们提供有益的借鉴。同时, 经济学、管理学、人口学、社会学等学科正日益大量地使用统计学方法, 他们的做法和经验也可以为我们提供有益的借鉴。


*注释从略。本文选自付海晏主编:《大数据与中国历史研究》(第3辑),社科文献出版社,2021年9月版。转自“华中师大大数据”历史公众号

历史人类学
推送历史人类学、区域史、田野调查、民间文献研究动态,也涉猎历史学、人类学相关学科新书新刊、会议讲座等海内外最新资讯
 最新文章