19世纪英国的统计学家威廉·法尔——“大数据”观念的奠基者

文摘   2024-11-25 06:01   北京  

实至名未归

——19世纪英国的统计学家威廉·法尔

赵秀荣      《 中华读书报 》( 2023年05月03日   19 版)

    威廉·法尔在1865年

    法尔为1843年《关于英格兰出生、死亡和婚姻登记的第五个登记总长年度报告》绘制的一张生命统计表

  法尔为英格兰的统计事业作出了重大贡献,堪称维多利亚时代社会医学运动最杰出的人物之一,乃至今天“大数据”观念的奠基者,但他到最后都没当上总长。

  新冠疫情期间,我们每天可以看到各种统计图表、统计数字——小到每个城市,大到世界卫生组织的全球统计。正是这些统计数字让我们了解疫情的波动,让各国政府准确掌握疫情发展趋势并作出相应决策。追溯历史,英国是最早开始进行人口普查(参见笔者《英国人口普查千年史》,中华读书报2021年11月3日)和医学统计的国家,统计学家威廉·法尔(William Farr,1807-1883)功不可没。

  1

  在1837年创建登记总署(General Register Office)之前,英格兰和威尔士没有全国民事登记系统。洗礼、婚姻和葬礼都记录在由英国国教(英国圣公会)神职人员维护的教区登记册中。英国国教几乎拥有垄断地位,他们掌握的登记册也拥有特殊的法律地位。

  然而,随着17世纪后期非国教的新教徒大幅增加,以及针对天主教徒和其他持不同政见者的法律逐渐放宽,越来越多的洗礼、婚姻和葬礼没有记录在英国国教的登记册上。1753年大法官哈德威克勋爵(Lord Hard⁃wicke,1690-1764)推动通过了《为更好阻止秘密婚姻法》,努力用一种标准的结婚登记表来防止“秘密”婚姻。结婚登记表附在法令最后,该登记表必须由婚姻双方、见证人和牧师签字。结婚预告(banns)必须在教堂公布,任何一方21岁以下的婚姻必需要有父母的同意(鳏夫或寡妇除外)。对于不遵守法令的牧师处以14年的流放。虚假登记、伪造登记表或结婚证书、恶意破坏登记表都是重罪,处以死刑。除犹太人和贵格会教徒外,合法婚姻必须按照英国国教的仪式进行,天主教徒和非圣公会的新教徒亦无例外。此法令不适用于苏格兰、海外或王室婚姻。

  1812年英国政治家乔治·罗斯(George Rose,1771-1855)爵士主导通过的《教区登记法》规定牧师对所有私人和公共洗礼、结婚、死亡进行登记。它还规定,法庭不接受非国教的新教徒登记的出生、婚姻和死亡的记录。只有那些由英国国教的神职人员维护的文件才能作为法律文件,这给非国教的新教徒带来了相当大的困难。19世纪20年代很多人曾向议会建议,设立中央负责的登记制度,但没有任何结果。这种没有统一登记体系记录的洗礼、婚姻和葬礼会影响出生和婚姻的合法性与继承权,因此,拥有法律文件非常重要。加之,随着工业化的发展,特别是工业城镇人口的迅速增长,造成住房严重拥挤,政府需要调查婴儿死亡率、生育率、识字率、恶劣生活条件与预期寿命之间的关系,以改善居住条件、减低死亡率,因此也需要可靠的人口统计数据。几十年来,人们一直在采取行动,力图建立一个世俗的、中立的、非教会的出生、婚姻和死亡登记制度。欧洲大陆的一些国家已经实施这样的制度,拿破仑的成就之一就是他在法国建立了良好的民事登记制度。

  下议院于1833年3月28日任命一个特别委员会,调查全国登记情况。委员会于1833年8月15日提出报告,建议组建登记总署,其目的是向政府、地方当局和个人提供重要的统计信息,利用这些信息评估为改善人民健康而采取措施的价值。根据委员会的建议,《英格兰出生、死亡和婚姻登记法》于1836年通过。该法案的目的有两个:(1)设立登记总署,并任命一名登记总长;(2)要求对所有出生和死亡进行适当形式的登记——每个家庭的父母在孩子出生42天内,或死亡后的5天内,要向本地区的登记员报告。登记总长需要把每年的统计摘要提交给议会。按区登记,登记区的划分与济贫联合区一致。每个区都任命一名登记员。提供虚假信息的是伪证罪;不登记出生、结婚和死亡的每次罚款不超过5镑;故意毁坏、销毁登记证书或伪造、篡改证书都是重罪。

  新西兰学者库伦认为,1836年的《英格兰出生、死亡和婚姻登记法》是一项重要法案,奠定了英格兰和威尔士生命统计的现代基础。根据这部法令创建了登记总署,从那时起,它一直是有关英格兰和威尔士人口结构数据和分析的主要来源。此外,该法案对19世纪英国政府的发展也具有重要意义,如《伦敦统计学会杂志》所解释的那样,该法案旨在将出生、死亡和婚姻登记视为民事行为,而不论宗教信仰差异如何。从这个意义上说,它是宗教自由原则的延伸,并让异议者摆脱了之前所承受的压力。

  1837年登记总署成立,办公地点位于伦敦的萨默塞特宫。此后,这里成为官方统计数据的主要集成地。登记总署的成立对英国公共健康的发展功不可没,因为统计数据被认为是现代国家的重要组成部分。然而,在登记总署发挥重要作用的不是登记总长,而是从未任过登记总长的威廉·法尔。

  2

  法尔是英国统计学家和流行病学家,1807年11月30日出生于什罗普郡的肯利。他曾帮助编辑《英国医学年鉴》,并与罗伯特·汤姆森(Robert D. Thomson,1810-1864)一起负责周刊《英国医学、药学、生命统计和普通科学年鉴》,但这个周刊持续时间并不长。他还写了一系列关于生命统计的文章,最终在经济学家约翰·拉姆齐·麦卡洛克(John Ramsay McCulloch,1789-1864)主编的《大英帝国统计报告》(1837年出版)中发表的《生命统计》一章让他名声大振,树立了其统计学家的声誉。

  1837年,法尔获得了登记总署的临时任命,以帮助整理新创建的出生、死亡和婚姻登记系统中的数据。1839年7月10日,他以每年350英镑的微薄薪水获得正式任命,担任摘要编辑。1842年他被提拔为统计部门主管。法尔撰写了41份年度报告,监督了周报和季报的编辑、出版,并帮助设计和编写了1851、1861和1871年人口普查的报告。“在他的职业生涯中,法尔开发并推广了已成为生命统计和流行病学标准工具的方法。他1839年设计并在1842年和1855年两次修订了疾病分类法。这种疾病分类法在19世纪后期一直使用,并长期影响着《国际死因列表》的统计。他展示了如何通过比较生活在不同条件下的人群的粗死亡率或标准化死亡率来阐明环境对健康的风险。他还促使生命统计表被接受为人口寿命的最佳衡量标准。他计算了英格兰和威尔士的三个生命统计表(1841年、1838-1841年和1838-1854年),一个英格兰卫生区的生命统计表,以及英国矿工等特殊人群的生命统计表。此外,他展示了如何使用生命统计表技术来研究更广泛的问题,如人类生育能力、军队和公务员的晋升、金币的流通和英国政府的任期。”

  法尔认为死亡原因的登记,除了有助于实用医学外,还将使医学原理更加精确。与其他自然科学一样,在医学中,通过掌握的统计数字可以用数值表达代替不确定的推论。这种变化的好处是显而易见的。例如,一种疾病的流行是由一定人数中一定时间内的死亡人数表示的,其准确度与温度计指示的温度一样。这样,当知道该地区的人口均值时,就可以准确地追踪流行病的起落,也就有可能考察在一系列疾病中某些流行病是否影响其他流行病。

  法尔致力于公共健康改革,并用许多报告来证明英国城市中本可预防的疾病造成的人类生命损失。他还绘制了“健康地区”,并比较了这些地区和不健康地区之间的死亡率。为了改变这类状况,在1846年,法尔按死亡率的高低给各大城市“排名”——这对各地改进公共健康构成极大压力,因为没有一个城市想排在第一位。

  但法尔的工作并不是没有缺陷,“在他的职业生涯中,他提出了解释医学和社会现象的‘定律’:如他在1852年制定了霍乱死亡率的‘上升定律’,并在1879年提出了将死亡率和人口密度相关联的‘密度定律’。这些根本不是‘定律’,它们并非在所有情况下都始终如一,而是以数学形式简单地表达了某些变量在独特和离散情况下的关系。法尔的‘海拔定律’解释了1849年伦敦霍乱的发病率,该定律旨在证明泰晤士河以上的海拔与霍乱死亡之间的反比关系,既不能定位也不能解释霍乱的原因,也不能用作其他受影响人口的分析工具,只是简单地描述了一个独特的分布。”但这并不能否认他使用更科学的方法来统计疾病,尤其是对探究流行病的原因作出的贡献。

  3

  19世纪30年代对人类健康和疾病统计的兴趣延续了早期政治算术传统和复辟时期格朗特和佩蒂的工作。最初的“统计运动”尝试收集社会信息,并学习对这些信息如何解释和使用。法尔所受的医学训练、计算技能,他对流行病学、生命统计和人口统计学的兴趣,都集中在一个事业上——基于数值关系构建一个预测性的社会科学。对于法尔和同行来说,数据充满了统计学家可以解码的含义,也就是他所说的统计学“是国家的科学——生活在政治共同体中的人的科学,从未像今天一样对其有如此大的需求。”数字将带来启蒙和社会科学的构建,从而解释社会行为,并为其有效监管提供线索。

  这一时期成立了大量的统计部门:1832年贸易委员会统计部成立,1833年曼彻斯特统计学会成立,1834年伦敦统计学会成立,在接下来的十年里,许多新的省级城市——利兹、格拉斯哥、贝尔法斯特、布里斯托尔等都成立了统计协会。登记总署1837年开始进行民事登记,其负责人是登记总长。第一任登记总长是托马斯·利斯特(Tomas Hen⁃ry Lister,1800-1842)。正如公共健康改革家艾德温·查德威克(Edwin Chadwick,1801890)后来所说的那样,利斯特是“一位非常优秀的小说家,但对登记这个问题毫不关心,是最不适合这个职位的人”。但登记总署为法尔提供了大展宏图的机会。他从1839年起成为伦敦统计学会的活跃成员,并在1870年代成为其主席。法尔将登记总署的年度报告变成了他热情表达个人观点、在一定程度上鼓动国家干预的工具。

  死亡率可以呈现当时不同的城镇、城市或地区(在一个标准化的、按时间顺序表示的框架内)的生活条件。换言之,死亡率是国家在改善健康方面取得什么样进展的晴雨表。因此,法尔统计最关注的就是死亡率。全国分为618个区,每个区都任命了一名登记官。登记总署1837-1838年的年度报告按年龄组进行死亡率的统计,在5岁以下的儿童按1岁以下、1-2岁、3-4岁,之后是5岁的年龄组分类,一直到90岁以上。

  统计按男性、女性、具体死亡人数进行,并附有死亡千分比。其中1岁以下婴儿死亡比例惊人,男孩为234.66‰,女孩为193.72‰,总死亡率为214.54‰。1-2岁婴儿的总死亡率为128‰。“从法尔先生关于死亡原因的一份非常精辟的报告中可以看出,在截至1837年12月31日的半年中,确定了141,607起死亡原因。给出了英格兰和威尔士、以及该国25个区中各种原因导致的男性和女性死亡总数,并且从登记的数字中推断出9种死因中每个死因的年死亡率。还计算了各区各类疾病造成的每10万人死亡比例。”在法尔的领导下,死亡率被提升为公共健康的主要“数字测试”,在登记总署办公室的所有出版物(每周、每季度和每年)中占据显著位置。1863年,有人将登记总署对死亡率的使用称为“国家计算系统”。通过这些数字,可以看到任何特定地方的死亡率,并将某一地区与其他地方进行比较,可以看到此地与其他地方的差距,或者说与已经确定的任何理想的健康标准之间的差距。

  除了对死亡率的关注,法尔还在疾病分类上作出贡献,对公共健康而言意义同样重大。在1837-1838年法尔的统计中把疾病根据其特征分为12类:流行病、地方病和传染病、神经系统、呼吸器官、循环器官、消化器官、泌尿器官、生殖器官、运动器官、皮肤系统、不确定病灶、老年和暴力死亡。法尔的一个首要任务是建立统一的死因名称系统(命名法),以及统一的分类系统(疾病分类学),通过该系统对这些死因进行分组,以便于统计、分析。这就是他首次提出的“统计分类学”。并且,特别重要的是在1842年之后法尔决定将“流行病、地方病和传染病”单独分类;被称为“发酵病”(zymotics)的疾病包括霍乱、天花、麻疹、猩红热、流感和斑疹伤寒。在法尔看来,这一大类疾病是健康的指标,如果这些疾病可以得到控制,死亡率就会下降。到1856年,法尔的新的分类学已包含五个类别:第一类是发酵病,第二类是体质疾病,第三类是局部疾病,第四类是发育类疾病,第五类是暴力死亡。这为今天的疾病分类学打下了基础。

  4

  除了在登记总署工作外,法尔还是其他议会调查委员会——保险协会特别委员会、所得税和财产税特别委员会、皇家矿业委员会和皇家卫生委员会——的积极参与者。他还设计了邮局保险计划并担任私人精算顾问。此外,他还是伦敦统计学会和国际统计大会的积极成员。法尔精通法语、德语和意大利语,曾代表英国参加过多次统计大会,在他的职业生涯中获得了许多专业荣誉,并于1855年获选皇家学会会员。但他从未担任登记总长。1879年,第二任登记总署署长乔治·格雷厄姆退休时,法尔申请这一职位,而登记总署任命了他人,法尔遂于1880年1月选择退休,以抗议他在医学统计和公共健康领域被忽视的贡献。

  今天,法尔仍被认为是维多利亚时代英格兰社会医学运动最杰出的人物之一。不仅如此,他还是如今影响我们生活方方面面的大数据的奠基者。


玮玮道保
不取悦,惟知识。北大风保系第三届本科毕业生,保险文化传播者:走正道,讲真话,办实事,谓之玮玮道保!
 最新文章