悦茶丨李伯重丨史料与量化:量化方法在史学研究中的运用讨论之一

文摘   2024-11-02 20:01   北京  



本文原载于微信公众号“丹黄甲乙”。

文献信息

文献标题:史料与量化:量化方法在史学研究中的运用讨论之一

文献作者:李伯重

文献来源:清华大学学报(哲学社会科学版)

发表时间:2015.07


摘要

史料是史学研究的基础,史学研究的首要步骤是对史料进行鉴别和处理。而在此方面,量化方法是很有用的。历史学者们一向相信“原始资料”(或者“第一手资料”)是真实可靠的,但其实并不尽然。本文通过一些个案分析指出:即使是一些被认为无可置疑的“原始资料”,其实也是不可靠的。而在对这些资料进行鉴别和处理方面,量化方法不仅有用,而且发挥的作用是其他方法所无法替代的。当然,正如任何方法一样,量化方法在史料的鉴别和处理方面也有其局限性。因此我们在采用量化方法时,要充分注意其适用性。


关键词:

史料;量化方法;计量史学;经济史



李伯重(图源百家号)


一、引言


在史学研究中使用量化方法,早已有之,不是新鲜事。但是自从以量化为主要方法的史学研究(即“量化史学”或者“计量史学”)出现后,学界对量化方法的争议就从未停止。


在此过程中,量化史学的命运也起伏不定,直至今日,学界对此的看法仍然呈现出两极化。许多拥护者认为量化方法是史学研究“科学化”的不二法门,而反对者则将量化方法视为史学研究中的旁门左道,甚至不屑一顾。


这种两极化的看法,导致了严重的后果。在量化史学使用最为成功的领域——经济史研究中,这种分歧甚至导致了学科的分裂。


古德里奇说:量化经济史导致了“新经济史”的出现,“新经济史的出现是经济史研究历史上的一件大事。定量研究方法的采用使得传统的经济史研究正在面临一场严重的挑战,这是一次新的‘知识革命’,就好像工业革命时期机器织布对手工织布是一次革命一样”。


古德里奇进而指出:“新经济史学家并没有研究经济史本身,他们只是把历史当作‘背景’,而关心的仅是经济增长。而对于传统的经济史学家来说,经济增长并不是他们所要关心的唯一问题,而且他们也不仅仅研究经济史上的数量问题,还要研究经济史上的‘质’的问题,即不仅仅研究量变,还要研究质变。”


由于二者在研究的目的和取向方面的严重分歧,“经济史研究已经分成两个阵营,一个是以文字形式表现,一个是以数据形式表现,前者可以称之为‘经济史’,后者已经不能称之为‘经济史’了,需要另外起一个名称”。


然而,不管使用什么方法来研究历史,所研究的对象都是同一个,即过去确实发生过的事情。


就经济史而言,吴承明说经济史是“过去的、我们还不认识或认识不清楚的经济实践(如果已经认识清楚就不要去研究了)”。


希克斯(John Hicks)则说经济史“可以看成是一个单一的过程,即一个具有可以认识其趋势(至少到目前为止)的过程”。


由这两个定义出发,可以得出如下结论:


第一,经济史研究的对象是一个可以认识的客观存在(尽管已经过去了),所以经济史研究也是科学。既然是科学,当然也就要使用科学的研究方法。


第二,经济史是过去的经济实践,而经济实践包括多方面的内容,而不同的内容需要不同的方法进行研究。


不仅如此,熊彼特更说经济史“只是通史的一部分,只是为了说明而把它从其余的部分分离出来”。通史的大多数部分是不能用量化方法研究的。


熊彼特(图源搜狐)


因此,当我们研究过去发生的事情时,需要量化的只是其中的一部分,因此夸大量化史学的适用范围是不正确的。


但是,也有一些方面确实可以并且需要(甚至必须)量化研究,如果不使用量化研究的方法,就无法真正了解这些方面的实际情况。


因此,离开了具体的研究对象去抽象地谈论量化方法是否适用于史学研究的问题,是没有意义的;同时,离开了各自的适用范围去争论量化方法对史学研究到底有用还是无用的问题,也是永远不会达成共识的。


在我国,绝大多数历史学家所受的训练是史学研究训练,许多人对量化方法颇感陌生。在这种背景下,一些经济学出身的学者对量化方法的运用不当和过分夸大量化方法的适用性,使得不少历史学家对量化方法产生误解甚至偏见,是很自然的。


因此,对量化方法在史学研究中的使用问题做一个讨论,对于许多史学家(无论是历史学还是经济学出身的史学家)是很必要的。


本篇论文将通过一些实例,说明量化方法在史学研究中的重要性。


二、史学


刘志琴在谈及今天中国的史学时,痛心疾首地说:


“史书的信誉在下降,而戏说历史的各类书籍、讲坛却受到读者的欢迎,愈来愈兴旺。值得玩味的是作者和内容的变化,在市场上走俏的如《明朝那些事》《历史是什么玩意儿》《一个都不正经》等等几乎都是非历史专业者所撰写。史学的作者从史官、学者,到非专业作家,是述史主体的大变化……娱乐渗入这门学科,真可算是娱乐至死了,可死的不是娱乐,而是史学的严肃性和真实性。”



《明朝那些事儿》(图源搜狐)


刘氏所说是不争的事实。的确,今天许多(如果不说是大多数的话)国人的“历史知识”并非来自史学著作,而是来自“戏说”读物。


换言之,在相当一部分民众的心目中,史学著作与历史故事差别不大,甚至就是一回事。这就出现了一个问题:历史等同于故事吗?


首先,在英文中,history也被说成是his story即人的故事。在许多民族中,历史和故事之间并无明确界限,特别是在早期社会中更是如此。


其次,无论是在哪个民族或者哪个时代,大众对历史的兴趣通常是通过故事来激发的。


第三,大多数关于历史的著作都主要是对过去所发生的事情进行描述,而描述也正是讲故事的主要方式。


因此,说历史与故事之间具有一种特殊的关系,应当是没有疑义的。


正是这种特殊的关系,使得一些人将历史与故事等同了起来,也将研究历史的史学和创作故事的文学等同了起来,以致出现了后现代主义抨击史学的著名论断:“小说家编造谎言以便陈述事实,史学家制造事实以便说谎。”这种说法乍听起来似乎荒谬,但是仔细想想,也未尝没有一点道理。


事实上,一些学者早就己提出类似的问题。早在一个世纪之前,胡适在介绍詹姆士的实在论哲学思想的长文《实验主义》中写道:


“实在是我们自己改造过的实在。这个实在里面含有无数人造的分子。实在是一个很服从的女孩子,她百依百顺地由我们替她涂抹起来,装扮起来。好比一块大理石到了我们手里,由我们雕成什么像。”


胡适像(图源百家号)


到了晚近,阿普乐拜等学者在其史学理论著作《历史的真相》中尖锐地指出,历史知识只是为某些利益而建构起来的意识形态,历史是可确立并加强群体认同的一连串神话。


因此,厘清历史和故事、史学和文学之间的关系,对于史学来说是关系到学科生死存亡的头等大事。


如前所述,历史和故事都是谈论过去发生的事情,然而二者之间毕竟还是有差别的,而且这种差别非常之大,使得从事历史研究的学者与从事历史故事创作的作家,相互绝不认同,彼此都认为对方所从事的完全是不同的工作。有人试图抹杀这种界限,结果遭到学界的严词抨击。


一个有名的例子是,1975年,姚雪垠的历史小说《李自成》在因为得到毛泽东的支持下出版。在那个百花凋零、唯有“革命样板戏”一枝独秀的年代,这部历史小说引起了巨大的反响,成为全民争相阅读的畅销书。


小说前两卷出版时,引发了“《李自成》热”,发行量达到240万套以上,成为“当代出版最早、规模最大、影响最广的长篇历史小说”。


该小说博得许多文化人的称赞,香港作家刘以鬯甚至赞誉《李自成》“可以和托尔斯泰的《战争与和平》媲美”。一些媒体也说“姚老不仅是个小说家,他首先是个历史学家,而且是有独立见解的历史学家”。


在这些赞美声浪中,姚氏似乎不再满足于文学家的身份,进而以史学家自任,并从史学的角度对郭沫若的《甲申三百年祭》提出了强烈的批评,说:


“关于《甲申三百年祭》这本小册子,自从一九四四年在重庆《新华日报》发表以后,我一直认为它是作者在匆忙中赶写成的,不是严肃的历史科学著作。后来随着我读书渐多,才明白作者写这样重要的历史问题竟然所参考的史料很少,而且对翻阅的极少史料也没有认真研究,辨别真伪,轻于相信,随手引用,然后在此基础上抒发主观意见,草率论断。”


郭沫若(图源搜狐)


本来,郭氏的观点是可以讨论的,进行辩驳也是无可厚非的。但是姚氏提出的批评是(1)“参考的史料很少”,(2)“极少史料也没有认真研究”和(3)“在匆忙中赶写成”“草率论断”。这些批评都属于史学的专业研究方面问题,因此引起了史学界的反感。


明史学者王春瑜发表了《李岩·〈西江月〉·〈商雒杂忆〉与姚雪垠同志商榷》一文,引用大量史实,对姚氏之说多有纠谬。


另外一位明史学者顾诚尽管在观点上与郭氏多有相左之处,但对姚氏之见乃至其学风多不认同,写了《如何正确评价〈甲申三百年祭〉——与姚雪垠同志商榷》一文,对姚氏学风提出强烈批评。


从他们的批评可以看到:尽管姚氏自称为写《李自成》读了大量明代史料,写了几万张卡片,但是由于没有受过史学研究的训练,他依然犯了历史学者不应或者不会犯的诸多错误。


因此史学界从未有人承认姚氏为明史学家。这并非史学界的保守和封闭,而是因为到了今天,史学已经成为一门非常专业化的学科,并非任何历史爱好者都能够胜任严肃的史学研究的。


历史和故事之间的根本差别在于:历史是过去确实发生了的事,而故事则否。故事可以使用一些过去发生的事作为背景,但是其主要内容则是想象出来的。这个差别导致了史学和文学的不同。


史学研究的目的是依据史料重建过去并加以解释,而文学创作的目的则是依靠想象写出故事来娱乐大众或教育大众,或二者兼有之(即“寓教于乐”)。


因此历史和故事的根本差别在于是否真实,而史学研究与文学创作的根本差别则在于是否要追求真实。


前面提到的那本《历史的真相》,在序言里就开宗明义地说:“这本书所关注的问题是,历史学与真理是什么关系?历史学是否能做到客观,从而反映真实的过去?”


今天中国史学之所以出现危机,刘志琴就认为是“信誉的丧失使史学失去公信力,娱乐化又冲淡了史学的严肃性”。


既不可信,史学自然与小说就没有多大差别。然而史学的娱乐性又远不及小说,因此寻求娱乐性的大众当然要转向小说。无怪乎刘志琴说“当代史学已从学术中心走向边缘化”。


因此,要从危机中挽救史学,就必须让史学恢复其与生俱来的本性,即求真。


要如何才能达到史学的求真的目标呢?要求真,首先是要有可靠的史料,正如建造一座房屋,首先要有可靠的建筑材料。否则,再好的建筑师和施工队,也只能造出“豆腐渣”工程。


因此此篇论文将集中于史料问题,重点研究量化方法在史料鉴别和运用方面的问题。


三、史料


史学研究必须以可靠和充分的史料为基础。这一点,余英时已做了很好的解释:


“史学论著必须论证(argument)和证据(evidence)兼而有之,此古今中外之所同。不过二者相较,证据显然占有更基本的地位。证据充分而论证不足,其结果可能是比较粗糙的史学;论证满纸而证据薄弱,则并不能成其史学。韦伯的历史社会学之所以有经久的影响,其原因之一是它十分尊重经验性的证据。甚至马克思本人也仍然力求将他的大理论建筑在历史的资料之上。韦、马两家终能进入西方史学的主流,决不是偶然的。”


然而,什么才是可靠的史料呢?年鉴学派学者拉杜里说:“任何历史研究都应当从分析原始资料开始。”使用原始资料如此重要?这对于许多历史学者来说似乎都是不说自明的常识。


然而我们要问的问题是:什么是原始资料?原始资料都可靠吗?


史学研究中,通常把史料区分为第一手史料和第二手史料。第一手史料也被称为原始资料(或者原始史料)。


什么是原始资料?林国华认为只有直接反映历史事实的史料,才能算作原始资料,包括历史遗物、当事人或在场人对亲身经历之事或亲眼所见亲耳所闻之事的记载等。


但是从更广泛的意义上而言,史学研究中的“原始资料”,指的是未经后人加工的资料。为什么要特别强调原始资料的重要性?主要就是因为其原始性,即未经后人加工的性质。


然而我们今天所使用的许多我们认为是原始资料的史料或者第一手史料,果真是未经加工的史料吗?事实上,除了一些民间契约等之外,上面说到的“历史遗物、当事人或在场人对亲身经历之事或亲眼所见亲耳所闻之事的记载等”,未必都是未经加工的材料。


因此,今天我们通常所说的原始材料或者第一手史料,指的是关于某一事情的最早出现的记载。


为什么最早出现的记载具有特殊的重要性?这是因为任何信息在传递过程中都不免会走样,时间愈久,经过传递的人愈多,走样也就愈大。


1920年代顾颉刚创立“古史辨派”,进行古史辨伪,提出“层累地造成的古史说”。从这个角度来看,我们今天所使用的许多史料,都是经过多代人的多次加工而“层累地造成”的。


不仅如此,如果最初的信息本身就有错误,那么经过多次加工后,以讹传讹,其谬误就更大了。这种错误的信息经过层层加工,最后成为众口一词的“真实”,正如著名的“三人成虎”的成语所表现的情况,即使原来的假的记载,后来也会变成“事实”。


因此,即使是最早出现的记载中的信息,其中的真实性到底如何,仍然需要仔细辨认。


顾颉刚在1921年6月给王伯祥的信中说:


“我们的意思,要把中国的史重新整理一下,现在先把前人的怀疑文字聚集,排比,做我们的先导。辨伪事的固是直接整理历史,辨伪书的也是间接整理。因为伪书上的事实自是全伪,只要把书的伪迹考定,便使根据了伪书而成立的历史也全部失其立足之点。照我们现在的观察,东周以上只好说无史。现在所谓很灿烂的古史,所谓很有荣誉的四千年的历史,自三皇以至夏周,整整齐齐的统系和年岁,精密的考来,都是伪书的结晶。”


从源头上查明了先前所公认的古史,其史料来源原是伪书,那么要重建真正的古史,就必须另起炉灶,寻求可靠的史料(例如从甲骨文、金文、墓葬品等新来源获得史料)。因此,查出历史事件的记载之源头并辨别其真伪,对于史学研究至为关键。


为了克服以往史学中忽视史料真实性的弊病,实证主义史学极其强调使用最早的记载的重要性。克罗齐在描述实证主义史学时说:


“这些历史学家把他们的信念安放在一份叙述当中,其中每一个字都有一件原本作依据。此外,在他们的著作中什么也没有,有的只是原本中所有的,那是脱离了上下文的,是没有经过语文学叙述者的思想重述出来的。他们的目的是要使他们的历史达到一种综合性汇编的地位。”


然而,问题还不到此为止。即使找到最早的记载,它们是否又都是可靠的呢?


01

首先,我们要判断这些记载的真实性,必须看看这些记载是谁记下的。


换言之,要了解记载者的史学素质,以及中国传统史学要求史家所具备的最重要的品质——史才、史学、史识和史德。才、学、识是专业技能,而德则是专业操守,核心是忠于事实。


章学诚在《文史通义》中说“能具史识者,必知史德,德者何?著书者之心术也”。他说的史德就是史家的史学思想修养和行为规范品德,特别是史家治史的客观立场和实事求是的职业操守。


在史德的内容中,最重要的一点就是秉笔直书,忠实记录发生的事情。因此梁启超说:“史家第一件道德,莫过于真实。”然而,即使是训练有素的正直史家秉笔直书所记录下的事情,也不一定真实可靠。


02

其次,我们还要看看这些记载是在一种什么样的史学氛围中写出的。


自古以来,史学家们就以齐太史、晋董狐为楷模,一如文天祥《正气歌》中所言“在齐太史简,在晋董狐笔”。他们的人格和职业道德,至今仍为历史学者景仰。但是从记录事件的真实性来说,董狐的做法是可以争议的。


《东周列国·春秋篇》剧照


董狐之事见于《左传》宣公二年:


“赵穿攻灵公于桃园。宣子未出山而复。大史书曰:‘赵盾弑其君。’以示于朝。宣子曰:‘不然’。对曰:‘子为正卿,亡不越竟,反不讨贼,非子而谁?’宣子曰:‘乌呼,“我之怀矣,自诒伊戚”,其我之谓矣!’孔子曰:‘董孤,古之良史也,书法不隐。赵宣子,古之良大夫也,为法受恶。惜也,越竟乃免’。”


董狐的勇气和正直确实了不起,但是他关于这件事的记载却不能说是真实记录,因为尽管赵宣子可能与弑君之事有关,但弑君者并不是他。孔子明知赵宣子是受人所累,但同时又称颂董狐是良史,原因是孔子认为写历史的正确方法是“春秋笔法”,即“笔则笔,削则削”,也就是根据道德判断对事件记载进行取舍,从而使得历史记载起到“警世”和“资治”的作用。


孟子说:“孔子作《春秋》而乱臣贼子惧”。刘知几也说:“史之为务,申以劝诫,树之风声,其有贼臣逆子,淫君乱主,苟直书其事,不掩其瑕,则秽迹彰于一朝,恶名被于千载。”


经过这样的取舍和加工,所得出的历史自然并非真正发生过的事,而如《历史的真相》所说的那样,“历史知识只是为某些利益而建构起来的意识形态,历史是可确立并加强群体认同的一连串神话”。


从上述情况所反映出的问题来看,我们以往相信的许多“历史事实”,实际上是否是真实事实,还需考证。在这方面,几乎所有中国人都耳熟能详的司马光砸缸的故事,就是一个很好的例子。


“司马光砸缸”漫画(图源搜狐)


这个故事出自《宋史》卷三三六《司马光传》,原文如下:


“司马光,字君实,陕州夏县人也。父池,天章阁待制。光生七岁,凛然如成人,闻讲《左氏春秋》,爱之,退为家人讲,即了其大指。自是手不释书,至不知饥渴寒暑。群儿戏于庭,一儿登瓮,足跌没水中,众皆弃去,光持石击瓮破之,水迸,儿得活”。


《宋史》是研究宋史最重要的史料来源之一。这段记载出自这一来源,其可靠性似乎应当没有什么问题了。然而,如果我们考虑到以下情况,可能就会得出不同的结论。


首先,司马光生于宋真宗天禧三年(1019),卒于宋哲宗元祐元年(1086)。而《宋史》的修撰是元顺帝至正三年(1343)三月开局,至正五年十月成书。从司马光辞世到《宋史》成书,中间已隔了近三个世纪,因此很难说这条记载是真正的原始记载。


其次,《宋史》由元朝丞相脱脱、阿鲁图主持监修,修撰十分仓促草率,仅两年就了事。赵翼在《二十二史札记》“宋史各传回护处”条中说:


“元修宋史,度宗以前多本之宋朝国史,而宋国史又多据各家事状碑铭编缀成篇,故是非有不可尽信者。大奸大恶如章惇、吕惠卿、蔡榷、蔡京、秦桧等,固不能讳饰,其余则有过必深讳之。即事迹散见于他人传者,而本传亦不载,有功必详着之,即功绩未必果出于是人,而苟有相涉者,亦必曲为牵合,此非作史者意存忠厚,欲详着其善于本传,错见其恶于他传,以为善善长而恶恶短也。盖宋人之家传、表志、行状以及言行、录笔、谈遗之类,流传于世者甚多,皆子弟门生所以标榜其父师者,自必扬其善而讳其恶。遇有功处,辄迁就以分其美,有罪则隐约其词以避之。宋时修国史者即据以立传,元人修史,又不暇参互考证,而悉仍其旧,毋怪乎是非失当也。”


由此而言,司马光砸缸的记载也大约是出自相关的家传、行状、录笔、谈遗之类。因此,如果司马光幼时砸缸的故事是编造出来的,就很可能是他的“子弟门生所以标榜其父师”之举。


从文本诠释学的角度来看,对于一件记载,我们都要考虑以下问题:


该文本是谁写的?他(她)为什么要写?在什么时候写?在什么情况下写?是用什么语言写的?写是为给什么人看?写出后经过什么人加工?该文本是怎么流传下来的?


如果我们用这样的态度去看待司马光砸缸的故事,很可能这就是一个故事,而非事实。


胡适曾批评中国的传统史学说:“中国人作史,最不讲究史料。神话、官书都可以作史料,全不问这些材料是否可靠。却不知道史料若不可靠,所作的历史便无信史的价值。”


由此可见,第一,“官书”中史料,在运用时要非常谨慎(例如《宋史》等关于司马光砸缸一类的记载,就很可能不可靠);第二,要使我们的史学研究成果获得公信力,必须获得可靠的史料。


四、量化方法

与史料鉴别


获得可靠的史料是进行史学研究的第一步。为了求得可靠的史料,必须对现有的史料进行考辨,以去伪存真。这就是史料学和文献学的任务。


傅斯年非常强调史料学的重要性,提出“史学便是史料学”,原因是“史学的对象是史料……史学的工作是整理史料,不是作艺术的建设,不是做疏通的事业,不是去扶持或推倒这个运动或那个主义”。


傅斯年(图源知乎)


吴承明也指出:史料是史学的根本,绝对尊重史料,言必有证,论从史出,这是我国史学的优良传统。治史者必须从治史料开始,不治史料而径谈历史者,非史学家。


由于史料并非史实,必须经过考据、整理,庶几接近史实,方能使用,因此史料学和考据学的方法可以说是历史学的基本方法。


从乾嘉学派到兰克学派,中外史家都力图通过考证分析,弄清历史记载的真伪和可靠程度。


辨别记载的真伪可以使用不同的方法。中国的乾嘉学派和西方的兰克学派在此方面都做出了重大贡献,此后史家又有不断的改进,发展出了一套科学的辨伪方法,即史料学和文献学的方法。这些方法是历史学者必须具备的基本功,毋庸在此多言。


然而,以往的辨伪方法虽然在许多方面已很完备,但是使用量化方法来辨伪却不甚普遍。因此在此要强调一下量化方法在史料辨伪方面的作用。


使用量化方法进行史料辨伪不仅有用,而且在一些情况下其功能甚至是不可替代的。其实,使用量化方法进行史料辨伪并不始于今日,也不限于史学。


早在18和19世纪,一些欧洲学者就使用这种方法对《圣经》中的史料进行了辨伪。在基督教信众的精神生活中,《圣经》具有特殊的地位。在近代以前,很少人怀疑《圣经》所说的事的真实性。


《圣经》(图源豆瓣)


文献学也证实《圣经》的《旧约全书》实际上是一部有关犹太人早期生活的百科全书,展示了犹太人早期的历史。


考古学家格鲁伊克说:“可以肯定的说,没有一项考古发现驳斥过一条圣经中的引述。大量考古发现已经证实了《圣经》中的清晰概述或者详细准确的历史叙述。”布劳斯说:“考古工作毫无疑问加强了人们对经文记载可靠性的信心。”


直至今日,一位基督教牧师德尔泽尔在引证了上述考古学家和历史学家的研究结论后还总结说:“犹太人确信他们经典中的内容是基于事实和真实的历史,不是虚构的。这就是基督徒也接纳旧约的原因。它扎根于历史。要查看圣经中的历史是否和人类历史匹配,有大量的方式。如果你深入挖掘,你会发现确实是那样。”他甚至断言:“人类理性、常识和一种对数学运算的理解,都可以用来确认《圣经》的权威性。”


从史料学的角度来看,《旧约全书》的价值的确极为重要。其中许多记载,都是迄今为止能够看到的关于犹太人历史的最早记载,因此从某种意义上来说可以视为原始资料或者第一手史料,因此在史料学方面具有无可替代的地位。


离开了《旧约全书》,就无法进行犹太人早期历史以及中东历史的研究。然而,从史料学的角度来看,这种重要的原始资料并非都是可靠的记载。验证《圣经》中记载的真实性可以通过不同的方法,而量化的方法就是最有用的方法之一。在这方面,有时甚至是最简单的量化方法也能获得惊人的效果。


以批评方法对《圣经》进行细密的历史考证的学问,兴起于18世纪后期的德国。


德国《圣经》批评的先驱雷马鲁斯对《旧约全书》的《出埃及记》中的犹太人的人口总数提出了质疑。


据《出埃及记》,犹太人在跟随摩西逃出埃及的第二年,耶和华晓谕摩西,要他清点所有男丁的数目。摩西便在西奈旷野,将以色列十二宗族当中能够上阵打仗的人数,计算出来共计603550名。


“摩西”漫画(图源搜狐)


关于这个数字的真实性,以往从未有人怀疑。但是雷马鲁斯认为:60万犹太人,绝无可能在数小时之内穿过红海。若加上妇女儿童,他估计犹太人总数要超过300万,这需要6000辆车、10万匹马、30万头牛和60万只羊。


在英国,由于文化空气、大学制度、神学走向与德国有很大差异,在1860年之前,只有为数不多的和德国学术有紧密接触的学者专门从事《圣经》考证,并有人因发表研究而获罪。对于大众来说,《圣经》仍然是让他们感觉安全、安稳,为他们提供安慰的圣书。


最终戳破这层窗户纸,让一般大众也开始意识到《圣经》考证的后果和危险的,并不是专业的《圣经》学者,而是一个业余考据家,而且居然是英国国教体制内部人士。他的《圣经》批评以最极端、也是最“愣”的方法,故不乏争议。


这位学者就是英国派驻南非纳塔尔地区的主教科伦索。在他1862年出版的《摩西五经与约书亚书考辨》第一卷中,他用简单的量化方法,对摩西率领的犹太人的人数进行了考证。其具体做法是根据《出埃及记》中关于犹太人人口数的记载进行简单的计算,下面就是他算的细账:


首先,有60万能够上阵打仗的男丁,那么加上妇女、老人和孩子,即使保守地估算,全部人口至少可达200万人。


其次,活人生活的活动空间,至少要相当于躺在坟墓中的死人三四倍。他先算出成人棺椁的大小,约为1.8米×0.6米,然后三倍之,便得出成人至少需要3.25平方米的生存空间。200万人就至少要占据6.4平方公里的营盘。如果要保证正常生活和活动,有其他学者计算,营盘应有30平方公里才转得开。


第三,犹太人在此驻扎了一年时间,只需一个月便要消耗掉附近所有的木柴。更加重要的是,饮食如何解决?基本的卫生条件如何保障?


第四,一个200万人的族群,平均一天大约会有250名婴儿降生。依照犹太人的习俗,要为新生婴儿做法事。一天当中,不仅要献燔祭,还要献赎罪祭。


这就意味着要为这250名婴儿做500场法事。如果这些仪式分别举行,仅仅这些法事就需耗费2500分钟,差不多42小时。即便是三位祭司齐上阵,每人不停地主持一项祭事,一分钟都不停歇,也无法在白天12小时之内全部完成。


又如果这些犹太人严守规定,需要为所有初为人母者每天搞到1只雏鸽或者斑鸠,250个母亲每天需要250只,依此日均消费数量,这批犹太人一年中要消耗90000只鸽子或者斑鸠。


科伦索不禁问:“难道犹太人在逃离埃及之时,还要带足鸽子不成?”因此,用这种非常简单的量化方法进行分析,即可得知《旧约全书》中关于犹太人出埃及时人数的记载是不可靠的。如果使用这个数字来进行研究,结果必然有违历史真实。


当然,这个数字记载不可靠,错误并不在记录这个数字的人(即《旧约全书》的作者),而在于后人。


正如科伦索所言:“《圣经》作者就如同荷马或古罗马早期的编年史作家一样,不曾意识到自己做了错事,也没有捏造史实来欺骗世人(practicing historical deception)。是我们伤害了他们,是我们损害了《圣经》故事真正的辉煌,因为我们认定《圣经》必须符合历史真实,我们认定《圣经》作者要求读者将它作为历史真实来接受和信奉,不仅仅是犹太人,还要所有人类来信奉,直至永远”。


从上述例子可见,在一些情况下,对于即使是那些通常被视为“原始资料”的史料来说,量化方法在其辨伪方面是很有用的,有时甚至是无可替代的。


五、量化方法

与史料处理


要使用各种方法得到正确的史料,这是我们都坚信无疑的。然而,这些经过文献学考证是正确的史料,是否就都是可靠的史料呢?


吴承明做了非常明确的论断,他说:“即使做到所用史料尽都正确无误,仍然不能保证就可得出正确的结论。”


正确的史料并不等同于可靠的史料。要把正确史料变为可靠的史料,就必须采用适当的方法进行处理这种处理有时甚至会达到加工改造的程度,用年鉴学派学者菲雷的话来说,就是“在确定自己的研究对象的过程中,历史学家必须‘创制’自己的原始资料”。


在这方面,量化方法有其用武之地。在这方面,作者自己关于宋代江南水稻亩产量的研究就是一个例子。


众所周知,关于中国历史的发展大势,以往中外学界两大共识:一是“唐宋变革论”(其中又特别是“宋代经济革命论”),一是“明清停滞论”。大多数中国历史教科书所提供的常识,都是建立在这两个共识之上的。


这两个共识是日本学者宫崎市定于1960年代初最早提出的,他将其关于中国历史发展的总体观点总结如下:


“中国文明在开始时期比西亚落后得多,但是以后这种局面逐渐被扭转。到了宋代便超越西亚而居于世界最前列。然而由于宋代文明的刺激,欧洲文明向前发展了。到了文艺复兴,欧洲就走在中国前面了。但起初二者之间的差距还很小,直到18世纪还是处于一种雁行状态。但是工业革命一发生,欧洲便把中国远远抛在后面了。”


由这段话可见,他认为宋代不仅在中国历史上,而且在世界历史上,都占有一种特殊的地位。


尔后到了1970年代初,英国学者伊懋可在日本和西方学界的研究基础上,提出了中国“中古时期的经济革命”和“帝制晚期的没有技术变化的经济发展”的理论,认为中国在唐宋(特别是宋)时期出现“经济革命”,而自14世纪以后则出现重大转折,陷入“量的增加,质的停滞”。


再后到了1980年代,中国学者漆侠提出中国封建时代社会生产力发展的“两个马鞍形”模式,即在秦汉时期达到第一个高峰,魏晋以下低落,隋唐有所恢复和回升,到宋代则“以前所未有的速度迅猛发展,从而达到了一个更高的高峰”;元代急遽下降,明代中叶恢复到宋代水平,以后虽有所发展,但在一定程度上显现了迟缓和停滞(或者说,在金、元时期出现“逆转”,以后则“逐渐地缓慢、停滞下来”)。


到了20世纪末,经济学家麦迪森对中国历史上的人均国内生产总值(GDP)作了估算。根据其计算的结果,无论是作纵向的还是横向的比较,宋代在世界经济史上都具有一种非同寻常的地位。


由此可见,中外许多学者从各自的研究中和从不同的方面,都得出了“中国经济在宋代出现飞跃,达到了顶峰,尔后发展减缓,最后陷于停滞”的结论。这个结论,也就是“宋代经济革命”。


按照伊懋可的总结,“宋代经济革命”包括农业革命、水运革命、货币与信贷革命、市场结构与都市化的革命和科学技术革命。依照斯波义信的归纳,则主要包括农业革命、交通革命以及商业革命以及都市化方面的重大变化。


因此如果真有“宋代经济革命”的话,主要内容应当大致也就是这些。宋代中国在这些经济领域中出现了若干重要变化,这是没有争议的。


然而,虽然宋代的商业、手工业、运输业乃至金融业等都有相当大的发展,但农业仍然在经济中占有主导性的地位,因此伊懋可和斯波义信在对宋代各经济领域的“革命”的归纳中都将“农业革命”置于首位,这是很正确的。


而在宋代各主要经济区中,无论从经济发展水平或是在全国经济中所占有的分量来说,“江南”(即长江三角洲)居于首位,这也已是史坛共识。


宋代商业(图源百家号)


伊氏和斯波氏也都明确地指出:他们所归纳的各经济领域的“革命”,并非出现在宋代中国的每一个地方,而是主要发生于中国东南地区,特别是江南。换言之,江南在“宋代经济革命”中扮演着主要角色。


农业进步的一个主要表现是单位亩产量的提高。学术界普遍认为,宋代江南粮食亩产量比过去有明显提高,达到了很高的水平。


就比较“保守”的估计而言,余也非估计唐代江南亩产1.5石,而宋代亩产2石(均为米,下同);吴慧的估计是唐代1石,宋代2石。斯波义信较早的估计是北宋初1石,南宋后期2石;较后的估计则是北宋1.5—2石,南宋2—3石。闵宗殿的估计属于比较“中间”者:两宋均为2.5石。“激进”的估计则更高,如顾吉辰估计北宋苏州一带水稻亩产4石,“接近于今天的水平”,江南其他地区则在2石上下。


漆侠在其1983年的论文中认为江浙地区的亩产量,宋仁宗时为2石、3石,南宋初年为3石、4石,南宋晚期为5石、6石;在1986年的论文中,估计两浙路太湖地区的水稻亩产量,北宋时为3石,南宋时为5石、6石或6石、7石;而在1987年出版的专著中,则认为江浙地区亩产量,南宋初期为3石、4石,南宋中后期为5石、6石,而在以太湖流域为中心的两浙地区达6石、7石;如与前代和后代相比,则宋代江南亩产量为唐代的2—3倍,与明清相差无几,“虽然不能说它已达到封建时代的最高水平,但至少可以说是接近这个水平了”。


实际上,这已超过或达到今天在运用现代科技和投入的苏州、上海等江南高产地区丰收年份的水稻最高亩产量。即使按照比漆氏估数低的顾氏估数,北宋苏州的亩产量也不仅大大超过明清江南的平均亩产量,而且超过了1955年和1975年苏州的平均亩产量。


由上述估数来计算宋代江南的农业劳动生产率,结果也高得令人惊诧。例如,南宋江南农户户均种田面积若以漆氏所言的30—50亩计,亩产量以5石、6石与6石、7石之中数6石计,那么一个农户一年可生产180—300石米。其时江南人均粮食消费量,大约是每人每日1升米,一个5口之家一年食米共18石。


换言之,一个农户所生产的粮食,就可以养活10—16.7个同样规模的家庭(包括该农户在内);即只要有大约6%—10%的家庭从事农业,就足以养活整个社会。这样的比例,相当于1994/1995年度新西兰农业就业人数在社会总就业人数中所占的比例(9.6%),高于我国台湾省(10.5%)、韩国(12.5%)和俄罗斯(14.9%),更远远超过我国大陆(52.7%)。


由此可以推论宋代太湖平原的农业劳动生产率,已达到20世纪末比较发达的国家和地区的水平。从各种方面来看,这都是绝不可能的。


因此,以往关于宋代江南亩产量的结论肯定都大大高于实际情况。建立在这种基础之上的“宋代经济革命论”,自然也就令人很难以相信了。


然而,以上学者在进行宋代江南亩产量研究时,除了个别人外,都从宋代史籍中梳理出当时人作的亩产量记录,从中筛选出自己认为可靠的数字,作为亩产量研究的基础。


就此而言,他们所依赖的史料,应当是正确的。那么,为什么使用这样的史料会导致错误的结论呢?


导致这种情况的主要原因,在于对这些史料的处理方法。这些学者在对所收集到的亩产量记载进行筛选时,并无一定的客观标准,而凭个人对宋代经济的先入为主的总体看法进行取舍,主观任意性很强,因此筛选出来的结果,当然也因人而异。


就“宋代经济革命”论的拥护者而言,总的倾向是选取那些较高的产量数字作为普遍产量。另外一些学者注意到了这种局限性,力图采取求平均数的方法来矫正之,他们的做法是把所收集到的亩产量数字放在一起,做简单的算术平均,得出一个中间数,作为平均产量。


然而,历史上留下来的宋代江南亩产量数字不仅数量有限,而且大多数是特殊年份(丰年或者灾年,特别是丰年),而且由于文化的原因,这些数字往往集中在一些高产地区。因此从这些数字求得的平均数当然也是高数的平均亩产量。


这两种方法都属于作者所批评的“选精”和“集粹”方法,得出来的结果自然会与实际情况有很大出入。由于这个原因,就回到前面吴承明所说的 “即使做到所用史料尽都正确无误,仍然不能保证就可得出正确的结论”。


因此,要得出正确的结论,不仅要对各种产量记载进行考证和甄别,找出其中比较可信者,而且还要采用宏观经济学的方法进行分析。论文作者在明清江南水稻亩产量的研究中就采用了这样一种新的方法。


具体而言,首先,从江南地区稻米的消费、输出(包括赋税)与输入的数量入手,求得某个时期稻米的年总产量;其次,根据稻田总面积,推算出每亩的产量;第三,再把从史籍中得到的亩产量记载与上述结果进行比较,分析各个记载的特定时空及其他条件,看看其中哪些与上述结果比较接近,并从技术、投入、价格等方面,对这些特征进行验证。


使用这种方法得出的结果,当然比较合理。当然,这个结果不能从现有的史料记载中找到,因此可以说是一种经过处理或者加工的史料。在进行这种处理时,所使用的也是量化方法,亦即在经济学的分析框架下使用的量化方法。


使用这种方法,我们可以清楚地看到以往学界对于宋代江南农业的看法是与宋代江南的实际之间有很大距离。


例如,依照漆侠等的亩产量估数,宋代江南生产出来的稻米,在扣除了本地消费(留种、食用、酿酒等)和缴纳赋税之后还有巨大的剩余。宋代虽然有一些江南稻米输出到外地的记载,但这种输出规模十分有限,而且并未形成稳定的常年性输出。这样就出现了两个问题:


这些数量巨大的过剩稻米将如何处理?既然无法处理,江南农民为何还要年复一年地生产过剩稻米?


又从投入—产出的角度来看,要获得某个水平的产出(即亩产量),就必须有相应的投入。这些投入不仅包括人工、肥料,而且也包括技术,因为只有在一定的技术条件下,这些投入才会取得合理的效益。


宋代江南水田生产中的技术(作物品种、轮作方式等)以及劳动力和肥料供应,都无法保证前引那些学者得出来的每亩产出。因此,我们不得不说,他们对宋代江南水稻亩产量的估计,都显然是大大高于实际亩产量。


采用同样的方法来对唐代中期至清代中期这个长时段中江南农业进行研究,我们会发现:


与前面的唐代中后期和后面的元明清时期相比,宋代江南农业无论是粮食亩产量还是农民劳动生产率都的确有进步,但是这种进步的幅度并不是如许多人想象得那么大,并未出现革命性的变化。


相反,在上述长时段中的江南农业的进步是渐进性的,宋代的进步也是这个渐进性进步中的一个部分。由此而言,那种建立在对宋代江南粮食亩产量的过高估计基础之上的“宋代农业革命”之说,是难以成立的。


六、结语


通过以上讨论,我们可以确信:无论是在史料的考证和处理方面,量化方法的确有用。


马克思说:“一门科学只有在成功地运用数学时,才算达到了真正完善的地步。”此言容或有过分概括之嫌,但历史与数量二者之间确实有一种特别的关系,因此希克斯说:“在史学的任何分支中,我们都会发现自己在寻求统计学上的一致性。”特别是历史上的经济现象(亦即经济史研究的对象),更是如此:“凡是一种历史理论可能适用的历史现象,从我们对其兴趣而言,都可认为具有统计学特征。经济史上的大多数现象(无论我们如何广泛地看),都确实具有这些特征。我们要问的经济史的问题,大都涉及那些可以具有此特征的类别。”


既然具有统计学特征,就需要使用统计学方法,而统计学方法正是一种量化方法。在这种情况下,不使用量化方法,即使做到史料尽都正确无误,仍然不能保证这些史料就都可以正确地用于研究,从而得出正确的结论。


然而,在此也要强调:正如其他任何研究方法一样,量化方法有一定适用范围,其使用也是有条件的。一种方法的使用如果超出了其适用范围,或者不具备充分的条件下使用,都会引起错误。


在这方面,一个例子是赵冈的中国城市史研究中出现的一个问题。


赵冈是“宋代经济革命”论的拥护者,他断言南宋时期中国城市化达到20%,其水平之高,不仅在当时世界上无与伦比,而且在整个中国历史上空前绝后。赵氏对宋代城市化水平的估计,部分地是依据霍林斯沃斯对杭州人口的研究。


霍氏则又是依据《马可·波罗游记》中关于杭州胡椒消费量的记载来推算杭州的人口。马可·波罗说在“天城”(杭州):“从大汗海关的一个官吏处得悉,每日上市的胡椒有43担,而每担重223磅。”亦即每天4338公斤,霍林斯沃斯认为这至少是500万人的消耗量。


马可·波罗(图源豆瓣)


然而,从史料学的角度来看,马可·波罗的这一说法本身就很可怀疑,而霍氏的推算就更成问题了。


因此,虽然从表面上来看,霍氏在推算杭州人口时也使用了简单的量化方法,但是他所依据的却是不可靠的史料。以此为基础进行简单化的量化分析,得出的结果也可想而知。赵氏依据这一推算的结果来构筑出来的中国城市史的理论,也当然不可信。


麦迪森虽然不是中国史研究的专家,但是作为一位严谨的经济学家,他在讨论中国城市化水平时也发现了这个问题,指出赵冈有关宋代的看法,“依靠的是缺乏严肃可信性的马可·波罗和霍林斯沃斯的叙述”,因此不可信。


这个例子表明:使用量化方法,必须以可靠的史料为前提。换言之,只能在对史料进行了认真的考辨,并且对相关问题进行了全面的分析之后,才能够使用量化方法。


刘子健在讨论史学方法时指出:“年鉴学派收集资料,加以排比,试寻其关联与背景。但往往花了莫大力气,却无从判其所以然”。


这一点,在中国史研究中特别需要注意,他说:“由于中国历史变乱相循,资料散失,社会调查不易进行,所以也不必强寻历史全貌。而量化学派统计数据来综合各方面的资料,这是可行的,只是必须要有足够的数据。当前研究中国历史不能采用的原因,在于数据不足。”在不具备量化研究条件的情况下进行量化研究,只会导致对量化方法的误解。


由于量化方法具有其他方法无法替代的有用性,同时也具有明显的局限性,因此我们在史学研究中,对于量化方法,既不应盲目拒绝之,也不应盲目崇拜之。在该用的地方使用,在不该用的地方则不要使用。


同样地,有些学者擅长于量化方法,有些学者则擅长于其他方法。这两类学者应当彼此尊重,相互理解,多加交流。


席德号召重在定性研究的“传统经济史学家”和重在定量研究的“新经济史学家”之间,应该在研究方法上多沟通。一方面,前者需要学习一些新的理论和方法,另一方面,后者需要学习历史学方法,需要尊重史料。


席德在1972年当选为美国经济史学会主席的就职演说中,特别强调计量史学家向传统史学家学习,说:“没有以往史学家所做的各种定性研究,计量史学家可能就会误解了他们用以量化研究的材料的意义;没有史学家所积累的研究成果,理论学者也很难设定各种近乎真理和实际的模型。”


在面对量化方法时,不仅经济史学家,而且所有史学家,都应当采取这种态度。


最后,借用吴承明和刘子健的话来总结这篇文章。


吴承明说:“就方法论而言,有新、老学派之分,但很难说有高下、优劣之别”“新方法有新的功能,以至开辟新的研究领域;但就历史研究而言,我不认为有什么方法是太老了,必须放弃”“我以为,在方法论上不应抱有倾向性,而是根据所论问题的需要和资料等条件的可能,作出选择”。


刘子健则说:“余英时说‘史无定法’,研究历史的题材不同,自然没有一成不变的方法,所以更妥贴地说应当是‘史采佳法’,因题制宜。”


对于量化方法,我们应当持有开放的心态,将它视为一种有用的方法,和其他各种有用的方法一起,用于史学研究。



(本公众号所载内容为研读简版,学术引用务必参考作者原文。)

悦茶 | 李伯重:学者要 “做第一流的学问”
李伯重:从“马桶改革”的成败谈起
悦茶丨杨小凯:为什么工业革命在英国而不在西班牙发生?
孟祥仲:治堵从转变城镇化观念始——经济学的解读
程虹 李唐:性格真的可以影响命运吗?

悦茶丨林毅夫:中国成功避免转型崩溃,但付出高昂代价

陆铭:写给不想做学术的学生们

王明远:改革开放45年,中国做对了什么?

悦茶丨江小涓:下一轮改革的两条主线和十一项重点任务

时间站在了杨小凯这边

悦茶丨杨小凯:百年中国经济史笔记(一)

悦茶丨何帆:当过官和没当过官的经济学家区别在哪?

悦茶丨许小年:中国经济学界最恶劣的品质是违背良心

高产学者有多厉害?看看中国经济金融领域的高产学者榜!

于晓华 孙菲菲 魏昊:中国经济学科研机构发表国际论文的龙虎榜

《经济学家茶座Teahouse》公众号2020年文章阅读量排行榜

《经济学家茶座Teahouse》公众号2021年文章阅读量排行榜

“经济学家茶座Teahouse”公众号2022年文章阅读量排行榜

经济学家茶座 Teahouse 2023年高阅读量文章



以经济散文传播经济学思想

经济学家茶座 Teahouse
以经济散文传播经济学思想
 最新文章