荣新江|关于敦煌文献的“数字化”问题

学术   2024-10-15 23:58   山西  

敦煌藏经洞出土文献包括佛经、道书、四部典籍、公私文书等各类文献材料,其中典籍部分有些有文本传世,有些则是佚书,而公私文书则是独一无二的。敦煌文献主要产生于公元5世纪初至11世纪初,作为中国古代文献的一部分,有其特殊的意义,很多文献是现存历史文献中的孤本,是无法用其他文献替代的。

敦煌文献自1900年发现以来,大多数精品被斯坦因、伯希和、奥登堡等人劫往英、法、俄国,还有很多流散在国内外众多公私藏家手中。经过一百多年来学者和收藏机构的努力,目前大多数文献的图片已经发表,从缩微胶卷、黑白图版,到彩色图版和数字化图像,直到最近出版的高清彩色图录,如《法国国家图书馆藏敦煌文献》1、《甘肃藏敦煌文献》2、《中国国家图书馆藏敦煌文献》3,极大地推动了敦煌文献的整理与研究。 

 到目前为止,传世的中国古代典籍不少已经数字化,与敦煌文献对应的中古时代的四部书、佛典、道书,几乎都有可以检索的电子数据库,如《四库全书》数据库、CBETA(中华佛教典籍数据库)、《中华道藏》数据库等等,做到了所有文字都可以检索,极大地推动了中国古籍的整理、研究和中华文化的传播。

然而,到目前为止,敦煌文献的数字化情况并不乐观。我们就以收藏敦煌文献最为丰富的英国国家图书馆、法国国家图书馆、俄罗斯科学院东方文献研究所、中国国家图书馆这四大收藏单位的藏卷为例,目前虽然已有多家专门的敦煌文献的数据库或是加载了敦煌文献的数据库,如英国国家图书馆牵头并与中国国家图书馆等单位共建的IDP(国际敦煌项目)、法国国家图书馆的Gallica、中国国家图书馆的中华古籍资源库、敦煌研究院的藏经洞出土文献目录数据库、敦煌研究院敦煌文献研究所的敦煌遗书数据库,这些数据库基本上上传的都是图片,而且像拥有敦煌文献数量居于前列的英国国家图书馆、中国国家图书馆,由于种种原因,都还没有把大量敦煌汉文文献图片上传到数据库中,而俄罗斯科学院东方文献研究所的一万多号敦煌文献也还没有上传,甚至还没有做好图片的扫描工作。 

 虽然大多数敦煌数据库加载的彩色图片对于敦煌学研究给予了巨大的帮助,但都不是真正的“数字化”数据库,无法检索每一个敦煌文献上的词语,只有敦煌研究院敦煌文献研究所的敦煌遗书数据库加载了录文,但目前也只有1千多号的文字资料,与7万号的敦煌文献相距甚远。

因为没有数字化的敦煌文献,所以我们还不能像其他传世文献那样做全文数据处理,比如我们无法检索出敦煌文献中出现了多少次“张议潮”一名,我们也不能知道到底有多少件编号的《大般若波罗蜜多经》。这严重阻碍了敦煌文献的整理和敦煌学研究的发展。

那么,如何做到敦煌文献真正的“数字化”呢,这里结合我目前正在主编的《法国国家图书馆藏敦煌文献》高清彩色图录和《解题目录》的工作,略加探讨。

敦煌文献的数字化主要应当由四个部分构成,(1)图像,(2)题目,(3)数字化文本,(4)检索工具。

(1)图像方面,如上所述,法国国家图书馆的藏卷已经全部上网,英国国家图书馆和中国国家图书馆还有相当数量的没有上网,俄罗斯科学院东方文献研究所的藏卷更不容乐观。最近笔者参加敦煌研究院与英国国家图书馆共同举办的“流失海外敦煌文物国际学术研究会暨国际敦煌项目工作会议”得知,目前主要的困难在于没有经费,工作人员不够,所以上网的速度非常缓慢,这个问题似乎也无法在短期内解决。英国国家图书馆获得香港北山堂的资助,开始从事《妙法莲华经》的修复,为该经图片的上传IDP做准备。这样就某一部经来设计工作方案,不是一种学术的做法,只能对某个专题的研究有帮助,而敦煌学发展到现在,已经到了综合研究敦煌文献的时代;敦煌数据库的建设也应当从整体上全面处理文本,并把敦煌文献数据纳入到整个中国古代文献数据库的大家庭当中。因此,各个收藏单位还需要大力开源,争取更多的资金,把敦煌文献的图像早日上传。如果要分出上传文献的先后,应当由馆藏单位广泛征求学术界的意见,选择优先上传的文献,而不是只选择某一部普通的佛经来做先期工作。

(2)标目方面,经过各国敦煌学者、收藏单位的专家、修复技术人员的多年努力,目前海内外敦煌文献的编目、缀合等方面,都取得了长足的进步。中国国家图书馆的藏卷编目随着《国家图书馆藏敦煌遗书》的出版而基本完成,即每册后面所附的条记目录,这个目录也单独出版4。法国国家图书馆的藏卷目录都已发表5,其中原本没有以纸本形式出版的第二卷,也随着Gallica和IDP的图版在网上发表出来,极便学人使用。英国国家图书馆的目录原本有翟林奈(L. Giles)的《英国博物馆藏敦煌写本注记目录》6和刘铭恕的《斯坦因劫经录》7,随后又有黄永武《敦煌遗书最新目录》8,非佛经部分则有《英藏敦煌文献》图录的标题9、拙编《英国图书馆藏敦煌汉文非佛教文献残卷目录》10,以及郝春文等编著的《英藏敦煌社会历史文献释录》的重新标目11,这些都对英藏文献编目有很大推进,目前只有S.8400后的佛典还没有出版专门的目录。俄藏卷现有孟列夫主编的两卷本《苏联科学院亚洲民族研究所藏敦煌汉文写本注记目录》12,上海古籍出版社出版《俄藏敦煌文献》时也做了一部分新标目13,邰惠莉主编了俄藏全部写卷的目录14 

 敦煌文献是写本时代的书籍,还有大量的公私文书,数量庞大,分散收藏,所以目前的各家目录以及研究者的论著中,对同一种文献有不同的命名。由于大多数写本留存的是卷尾的简称,而卷首的全称常常因纸张脱落而不存,所以许多目录都采用卷尾的简称,其实大多数文献都可以据其他写卷或传世的相关目录复原其全称。而公私文书经过多年来学界对吐鲁番出土文书的整理,已经形成一套按照唐朝官文书“抄目”的方式来标目的做法。也就是说,在上网之前,敦煌文献的标目应当有一个统一体例、进行“标准化”定名的过程。目前我们进行的《法国国家图书馆藏敦煌文献》,就是按照这样的原则对法藏敦煌文献全部做了统一、标准化地重新标目,这为今后的文献检索会提供很大的方便。但是,学者们对敦煌文献性质、名称的看法不会统一,所以今后仍然会有同一种文献有不同名称的现象,这种争论可以用多名并存的方式解决,因为网络上有足够的空间,不要因为名称不同的争论而耽误数据库建设的速度。

(3)电子化的文本,这是敦煌文献数字化的核心部分,也是最有学术含量和最难做的部分。正是因为有一定的难度,所以目前的敦煌文献数据库基本上都没有这一部分。不过我对这项工作表示十分乐观的态度,这也是我最近主持《法国国家图书馆藏敦煌文献》,随图录编纂《解题目录》时的感受。

经过一百多年来敦煌文献的整理研究,其实我们现在已经拥有绝大多数敦煌文献的整理本,从最早中日学者关注的儒家经典,到张涌泉主编的《敦煌经部文献合集》15,经部文献基本已经都有了录文。其他史部、子部文献也有不少分类整理的著作,像《刘子》16、《春秋后语》17、各种书仪18、类书19等,都有整理本20。医药文献也有数家整理本,天文历法文献都有较好的录文21,近年来各种数术文献有了分类整理22,最后有关长龙辑校《敦煌本数术文献辑校》的集成著作23。集部的《文选》有很好的合集24,其他诗歌、曲子词、碑铭赞也有透彻的整理,如《王梵志诗集》25、《敦煌诗集残卷辑考》26、《敦煌歌辞总编》27、《敦煌碑铭赞辑释》28。俗文学作品如讲经文、变文等更是敦煌文学研究者关注的对象,有《敦煌变文校注》29。藏外佛教文献中的古逸经、疑伪经30、三阶教文献、禅宗文献都有许多整理本。道教文献也有《敦煌道教文献合集》,已出版第1-2册31 

 大量没有录文的普通藏内佛教典籍,可以借助已有的CBETA数据库,将其中的文本与敦煌本校对,经过修订、增补或删节,形成敦煌本。有些从事敦煌数字化的工作者提出用OCR来识别《法华经》文本,在我看来完全没有必要。因为《法华经》在CBETA上有非常好的文本,而日本学者兜木正亨编有《斯坦因·伯希和搜集敦煌法华经目录》32,还据日本唐招提寺所藏春日版《法华经》编成《敦煌目录对照·定本法华经》一书,所以没有必要重新扫描认证,就可以获得最好的《法华经》敦煌文本,并按照编号的残存程度,剪切成对应图版的电子文本。

对于公私文书的录文,学界也有大量的成果。计帐、户籍、差科簿及相关文书的精准录文见池田温《中国古代籍帐研究》33。各种公私文书,特别是大量寺院的算会历、入破历、行政文书,有唐耕耦等编《敦煌社会经济文献真迹释录》一至五辑34,唐耕耦还对寺院会计文书做了专门的缀合、复原工作35。律、令、格、式、判等法制文书有刘俊文《敦煌吐鲁番唐代法制文书考释》36;社文书有宁可、郝春文《敦煌社邑文书辑校》37;契约有沙知《敦煌契约文书辑校》38;几乎各类文书都有人整理校录。

目前只有郝春文教授主持的《英藏敦煌社会历史文献释录》,是完全对应着英藏敦煌非佛经文献做录文的,这是最方便的按编号顺序的上网文本。但大量的佛经没有收入。目前这套书进行到第19卷,编号至S.4433背,距离全部完成斯坦因收集品部分还有相当长的时间。因此,敦煌文献的数字化也不能等待“对号入座”的录文本完成之后再做数字化,而应当像上面所说,收集前人的录文成果,对应到相关的编号中去。

 

 上面不是要做敦煌文献整理的系统总结,所以只是要说,绝大多数敦煌文献都已经有了整理的文本甚至是电子化的文本,这是我们在整理《法国国家图书馆藏敦煌文献解题目录》时获得的认知。不过收集相关的文本并加以整理的工作,不是敦煌数字化专家所能承担的,而是敦煌学研究者的职责和任务,只有敦煌学研究者知道哪个录文是最佳录文,哪家录文是值得信赖的录文。所以,敦煌学研究者和数字化专家的合作,才能产生真正数字化的敦煌文献数据库。

(4)检索功能,这也需要敦煌学研究者和数字化专家合作,前者提出研究的要求和指向,后者设计出各种检索功能,其结果必然对敦煌学有极大的推动作用。

最后应当提到的是,敦煌文献数据库的建设和完善,需要国际同行的通力合作,需要敦煌学者和数字化学者的相互结合,才能搭建好这个真正数字化的平台。同时应当指出,敦煌文献的录文大多数是中国学者整理完成的,因此在今后的敦煌文献数据库的建设中,中国学者理应做出自己的贡献,把自己的成果转化成数字化的敦煌文献,在扩大自己学术影响力的同时,也使数字化的敦煌文献成为更大范围的中国古代数字文献的一个组成部分。


1 荣新江主编《法国国家图书馆藏敦煌文献》1-60册,上海:上海古籍出版社,2023年

2敦煌研究院编,赵声良、苏伯民主编《甘肃藏敦煌文献》1-10册,兰州:甘肃教育出版社,2023年。

3中国国家图书馆编《中国国家图书馆藏敦煌文献》1-30册,北京:国家图书馆出版社,2023年。

4方广锠、李际宁、黄霞编《中国国家图书馆藏敦煌遗书总目录·馆藏目录卷》,北京:中国人民大学出版社,2016年。

5J.Gernet et Wu Chiyu, Catalogue des manuscrits chinois de Touen-houang. Fonds Pelliot chinois de la Bibliothèque nationale, I, Paris: Bibliothèque nationale, 1970; M. Soymié, Catalogue des manuscrits chinois de Touen-houang. Fonds Pelliot chinois de la Bibliothèque nationale, III, IV, V, Paris: Fondation Singer-Polignac et École française d’Extrême-Orient, 1983, 1991, 1995; F. Wang-Toutain, Catalogue des manuscrits chinois de Touen-houang, VI: Fragments chinois du Fonds Pelliot tibétain de la Bibliothèque nationale de France, Paris: École française d’Extrême-Orient, 2001.

6L. Giles, Descriptive catalogue of the Chinese manuscripts from Tunhuang in the British Museum, London, 1957.

7收入商务印书馆编《敦煌遗书总目索引》,北京:商务印书馆,1962年。

8黄永武编《敦煌遗书最新目录》,台北:新文丰出版公司,1986年。

9英国图书馆、中国敦煌吐鲁番学会敦煌古文献编辑委员会、中国社会科学院历史研究所、伦敦大学亚非学院合编《英藏敦煌文献(汉文佛经以外部分)》,成都:四川人民出版社,1990-1995年。

10荣新江《英国图书馆藏敦煌汉文非佛教文献残卷目录(S.6981-13624)》,台北:新文丰出版公司出版,1994年。

11郝春文主编《英藏敦煌社会历史文献释录》,北京:科学出版社,第1卷,2001年;第1卷修订版,北京:社会科学文献出版社,2018年;第2-19卷,北京:社会科学文献出版社,2003-2023年。

12孟列夫(Л. Н. Меньшиков)主编《苏联科学院亚洲民族研究所藏敦煌汉文写本注记目录》,上海:上海古籍出版社,1999年。

13圣彼得堡东方学研究所、上海古籍出版社合编《俄藏敦煌文献》第1-17册,上海:上海古籍出版社,1992-2001年。

14邰惠莉主编《俄藏敦煌文献叙录》,兰州:甘肃教育出版社,2019年。

15张涌泉主编、审订,许建平、关长龙、张涌泉等撰《敦煌经部文献合集》,北京:中华书局,2008年。

16林其锬《刘子集校合编》,上海:华东师范大学出版社,2012年。

17王恒杰编校《春秋后语辑考》,济南:齐鲁书社,1993年。

18赵和平《敦煌写本书仪研究》,台北:新文丰出版公司,1993年;赵和平《敦煌表状笺启书仪辑校》,南京:江苏古籍出版社,1997年。

19王三庆编著《敦煌类书》,高雄:丽文公司,1993年。

20马继兴、王淑民、陶广正、樊飞伦《敦煌医药文献辑校》,南京:江苏古籍出版社,1998年;马继兴主编《中国出土古医书考释与研究》,全3册,上海:上海科学技术出版社,2015年;沈澍农主编《敦煌吐鲁番医药文献新辑校》,北京:高等教育出版社,2016年。

21邓文宽《敦煌天文历法文献辑校》,南京:江苏古籍出版社,1996年。

22郑炳林《敦煌写本解梦书校録研究》,北京:民族出版社,2005年;郑炳林、王晶波《敦煌写本相书校録研究》,北京:民族出版社,2004年;陈于柱《敦煌写本宅经校録研究》,北京:民族出版社,2007年;陈于柱《区域社会史视野下的敦煌禄命书研究》,北京:民族出版社,2012年;陈于柱《敦煌吐鲁番出土发病书整理研究》,北京:科学出版社,2016年;王祥伟《敦煌五兆卜法文献校録研究》,北京:民族出版社,2011年。 

23关长龙辑校《敦煌本数术文献辑校》,北京:中华书局,2019年。

24金少华《敦煌吐鲁番本〈文选〉辑校》,杭州:浙江大学出版社,2017年。

25项楚《王梵志诗校注》(修订本)上下册,北京:中华书局,2019年。

26徐俊纂辑《敦煌诗集残卷辑考》,北京:中华书局,2000年。

27任中敏《敦煌歌辞总编》上中下册,何剑平、张长彬校理,南京:凤凰出版社,2014年。

28郑炳林、郑怡楠《敦煌碑铭赞辑释(增订本)》上中下,上海:上海古籍出版社,2019年。

 29 张涌泉、黄征《敦煌变文校注》,北京:中华书局,1997年。

30于淑健、黄征《敦煌本古佚与疑伪经校注》,全8册,南京:凤凰出版社,2017年。

31王卡主编《敦煌道教文献合集》第1-2册,北京:社会科学文献出版社,2020年。

32兜木正亨《スタイン·ペリオ搜集敦煌法华経目録》,东京:灵友会图书馆,1978年。

 33 池田温《中国古代籍帐研究》,东京:东京大学出版会,1979年。

34唐耕耦等编《敦煌社会经济文献真迹释录》一至五辑,北京:书目文献出版社与全国图书数据缩微复制中心,1986-1990年。

35唐耕耦《敦煌寺院会计文书研究》,台北:新文丰出版公司,1997年。

36刘俊文《敦煌吐鲁番唐代法制文书考释》,北京:中华书局,1989年。

37宁可、郝春文《敦煌社邑文书辑校》,南京:江苏古籍出版社,1997年。

38沙知《敦煌契约文书辑校》,南京:江苏古籍出版社,1998年。


【本文原刊《敦煌研究》2024年第4期,第92-96页。如需引用,请核对原作。】


校对:翟泰堃

图  :秘书处

责编:沈晓萍

审核:游自勇


此文转自“中国敦煌土鲁番学会”微信公众号


>

北朝考古
欢迎关注
责编:粟特人
编辑:吴蕾


北朝考古
Archaeology of the Northern Dynasties致力于北朝考古相关学术研究成果的收集,为北朝考古爱好者提供一些帮助。偶尔穿插娱乐内容。
 最新文章