盛大林:古籍数字化是提高文化软实力的重要途径

文化   2024-10-08 00:02   湖南  

日前,中办、国办联合印发了《关于推进新时代古籍工作的意见》,明确提出,要促进古籍有效利用,推进古籍数字化,并对相关工作进行了细化。“建立健全国家古籍数字化工作指导协调机制,统筹实施国家古籍数字化工程。积极对接国家文化大数据体系,加强古籍数据流通和协同管理,实现古籍数字化资源汇聚共享。支持古籍数字化重点单位做强做优,加强古籍数字化资源管理和开放共享。统筹古籍数字化版本资源建设与服务,推进古籍专业数据库开发与利用。积极开展古籍文本结构化、知识体系化、利用智能化的研究和实践,加速推动古籍整理利用转型升级。”
在十三届全国人大五次会议上,“加强文物古籍保护利用”首次被写入了国务院的《政府工作报告》。不难看出,《意见》是对《政府工作报告》的细化,使之更具可操作性。应该说,国家对古籍的保护利用一直都比较重视,但像今年这样浓墨重彩却前所未有。这是为什么呢? 因为古籍工作确实进入了一个“新时代”。对此,笔者深有体会。

近年来,因为曾在北京大学从事新媒体及大数据的研究工作,笔者对互联网以及数据库比较熟悉。又因对唐诗宋词等古代文学颇有兴趣,就利用网上的多种古籍数据库对部分经典唐诗及其争议作了一些考证和辨析,仅用一年多的时间,就撰写了30多篇共计 40多万字的论文,并结集出版了《唐诗正本——大数据视域下的唐诗新考》(长江出版传媒崇文书局,2021年10月)。

之所以能够获得学界的认可,应该主要是因为这些论文确实有很多全新的发现,甚至解决了一些长期困扰学界的“疑难杂症”。比如贺知章的《回乡偶书》,“少小离家老大回,乡音未改鬓毛衰。

儿童相见不相识,笑问客从何处来” 中的“衰” 字应该怎么读,一直存在争议,有人认为应该读作shuaī,有人认为应该读作cuī,甚至不同版本的《语文》教科书都各执一词。之所以长期争议不断,主要是因为两种观点都不能自圆其说: 若读作shuāi,全诗押韵了,但流传下来的古代韵书灰韵中没有“衰”字;若读作cuī,与尾句的“来”字又不押韵。为了弄清这个问题,笔者在各种古籍数据库中对此诗进行了全面的检索,获得了大量的相关文献,其中很多信息是近几十年来其他学者未曾引用的。

基于这些新的发现,笔者得出了不同于上述两种观点而且能够自洽的结论: 《回乡偶书》中的“衰”应该读作shuāi,灰韵中之所以没有这个字,是因为宋人在修订韵书时把灰韵中的“衰”字删掉了,只保留了支韵中的“衰”字。唐代的韵书早已无存,流传下来的韵书都是宋代以后的。关于这一观点的论文在《光明日报》发表后,获得了广泛的认同。

考证研究中,笔者还发现了很多经典唐诗在流传中出现的严重讹误,比如李白的《望庐山瀑布》,“遥看瀑布挂长川”中的“长”讹为“前”;杜甫的《望岳》,“会当临绝顶”中的“临”讹为“凌”;常建的《题破山寺后禅院》,“初日朗高林”中的“朗”讹为“照”;岑参的《白雪歌送武判官》,“胡儿琵琶与羌笛”中的“儿”讹为“琴”;王之涣的《凉州词》,“黄沙直上白云间”中的“黄沙直上”讹为“黄河远上”;张继的《夜泊松江》,“江村渔父对愁眠”中的“江村渔父”讹为“江枫渔火”,诗题也讹为《枫桥夜泊》,等等。这些重要讹误的认定绝不是轻易作出的,而是基于大量的古籍版本以及相关文献。除这些前人未经发现的讹误外,笔者还发现了很多前人在考证辨析中的错误判断,比如著名文献学家余嘉锡在《四库提要辨证》中认为,常建的《题破山寺后禅院》里,“竹径通幽处”的“竹”讹为“曲”,是始于明末清初毛氏汲古阁刊刻的《常建集》,但笔者查验发现,汲本《常建集》仍为“竹径通幽处”,毛氏并未窜改此字,而明朝中前期的很多文献版本已经讹为“曲径通幽处”,余嘉锡的“‘曲’字为毛刻之误,审矣”之说虽然斩钉截铁,实则大错特错。再如崔颢的《黄鹤楼》中,“昔人已乘白云去”讹为“昔人已乘黄鹤去”,主流观点认为始作甬者为王安石,因为王氏辑编的《唐百家诗选》此句中为“黄鹤”;笔者查《唐百家诗选》清代以后的多种版本,此处确为“黄鹤”,但在国家数字图书馆的两种宋本中却为“白云”,这说明王安石并没有窜改,而是被后人窜改。

笔者能发现这些问题,主要是因为占有的文献远远多于前人。就拿《黄鹤楼》的考证来说,之前有多位学者曾经涉足,比如2017年第6期《中南民族学院学报(人文社科版)》曾发表罗漫的论文《<黄鹤楼>诗案的千年偏误及其学术史的警省意义》,此文列出的参考文献有18种,均为当代的出版物。而笔者引用的参考文献仅古籍版本就有 72种,包括1种唐写本(即敦煌卷子),7种文献的9种宋本(即《唐百家诗选》《才调集》各2种,《河岳英灵集》《唐文粹》《苕溪渔隐丛话》《舆地纪胜》《方舆胜览》《太平寰宇记》各1种)。宋太宗手书碑刻,也是宋代的文物。另外,还有两种现存日本和朝鲜的古籍版本。罗漫就认为王安石的《唐百家诗选》最早把“白云”改成了“黄鹤”,之所以判断失误,主要就是因为他所占有的文献版本太少、太近。余嘉锡关于“竹”与“曲”之误,也是这个原因。
校勘考证,版本是基础。获取的版本越多、越古,判断就会越准确。而古籍的数字化、数据库的建立以及检索功能的完善,为文献的获取提供了极大的方便。前人考证唐诗的论文,引用古籍版本超过10种的都很少,而笔者平均每篇论文引用的古籍版本约有60种。由于占有的古籍文献很多,笔者能够率先利用大数据进行考证,并对同一古籍文献进行多版本的比对。由于获取的古籍版本太少,很多学者甚至完全没有版本意识,以为同一文献的内容不会因版本而异,这是一种严重的误解。或因无心的失误,或为有意的窜改,古籍文献的每一次重新刊刻都可能产生文本的异变。

中国的古籍数字化工作虽然开展的时间不长,但已初具规模。仅中国国家数字图书馆可供查询的数字古籍就达十几万种,包括英藏和法藏的敦煌遗书等珍贵古籍文献的实物照片。有了这些数据库,用关键字一搜索,相关的文献瞬间就会涌到眼前,这是传统的手段所无法比拟的。那种区别就像是: 一是用古代的罗盘找方向,一是用现代的“北斗”(软件)来定位——无论是效率,还是精确度,完全不可同日而语。

古籍是珍贵的历史文化资源,但保存和利用之间的矛盾一直困扰着收藏业界及有关部门。虽然“纸寿千年”,但在历经数百甚至上千年之后,纸质会因碳化而松脆,每次翻阅都会造成损坏,因此很多稀有的古籍版本都是深藏高阁,向不借阅。比如《唐百家诗选》的两个宋本,一直藏于国家图书馆,借阅过的人肯定寥寥无几。几年前,国家曾推出了“中华再造善本”工程,但成本仍然不低,发行量也很少。而古籍的数字化,既最大限度地保护了古籍,也极大地提高了利用率。一劳永逸,两全其美,可以说古籍的数字化是古籍文献资源保护和利用的一次革命,也是提高我国文化软实力的一个重要途径。

几十年来,我国在古籍整理方面做了大量工作,也取得了很多的成果。但在考证研究的过程中,笔者有一个强烈的感受,那就是很多古籍,包括考校类的文献,都存在很多的错误。这在很大程度上,是考据手段传统及研究方法落后造成的。智能技术支持下的古典文献研究,是未来古籍研究的重要方向之一。我甚至觉得,在古籍数字化及各种专业数据库建设基本结束后,在全新的文献信息资源环境下,古籍整理工作应该重新来过。

互联网、大数据、云计算......现代信息技术在各行各业都带来了颠覆性的变革。古籍的保护利用,以及中华优秀传统文化的传承和弘扬,当然也要与时俱进。令人欣慰的是,党中央、国务院已经有了及时、全面、科学的《意见》。这既是古典文献工作者之幸,更是中华优秀传统文化之幸。

古籍
始于2014年,古籍及艺术品收藏拍卖行业第一大号,数十万古董收藏家爱好者都在关注的掌中文史副刊,从古旧书趣味考古中解读新鲜历史观点,古玩、古董、书画、收藏、拍卖、国学、文化、历史、读书、苏富比、佳士得、嘉德、保利最新资讯等及时送达。
 最新文章