12月9日
北京大学《儒藏》数字化项目启动
项目将充分利用数字化和人工智能技术
推进全本《儒藏》编纂和研究工作
并在“识典古籍”数字化平台
将相关成果面向公众开放
北京字节跳动公益基金会
为此提供技术和资金支持
作为新中国成立以来
最大规模系统整理海内外儒学典籍的
基础性文化建设工程
《儒藏》分“精华编”与全本编纂两步
历时20年,“精华编”主体部分已顺利完成
收录了中国历史上
最具影响力和代表性的儒学文献510种
全本《儒藏》编纂工作于去年启动
学界倾智、企业助力共同照亮
儒学研究之漫漫长路
共担传承优秀传统文化的时代重责
↓点击视频↓
了解《儒藏》的编纂
启动仪式现场
12月9日,北京大学《儒藏》数字化项目启动仪式在北京大学教育基金会北大之友报告厅举行。中宣部出版局副局长、全国古籍办副主任杨芳,教育部社科司二级巡视员马建通,北京大学党委书记、校务委员会主任郝平,副校长、教务长王博,副校长、总务长董志勇,北京字节跳动公益基金会理事长张羽,执行理事长乔栋,副理事长杨洁,北京大学《儒藏》“精华编”总编纂安平秋,执行总编纂李中华、魏常海等嘉宾共同出席仪式。仪式由北京大学党委副书记姜国华主持。
何为《儒藏》?我国的佛教、道教历史上都编有集大成之《佛藏》和《道藏》,但儒学典籍却没人做类似的整理工作。20世纪90年代,北京大学哲学系教授汤一介呼吁,这件前无古人的事需要有人做起来。2003年,“《儒藏》编纂与研究”在教育部立项,是新中国成立以来最大规模地系统整理海内外儒学典籍的一项基础性文化建设工程。编纂分两步进行:第一步先编《儒藏》“精华编”,第二步编全本。2004年,北京大学《儒藏》编纂与研究中心成立,负责组织实施编纂工作,工程正式启动。
启动仪式上,北京大学副校长、教务长、教育基金会副理事长、《儒藏》工程首席专家王博教授回溯了《儒藏》工程21年的发展历程,并向推进《儒藏》工程的代代学人表达了崇高的敬意。他指出,数字人文技术的迅猛发展,为古籍整理、研究和普及提供了巨大的便捷,也必将助力新时代《儒藏》工程。王博感谢了北京字节跳动公益基金会为《儒藏》提供的宝贵资金和技术支持,并表示,要积极响应国家古籍数字化战略要求,重点推进《儒藏》文献的数字化整理、智能化利用和网络化传播,为国家古籍数字化战略的顺利实施作出新贡献。
王博发言
20世纪90年代,在多位学界前辈的支持下,北京大学哲学系教授汤一介先生提出把历代儒家典籍文献汇编成一个独立文献体系的设想。“藏”取自“宝藏”之义,“儒藏”即意为儒家著作的总汇。
2003年,《儒藏》工程在教育部立项,季羡林先生任首席总编纂;次年,北京大学《儒藏》编纂与研究中心成立,汤一介先生任中心首任主任。
△汤一介先生在《儒藏》编纂工作中
作为新中国成立以来最大规模系统整理海内外儒学典籍的重大基础性文化工程,《儒藏》工程深度契合了国家文化发展战略,具有广阔的学术研究价值和深远的文化传承意义。2014年5月4日,习近平主席考察北大时曾看望汤一介先生,对《儒藏》编纂工作给予高度评价,赞扬汤先生“传承中华文明,做了一件非常大贡献的事情”!
千年典册承儒学,廿载光阴一藏中。二十余年间,编纂团队焚膏继晷、不懈耕耘,广泛参考各种古籍目录,走访各大图书馆,搜集海内外馆藏善本,大力开展对版本源流的调查和研究。
由于卷帙浩繁、体量巨大,工程分为“精华编”和全本编纂两阶段实施。先期成果《儒藏》“精华编”中国部分已于2022年全部完成出版,总字数近2亿字,收录了中国历史上最具影响力和代表性的儒学文献——包括传世文献和出土文献510种,编为282册。
2023年,全本《儒藏》编纂工作启动,计划收书3000余种(含“精华编”),预计内容约10-12亿字。面对更为繁琐庞杂的艰巨任务,传统的工作模式已无法满足学者对项目推进效率的期待,对数字化整理的创新性探索因此被提上日程。
企业的技术研发优势与高校的专业学术能力深度融合,推动古籍经典在数字化时代焕发全新活力,为前沿领域的突破创造了无限可能。
过去的古籍整理工作,前期的标点、校勘、审稿阶段都在纸稿上进行,一直到出版社阶段才会形成文稿的电子版,而且需要真正的人力一个字一个字输入电脑,尤其古籍中生僻字多,单单由书稿转电子版就非常费力。令人感到庆幸的是, 人工智能加持下的数字人文技术的辅助将改变这一切。
2022年,北京大学数字人文中心联合字节跳动研发上线了免费公开的“识典古籍”数字化平台,通过智能化整理,让古籍能够以文本的形态加以检索、关联阅读和深度挖掘与利用。
基于平台发展成果,北京大学数字人文中心主任王军教授曾在《儒藏》全本编纂启动大会上发言,希望结合现有的古文献数据库,从智能编纂平台、数据库发布平台等多方面,推进全本《儒藏》数字化工程。
为了保证质量,早期“精华编”的编纂流程包含多达11个环节,几乎需要“五审五校”,大量耗费时间和人力。如今,现代科技为古籍整理的传统工作模式带来了前所未有的变革,也为儒家文明的全球性推广提供了全新路径。
目前,《儒藏》工程已计划将现代科技手段引入下阶段的全本编纂工作,在对底本原稿进行扫描的基础上,通过OCR识别实现数字化,并附以底本、校本影像作对照,再进行标点和校勘,最终以排印和数字化的方式出版,整体性推进《儒藏》文献的数字化整理、智能化利用和网络化传播。
中华古老文明与前沿人工智能技术的深度结合,在提高《儒藏》编纂效率与传播速度的同时,更将丰富和提升智能工具对儒家文明的知识储备和理解问答,推进中华文明智能体应用,为国家古籍数字化战略的顺利实施做出新贡献。
自2021年6月以来,字节跳动开始通过公益捐赠助力古籍修复,并依托自身的技术和产品能力,开展古籍数字化与活化传播工作。
此次捐赠支持北京大学《儒藏》数字化编纂相关工作,是字节跳动在助力古籍修复与保护领域的又一重要举措,旨在推动以儒家思想为主流的中华优秀传统文化得到全面整理,进一步发扬它们所承载的中华民族的深邃智慧和精神力量,更好地满足当代学术研究和中华文脉传承的需要。
在字节跳动相关负责人看来,计划在“识典古籍”平台阅读端上线《儒藏》相关成果,并向公众开放,既为阅读古籍的读者提供了便利,也拉近了公众和《儒藏》之间的距离,让经典更加触手可及。
△郝平书记向北京字节跳动公益基金会授予北京大学杰出教育贡献奖
典籍耀故邦,学术惠四海
在企业的鼎力支持下
随着数字化技术的飞速发展
《儒藏》这部传世经典与文化巨著
定将跨越重重难关
完整而精彩地呈现在世人眼前
赓续中华文脉,谱写当代华章
为人类文明的璀璨星图持续添彩
来源 | 北京大学融媒体中心、北京大学教育基金会
参考资料 | 新华社、央视网、长安街知事、字节跳动公益、北京大学《儒藏》编纂与研究中心、北京大学数字人文研究中心
图片 | 宋柏凝
文字&编辑 | 尹乐怡
排版 | 史童月
责编 | 郭雅颂
<<左右滑动查看栏目>>