wikipali介绍(二):巴利语料的汇集与多文种展示

文摘   文化   2024-08-25 20:01   山西  



wikipali——在线巴利语料库及翻译工具的搭建
摘要
关键词
1 巴利语料库的建立初衷
2 巴利语料的汇集与多文种展示
3 现有巴利词典的索引整合
4 性、数、格的计算机辅助逐词解析
5 词汇关系进行图形化的语法分析
6 整个三藏的全变格模糊搜索
7 不同版本译文的对照阅读
8 三藏根本与注释书的对照和穿插混排
9 基于网站的已有翻译与教学实例
10 总结与展望:巴利语的“小”和“大”
参考文献

摘要
wikipali网站是笔者所在团队原创开发的一个巴利翻译综合工具,这是一个用于服务教学、翻译和研究的巴利语料库互联网平台(Corpus platform of pāli language)。Wikipali平台整合了尽可能全面的巴利词典资源,实现了计算机辅助巴利的逐词解析,对巴利语料中的词汇关系进行图形化的语法分析,研发了对巴利圣典的高效搜索和相似句的汇合,支持模糊搜索,可以从三藏根本(original text)、义注(commentary)复注(sub-commentary)等大量资料中,将相关资料原文与注释书内容的穿插混排展示。以上这些功能,将有力支持巴利语的教学、翻译和经典研究工作。

关键词


巴利语,巴利语料库,翻译,三藏,义注,复注

2.巴利语料的汇集与多文种展示


Wikipali平台所使用的巴利语料库来源于印度内观中心(Vipassana Research Institute 缩写 VRI)开发的CSCD v4,其内容是缅甸第六次结集时最终认定的巴利版本。这个版本是经过缅甸、泰国、斯里兰卡公认的高僧所进行审定的结果,是目前上座部佛教地区所认可的最权威版本。其内容,不仅包含三藏的根本(mūla),也包含全部的义注、复注,以及第六次结集所许可的藏外巴利文献。 
CSCD4的原始数据是以段落为最小单元。wikipali平台在此基础上,将段落切分为句子。以单个句子为单位建立巴利原文数据库。相对应的译文也是以句子为单位存储。这使得查找某句的巴利原文或者列出巴利原文对应的不同译文版本变得容易。
在经典的研究过程中,语料的可回溯性对于学术严谨性是很重要的。因此,在电子化过程中,我们保留了印度内观中心的电子版中所带有的缅甸原书页码,能否对于任何一句三藏和注释的原文,都可以直接对应到第六次结集的缅甸版本的书籍名称、书籍序号、页码。
除此之外,wikipali语料库平台还利用CSCD中的PTS版和泰文版的页码数据,将这些版本的页码也一并标注,以增强语料库的可回溯性和可靠性。并且我们通过对这些数据的提取和再处理,可以使用程序生成带有书名的页码链接,减轻了研究者的劳动强度,也减低了出现错误的可能性。值得一提的是,在wikipali平台上,这些链接点击后会弹出该页的巴利语原文,方便读者查找所引用的文献出处。
例如在《中部·根本五十·法的继承人经》中,有如下的展示:
 
图5
在这经文的开头一段中,evaṃ me sutaṃ的前面,有T1.21和V1.17的标记,前者说明这是泰国版巴利三藏的第1卷、第21页,后者说明这是印度内观中心版巴利三藏的第1卷、第17页。
 
图6
在这经文的开头一段中,tumhesu的前面,有M1.16的标记,说明这是缅甸第六次结集版本的第1卷、第16页。
除了页码以为,对于巴利文献的目录,wikipali语料库平台提供了两种目录结构。以方便用户查找和研究。第一种目录结构遵循了CSCD4巴利文献电子版的原始结构,按照根本、义注、复注的顺序排列。这也是传统上巴利文献的集合方式。
然而在实际的学习和研究过程中,义注、复注是对三藏根本的解释,所以在阅读根本的经律论三藏的时候,往往需要去查找对应的义注、对应的复注。因此,我们给用户提供了另一种目录结构,把相关的根本和注释书都结合在一起,分为经藏、律藏、论藏(即阿毗达摩藏)和藏外文献四类,以便于用户快速定位到所需的注释书籍。这样两种的目录选择,可以为学术研究提供了便利。
       图7 左侧为CSCD4版本的目录,右侧为改进后的目录

众所周知,巴利语只是一种语言,而非一种文字。因此,巴利文献在缅甸、泰国、斯里兰卡都使用当地自己的文字来记录。这些文字互相差别很大,但其读音相似,含义都是巴利文献本身。
近代学者为了方便研究,又确定了用abcd等罗马字母来转写巴利文献的方案。这也是我们平时常见和常用的巴利文献形态。然而,在缅甸、泰国、斯里兰卡等传统上座部佛教国家和地区,他们大多数人还是以当地的字母来学习和研究巴利文献。
在斯里兰卡,当我们向斯里兰卡的学者请教巴利问题时,就曾经因为这种字母的差别而产生不方便。如果使用他们熟悉的僧伽罗字母,将极大地提高交流的效率。因此,我们开发了使用多种文字来展示巴利文献的功能。也即是说,使用者只需要进行简单的设置,就可以自动选择同样的巴利经文以缅文、泰文、僧伽罗文等方式展示。前年,我们在西双版纳地区学习和交流时,也加入了傣族地区传承巴利三藏所使用的傣仂文。这相当于打破了语言和文字显示的障碍,使得不同语言背景的学者都能理解彼此的观点。否则,他们可能会因为不熟悉某些词汇而感到困惑。
下面以《增支部·一集·色等品》的一段经文为例:
 
图8 《增支部·一集·色等品》一段经文的罗马巴利
 
图9 《增支部·一集·色等品》一段经文的缅文巴利
 
图10 《增支部·一集·色等品》一段经文的泰文巴利
 
图11 《增支部·一集·色等品》一段经文的僧伽罗文巴利
 
图12 《增支部·一集·色等品》一段经文的傣仂文巴利

(未完待续)




作者:达摩难陀尊者 清净喜尊者 善巧尊者

公众号排版:谢叶婷

翻译平台:wikipali

封面制作:法月贤友



点个“在看”,及时获取最新资讯

巴利文献研究
本号发布与巴利语文献相关的研究成果,欢迎研究者和学习者共同交流。
 最新文章