wikipali介绍(六):整个三藏的全变格模糊搜索
文摘
文化
2024-09-22 20:00
广东
wikipali——在线巴利语料库及翻译工具的搭建
摘要
关键词
1 巴利语料库的建立初衷
2 巴利语料的汇集与多文种展示
3 现有巴利词典的索引整合
4 性、数、格的计算机辅助逐词解析
5 词汇关系进行图形化的语法分析
6 整个三藏的全变格模糊搜索
7 不同版本译文的对照阅读
8 三藏根本与注释书的对照和穿插混排
9 基于网站的已有翻译与教学实例
10 总结与展望:巴利语的“小”和“大”
参考文献
wikipali网站是笔者所在团队原创开发的一个巴利翻译综合工具,这是一个用于服务教学、翻译和研究的巴利语料库互联网平台(Corpus platform of pāli language)。Wikipali平台整合了尽可能全面的巴利词典资源,实现了计算机辅助巴利的逐词解析,对巴利语料中的词汇关系进行图形化的语法分析,研发了对巴利圣典的高效搜索和相似句的汇合,支持模糊搜索,可以从三藏根本(original text)、义注(commentary)复注(sub-commentary)等大量资料中,将相关资料原文与注释书内容的穿插混排展示。以上这些功能,将有力支持巴利语的教学、翻译和经典研究工作。
巴利语,巴利语料库,翻译,三藏,义注,复注
Wikipali的全文搜索功能,最初是为了从注释书中查到关键词的解释。比如说,如果对于《蛇王经》《蕴护卫经》中的virūpakkha含义不清楚,则在网站搜索后,就可以看到以下结果:
图20
由上图中可见前面三条返回的结果都是来自义注和复注,其中增支部义注《满足希求》和长部义注《妙祥光耀》都有对此的具体解释,也即是这是一种蛇王族。
因为这种义注或者复注中对于三藏根本的特定词语的解释,是非常常见的,比如都是以xx词语+ti,表示“所谓xx”,因此,这种搜索对于理解词义很有协助。
然而,因为上文提到的巴利语不同于汉语的特点,绝大多数词语的写法形态并不是一成不变的,而是根据性、数、格发生很多种的变化,所以直接的搜索并不能满足这个功能。
因此,我们开发了对巴利单词进行全变格搜索的功能。也即是,当用户搜索virūpakkha时,不仅仅会找到这个词语本身,还能找到virūpakkho、virūpakkhehi、virūpakkhena、virūpakkhaṃ、virūpakkhassa、virūpakkhehīti、virūpakkhā、virūpakkhe等等的搜索结果,这些是virūpakkha在不同句子成分中的变形,这些搜索结果可以拓宽对于virūpakkha含义和应用的理解。
在网站上会体现为如下列表:
图21
值得注意的是,这些搜索的结果后面的灰色数字,即代表在整个wikipali巴利语料数据库中的出现次数。也即是说,这些变格并非是理论上的变化,而是实际上在三藏和注释中的用法。
除此之外,搜索的结果还会说明这些出处都是来自具体的哪本书:
图22
可见,virūpakkha和相关的变形在整个三藏和注释书中的位置非常广泛,主要分布在经藏、律藏和相关的注释书中。如果对这些结果一一点开进行阅读和研究,将不难研究virūpakkha相关的几部经文,对此主题进行全面的了解。
总的来说,模糊搜索功能的引入,不仅提升了用户在巴利语研究中的工作效率,也使得对于词汇深层含义的探索变得更加直观和便捷。
作者:达摩难陀尊者 清净喜尊者 善巧尊者
公众号排版:谢叶婷
翻译平台:wikipali
封面制作:法月贤友