巴利语不同于汉语,其最大的特点是,每个名词、动词等实词,会有很多变化。从大的方面有以下三类:
1、性。名词、代词、形容词等在语法上具有不同性别特征,一般分阳性、阴性、中性三类。
2、数。名词、代词、形容词、动词等,根据其所关联的含义是单数对象还是复数对象,
3、格。名词、代词等在句子中起到不同作用时,会有八种格位的变化,即主格、呼格、宾格、工具格、来源格、属格、目的格、位置格。
上述的性、数、格三种变化,其表现形式是对巴利语单词本身进行词末的变形。比如,已经确定为阳性词的purisa(男人),对于单数和复数、八种格位的组合中,就有以下超过二十种拼写:
表2 purisa的变格表
可见,对于每个名词而言,至少有2数(单、复)乘以8格位,即16种变化。对于三性词而言,则要再乘以三,也即是48种变化。而这些变化,除非已经将各种变形规则烂熟于心,否则很难直观地判断出来单词的原型与其性数格。
因此,可以说,巴利的翻译并非是以词为最小单位,而是以“带有性、数、格信息的变化的词”为最小单位。正因为巴利语的复杂性在于其词汇具有丰富的形态变化,这使得翻译工作更加具有挑战性。
因此,我们开发了“神奇字典”。神奇字典功能可以记录用户对特定形态的巴利词语的查询和标注,这样,当同一形态在其他经文再次出现时,无论是同一用户还是其他用户,都能够直接获得之前的结果,翻译者只需要进行核对和检查,而不用从头开始判断,从而显著提高翻译效率。
比如说,只要曾经有人对purisehi标记过其原型是阳性名词purisa,是复数的工具格。那么在之后的翻译者遇到这个词时,就可以直接展示出来purisa、阳性、复数、工具格,甚至展示出推荐的译语。这不仅提高了个人的翻译效率,也促进了整个社区的知识积累和共享。
例如,下面这句经文出自《小部义注·本生义注·止恶法本生注释》:
图14
当使用神奇字典功能时,wikipali语料库平台会根据之前的数据提供如下的逐词译拆分及信息:
图15
可见,神奇字典功能会将Haṃso拆分成为haṃsa+[o],其中haṃsa含义为“天鹅”,其为阳性名词,词尾的[o]在这里是a结尾的阳性名词的单数、主格,也即是说Haṃso在这句话中含义为“天鹅”,在句子中作用为主格。
第二个字sakkharasaddaṃ,被系统识别为合成词,应当拆分为sakkhara和saddaṃ。其中前者含义为“碎石”,是阳性名词。后者含义为“声音”,具体来说,是sadda+[ṃ]的组合,sadda为“声音”,[ṃ]为a结尾的阳性名词的单数、宾格。因此,这整个词语含义为“碎石的声音”,在句子中作用为宾格。
第三个字sutvā,被系统识别出这是一个动词的变形,即suṇāti+[tvā]。其中前者含义为“听闻”,后者[tvā]为动词绝对式,含义为“某动作之后”。因此,这个词的整体含义即为“听到……之后”。
在检查这三个字的拆分和含义都正确以后,这句话的含义就很清楚,即为“天鹅听到碎石的声音之后”。如果翻译者发现系统提供的拆分和含义数据有错,可以手动调整,之后并提交到网站数据库,便可为后来的翻译者对同一个词的拆分提供更准备的参考。
神奇字典最初是为巴利翻译设计的,但随着技术的发展,它已经能够支持缅文,已经投入到使用当中,并有潜力在未来支持更多语言文字。这种扩展性极大地提升了翻译工作的效率和准确性,同时也促进了知识的共享和社区的发展。而且,当用户提交数据的量达到一个比较大的数量之后,可以进行大数据统计。这对语料库语言学的研究是有参考价值的。