壮侗语系的演化——来自系统发育学的证据

文化   教育   2024-03-23 19:40   广东  
言是社会经济文化的载体,研究语言的演化进程可以在一定程度上帮助我们了解人类的历史文明进程。清华大学的统计学研究中心的陶宇心博士和复旦大学现代语言学研究院的张梦翰教授采用贝叶斯系统发育学的方式对语言的演化进程做出了探究。

东亚和东南亚拥有多个伟大的文明古国和世界上人口最多的国家,然而其民族语言史前史仍然鲜为人知。Kra-Dai语系在东南亚大陆的语言联盟中有着举足轻重的地位,但学界对其的研究还存在很多的不足,比如Kra-Dai语系分支之间的语言亲属关系仍旧处于争论之中;第一次语言分化时间不明确;以及Kra-Dai语系起源于哪里,又是沿着怎样的路线进行传播的。

传统语言学会采用词汇统计法来估算语言间同源词的百分比,而同源词指的是从共同母语中的一个词源祖先直接继承下来的不同语言的词组。简单来说同源词中的单词尽管在具体语言中表现形式存在不同,但他们都是从一个共同的语言祖先分化而来的。在词汇统计法中,语言年代学(Glottochronology)可以根据相对稳定的基本词汇中词素替换的比例和速度,估计两种语言的大致分化日期,但这种方法有一定的局限:1.它假定语言的核心词汇会以固定的速率变化,这其实并不符合现实;2.这一方法很依赖历史材料,然而很多时候历史材料都是比较匮乏的。因此,作者引用了生物学领域的贝叶斯系统发育学这一分析方法,一方面是因为语言的演化与生物的演化有一定的相似之处,另一方面,这一分析方法允许语言以不同的速率变化。

在正式采用这一分析方法之前,作者先建立了Kra-Dai语系的语料库,他们从多种不同的数据来源之中,根据相对统一的语言形式,从119种语言中筛选出了100种语言,由专业的语言学家根据语义和语音形式,对这100种语言的词汇进行了同源词分类,最终为100中语言中90个词建立了646个同源集,用于之后的建模分析。

作者使用贝叶斯系统发育学分析探讨语系分支之间的亲属关系以及壮侗语系的初始分化时间。通过分析进化树模型的拓扑结构、分支长度和各个进化参数的大小来①找出不同语言间的进化关系;②理解此语系祖先与其后代之间的关系;③估算一组共有共同祖先的语言间的分歧时间。在具体的分析中,使用两种残基替换模型(continuous-time Markov chain model和 binary covarion model,即连续时间马尔科夫链模型和二元协变模型)、两种位点异质性模型和两种分子钟模型(宽松分子钟和严格分子钟)的组合构建进化树。

根据模型产生的最大支持度树的结果(如下图)可得,① Kra-Dai语系可分为五个明确定义的分支,每个分支都是单系群的,这一结果得到了高后验概率的支持。具体来说,Kra和Hlai语言分别从Kra-Dai语系的其他语言中分离出来,而OngBe则是Tai和Kam-Sui两个分支的姐妹群。Tai分支进一步分为北部Tai、中部Tai和西南部Tai三个群体。② Kra-Dai语系的语言大约在4000年前发生了首次分化。   

 

    

图1 最大支持度树及各语支分化时间

接下来,为了重建Kra-Dai语系的原乡、理解各个语言之间的演化扩散过程,作者使用了系统地理学分析。系统地理学致力于了解遗传谱系(在本文中为语言)在地理空间上的分布与传播。具体地,作者首先将Kra-Dai语系样本的地理分布划分为五个不同区域:广西-广东沿海地区,云贵两省内陆分开的地区,海南省的岛屿地区,以及本研究中涵盖其他地区的中南半岛地区,包括泰国、越南、老挝、缅甸和印度。在考虑了重建的Kra-Dai语系系统发育之后,作者进行了语言祖先状态的重建,发现沿海地区最有可能是Kra-Dai语系的起源地,其最大概率为47.0%,显著高于其他地区的概率(见图3)。这一结果支持了沿海起源假说。    图2 Kra-Dai在史前时期扩散路径的推断

作者进一步评估了五种不同的模型组合,使用贝叶斯可逆跳跃马尔科夫链蒙特卡洛方法(RJ-MCMC)推断Kra-Dai语系的扩散路径。具有最高贝叶斯因子(BF = 42.67)的最佳模型显示:在地理上非相邻的区域之间没有发生过语言扩散,MSEA和海南岛之间也没有发生过扩散。因此,现有结果说明,一些早期的Kra-Dai语系通过琼州海峡传播到海南岛;有些向西北扩展到云贵两省的内陆地区,并进一步向西南扩散到中南半岛;还有一些直接从沿海地区传播到中南半岛(图3)。

为了更全面地理解Kra-Dai语系分化和传播背后的社会文化背景,作者还整合了来自遗传学、考古学、古生态学和古气候学等多个学科领域的证据,描绘了Kra-Dai语系的演变过程。

如图4所示,Kra-Dai语系的分化速度表明,此语系初始分歧发生在约4000年前,第二次发生在约3200年前,然后在过去2300年中,语言数量不断增加(图4a)。根据考古证据,在大约4000年前,中国南部的考古遗址数量急剧减少,然后在大约3000年前增加并达到最大值(图4b)。遗传证据则使用Kra-Dai线粒体DNA谱系的贝叶斯天线图表示,反映了Kra-Dai人口规模的历史变化。总体上,作者发现两个人口增长阶段,前者是在6400-4200年前的约17倍的人口增长,后者是在3500年前至今的约16倍的人口跃升(图4c)。此外,古生态学的证据表明,在4400-3500年前,中国东部和西南高海拔地区的热带稻的生存概率急剧下降,然后相对稳定维持(图4d)。最后,基于古气候学的证据,作者发现全球温度下降,即所谓的4.2K事件(发生在4400至3500年前,最低点在约4000年前)。而在过去的3000年中,全球温度相对稳定。这些证据一起揭示了Kra-Dai语系的发展历程,以及这一过程与人类社会、考古、遗传、生态和气候等多个方面的关联(图4e)。

综上,Kra-Dai语系的时空演变对于理解东亚和东南亚的人口活动和社会文化发展至关重要。在这项研究中,作者采用了贝叶斯系统发育方法,重建了Kra-Dai语系五个分支之间的语言关系。作者还估计了Kra-Dai语系的初始分歧,大约发生在约4000年前。贝叶斯系统发育地理学推断表明,沿海地区(广西广东省)很可能是Kra-Dai语系的扩散中心,并勾画了南北和东西两个扩散路径,这与先前的遗传和文化证据一致。此外,跨学科研究表明,Kra-Dai语系的扩散可能与东亚和东南亚的环境变化和人口活动有关。总的来说,此研究发现为Kra-Dai语系的演化动态提供了新的视角,并揭示了它们对东亚和东南亚语言多样性形成的贡献。通过研究Kra-Dai语系的演化历史,我们可以更深入地了解当前社会文化格局,并更好地理解这些地区史前时期的变化。

参考文献

Tao, Y., Wei, Y., Ge, J., Pan, Y., Wang, W., Bi, Q., ... & Zhang, M. (2023). Phylogenetic evidence reveals early Kra-Dai divergence and dispersal in the late Holocene. Nature Communications14(1), 6924.

作者 | 张 玥  李 劭

图文编辑 | 不晓心读写 

审核 | 神经的罗贝尔博士


神经的罗贝尔博士
社会文化与神经科学实验室(Socio-Cultural and Affective Neuroscience Lab)
 最新文章