人类起源、语言的形成及其演化问题

政务 2024-11-13 21:54 北京

声明：本文转载源于公众号“汉语史与汉藏语研究”。

一人类起源与语言能力的形成

蔡元培先生（1928：1）在《历史语言研究所集刊》创刊时曾言，“同是动物，为什么只有人类能不断的进步，能创造文化？因为人类有历史，而别的动物没有。因为他们没有历史，不能把过去的经验传说下去……”，“同是动物，为什么只有人类能创造历史，而别的动物没有？因为人类有变化无穷的语言”。但是，我们不禁要进一步追问，为什么只有人类能够形成自己的语言，而别的动物没有？

要回答这个问题，我们先需要解释我们人类从何而来，又是如何一步步进化成现在这个样子的。对此，我们需要借助两方面的证据：一种是对别的动物的研究，一种是对新发现的化石的研究。

演化生物学告诉我们，黑猩猩（chimpanzee）是生物圈里跟人类最具亲缘关系的动物。在大约500-700万年之前，我们与我们的远亲黑猩猩分化为不同的属（Genus），二者在基因方面仅存在1.2%左右的差别。（VallenderEric, et al. 2008）

图1 灵长动物分化时间、大脑容量及基因差异图（Vallender Eric，et al. 2008）

既然我们与黑猩猩在基因上有如此高的相似度，那么我们与它们在交际行为上是否也有相似之处呢？黑猩猩作为我们最近的亲戚，通过观察它们的交际行为，可以为我们了解人类早期的交际行为方式提供很强的借鉴，因为在没有分化以前，我们就是它们，它们就是我们。观察的方法一般有两种：一种是观察它们之间自发的交流活动。20世纪初期，Jane Goodall率先进行了这方面的探索。此后，荷兰科学家F. B. M. de Waal（2005）总结了百余年来我们所积累的有关黑猩猩的研究，认为黑猩猩有很丰富的沟通的能力，它们能用不同的表情、肢体语言和不同的声音传达不同的信息。另一种是观察它们的自我意识（self-awareness）。自我意识是一种非常微妙的能力，这种比较深入的认知能力非常重要，如果缺少了这种能力，语言就不可能发生。在自然界中，极少有动物能像我们人类一样具备这种能力，大多数动物都不知道自己是谁。如狗在镜子前经过时，就没有能力识别出镜子中自己的影像，或者它在屏幕上看到自己的动作时，也不知道那就是自己。但科学家（Povinelli, D.J. & J. Vonk. 2003）在黑猩猩身上发现了这种自我意识的痕迹。他们在睡着的黑猩猩的耳朵上涂上颜色的标记，当这些黑猩猩醒来去照镜子，看到镜子里的黑猩猩耳朵上的颜色时，它们也会去摸自己的耳朵。

可是，能不能教会黑猩猩掌握人类的语言呢？从目前已有的情况来看，这种尝试是失败的。例如，20世纪20年代，一对美国的夫妇（Keith & Catherine Hayes）以完全相同的方式，抚养自己的孩子和一只同龄的黑猩猩幼崽。当人类的孩子到了一两岁，开始逐渐学会了说话的时候，即使投入更多的时间和精力，这只黑猩猩却最终只学会了四五个单词的发音。所以我们无法教会黑猩猩发出人类的口语。后来，人们改进了教学的方式，不再强调口语的教授，而改用图形符号、打手势的方式，黑猩猩的表达能力得到提升，甚至能学到三四百个不同的词汇符号，包括很简单的句型。还有一些著名的例子，比如，20世纪60年代末，黑猩猩Washoe在美国心理学家Ganders夫妇的教授下，成功地掌握了大量的美式手语动作之后，竟然能创造性地把不同的符号标记用新的方式组合起来，指示未知名称的对象，如用“水—鸟”来指称鸭子。但是，对于复杂的语法现象，黑猩猩并不能掌握。

上述黑猩猩学习人类语言的基本情况，大致上反映了几百万年前早期原始人处于萌芽时期的语言能力面貌。然而我们都知道，黑猩猩至今也没有形成自己的语言，那么在这600多万年的历史演进中，到底是什么因素促进了人类语言的形成，使得我们变成我们，而它们还是它们呢？

一些化石材料给我们提供了富有启发意义的线索。

1974年，美国古人类学家Johanson等人，在埃塞俄比亚的阿瓦什低谷（Lower Valley of the Awash）发现了一具大约320万年之前的南方古猿（Australopithecus）的化石，研究者们根据当时庆祝发现而播放的披头士乐团的一首歌Lucy in the Sky with Diamonds将她命名为Lucy，并拟构了她的骨骼模型。从骨盆、膝盖、脚的结构、手和下肢的长度来看，Lucy已经直立行走。后来，研究者们又在发现Lucy化石的地点附近，发现了一些脚印，这些脚印大概产生于350万年之前，与Lucy生活的时代比较接近。相关的数据分析(Johanson, D. & B. Edgar. 1996)显示，这些脚印的主人也已经能够直立行走。

以直立行走取代四肢着地的行走方式，是在人类的语音发展史上具有里程碑意义的事件。伴随着这种发展，双手就能够承担先前由嘴所完成的很多任务，比如搬运和搏斗，这就使得语音的发展成为可能。此外，直立行走后得以解放的双手，逐渐承担了制造工具的职能，在制造工具的过程之中，我们的双手日益迅速地变得灵巧而熟练，这进一步对神经系统产生了影响。具体而言，我们的大脑得到不断地锻炼，脑容量也不断增大。Ian Tattersall(2008)等人的研究发现，在600万—300万年之前这段长达300万年的时光里，灵长目动物的大脑容量几乎没有多大变化：300万年前的南方古猿虽然站了起来，但由于不会制造工具，它们的大脑容量基本与600万年之前的乍得沙赫人猿（S.tchadensis）以及现代黑猩猩的脑容量相同，大概在400cc左右。自开始制造工具以后，在过去的200万年之中，人类的大脑容量以惊人的速度增加：200万年前的能人（如鲁道夫人rudolfensis）的大脑容量大约在600cc左右；100万年前，原始直立人的脑容量已经达到了850-1100cc；到了10万年前，智人（如尼安德特人Homo neanderthalensis）的大脑容量已经与现代人的大脑容量相当，平均大约为1400cc。

图2 大脑容量示意图（Ian Tattersall. 2008）

当然，上述关于直立行走对大脑容量影响的假设，在一定程度上只是描述了人类发展的一般趋势。科学是无止境的，随着新的化石材料的发现，我们的认识也会不断加深。2015年10月，National Geographic报道在南非发现了纳勒迪人（Homo naledi）这一新的人种的化石，其大脑容量却非常小，还不到现代人脑容量的一半，男性只有560cc，女性的更小。所以我们这方面的材料越多、越丰富，分析的方法越精确，我们对我们的起源、演化的过程的认识也就会越清晰。

从语言学的角度来说，直立行走给我们人类带来的另外一个重要的影响就是，它使人体产生了专门针对语言的适应变化，为我们的发音提供了更为合适的生理构造（见图3）。其中最为明显的变化就是，直立行走使得现代人的喉部位置明显低于黑猩猩以及我们的远古人祖先。喉部的下降，使我们有了一个从唇到喉之间的弯曲声道，而其他灵长目动物的声道相比之下要直一些。此外，由于喉部从软腭降低，喉管中负责发声的通路随之变长，口腔中用于调音的管路变短，当舌身在口腔中向前向上移动时，在咽部就产生了一个较大的空腔。这种口腔与咽腔相通的双管系统（twin-tube system）的声学构造，让我们能够在正常的说话发音过程中，通过改变口腔和咽腔的形状和大小，得到种类丰富的共振频率，也就为我们人类能够发出更为多样的语音提供了保证。

图3 黑猩猩、古人类及现代人的发音通路示意图（Lieberman，D. E. 2013）

二现代人迁徙到全世界

世界科学界最伟大的科学家之一，达尔文，在他1859年的那部巨著（On the Origin of Species by Means of Natural Selectionor The Preservation of Favored Races in the Struggle for Life.）中提到，很可能我们的祖先曾在非洲居住。但是达尔文的这种假设在很长一段时间内并没有得到现代科学的验证。1987年，Berkeley人类学系的学生Rebecca L. Cann（1987）首次用基因证明了现代人起源于非洲。Rebecca在学校附近的医院收集了147个不同女性的胎盘，从中析取出母系的线粒体（mitochondria）的DNA，然后以统计学的方法建构了人类演化的树图（图4）。这些女性分别来自非洲、亚洲、欧洲和澳大利亚等不同的地区和国家，但她们体内的线粒体DNA都指向了一个共同的祖先，这位祖先是大约生活在二十万年前的一位非洲女性。

图4 mt DNA 母系树图（Cann，et al. 1987）

Rebecca的研究给现代人的非洲起源说提供了很强的证据支持。但是，由于线粒体DNA中只含有37个基因，所能提供的信息较少，而且Rebecca所搜集到的样本数量也不多，有些学者对她的研究结果产生了怀疑。为了避免上述缺陷，一些人口遗传学家如Luca Luigi Cavalli-Sforza（2000）等人，借助含基因数更多的Y染色体（Y Chromosome）来分析现代人演化的历史。他们得出的结论（见图5）也证明了现代人起源于非洲，与Rebecca的研究结果不谋而合。

图5 人类Y染色体序列变异图（Cavalli-Sforza，et al. 2000）

Cavalli-Sforza & Feldman（2003）又进一步依照遗传学的结果，描绘了世界范围内现代人的迁徙图（图6），展示了现代人是如何从非洲一步步进驻到世界上的其他领地的。他们认为，在大约十万年以前，现代人离开非洲，向亚洲迁徙，在到达亚洲以后便分为南北两支——南支从海路在四万年前抵达东南亚和澳洲，北支从陆路在大约五六万年以前到达中国。到达中国的人类又分为东西两路继续迁徙，西路在大约四万年以前到达欧洲大陆；向东路进发的现代人则于一万五到三万五千年以前跨越白令海峡，踏上北美大陆，随后南迁，扩散至南美。至此，现代人基本完成了在全世界范围内的迁徙。

图6 世界范围内现代人的迁徙图（Cavalli-Sforza &M. W. Feldman.2003）

施莱哈尔（August Schleicher）在达尔文生物进化论思想的启发下，提出了著名的谱系树理论（family tree），在历史语言学的研究中影响深远。语言谱系树上每一个语支的分化与历史上人口的迁徙之间是否存在联系，或者说，语言学家能否像达尔文说的那样，以人种的谱系为依据来研究语言谱系分类呢？Cavalli-Sforza（1988）等人曾经做过相关方面的研究。他们将现代人的基因谱系与Greenberg所划分的语言谱系整合为一张双树图，发现二者之间具有非常多的相同性。

图7 基因谱系与语言谱系双树图（Cavalli-Sforza，et al. 1988）

现代人在迁移到中国以后，又是如何进一步发展的呢？根据张光直（1986）的研究，中国境内出现的一些早期遗址群组在9000年前仍是相互独立的和彼此分离的。在7000年前，这些群组的活动范围不断扩大。到了大约6000年前，这些原本各自独立的群组，如仰韶文化、红山文化、大汶口文化、大溪文化、马家浜文化、河姆渡文化等，开始展现出很大程度的相互影响，转变为一个相互联系的文化网络，“初始的中国”（initial China）逐具雏形。当时文化网路中的那些不同地域的文化，相互之间的联系紧密程度是不相同的，在Zhao，T. M. &T.D. Lee（1989）看来，可以总体上将他们分为两支：长江流域的文化和黄河流域的文化，这两个流域的文化，共同孕育了现今国内的各个民族。

三语言的涌现及设计特征

所有的动物都有沟通的能力，动物若无沟通能力，也就无法生存。但是在所有的动物中，只有人才有能力使用语言进行沟通。关于语言究竟为何物，亦即一个系统必须具备哪些必要和充分条件，才称得上是语言，Hockett(1960)首度提出了“设计特征”(designfeatures)的概念，共十三种(图8)，分别为：1. 声耳渠道(vocal-auditory channel) 2. 四散传播与定向接收(broadcast transmission and directional reception) 3. 迅速消失(rapid fading) 4. 互换性(interchangeability) 5. 整体反馈(otal feedback) 6. 专门化(specialization) 7. 语义性(asemanticity) 8. 任意性(arbitrariness) 9. 分离性(discreteness) 10. 超越时空(displacement) 11. 能产性(productivity) 12. 传统传导(traditionaltransmission) 13. 二重层级性(duality of patterning)。只有同时具有上述十三种设计特征的沟通，才能称得上是语言的沟通。

图8 Hockett提出的语言的13种结构设计特点（Hockett，1960）

其中，较其他所有动物的沟通形式而言，超越时空性、能产性和二重层级性是只在人类语言沟通方式中才具有的特征。

“超越时空”是指，人类在沟通时不仅仅能够谈论此时此地的事物，异时异地的东西也能成为彼此交流的对象。不受时空的限制，是我们能够顺利沟通的保障。“能产性”是针对语言系统的开放性而言的。我们可以利用语言系统中已有的单位，按照以往所熟悉的各种规则进行组合，创造出新的话语。“二重层级性”主要涉及语言系统中意义与形式或者说“名”与“实”之间的关系。在任何一种语言里，有意义的成分数量都极大，然而，它们却由少量可以辨别的、本身没有意义的音素组成的很小的单位来体现。荀子对语言系统中“名”与“实”之间的关系有非常精辟的见解，他说：

名无固宜，约之以命，约定俗成谓之宜。名无固实，约之以命，约定俗成谓之实名。名有固善，径易而不拂，谓至善名。（《荀子·正名》）

也就是说，意义和形式之间并无天然的联系，我们之所以能够用某种语言形式来表达特定的意义，完全是社会群体之间约定俗成的结果。

四 “发音三部曲”

语音是语言运作的第一关，词汇、语法、语义、语用等全都建立在这语音基础上。说话时，大脑通过很多不同的神经系统的准确配合，精确地控制几十个不同体积、不同距离的肌肉，让口腔很快地发出一连串的语音。由于身体在演化过程中的改造，有的神经通路从大脑下部下降绕过心脏的大动脉，再上升到喉咙去控制声带的抖动，因此，发音是一个极为复杂的动作(详细内容参见王士元 2008 宏观语音学,《中国语音学报》1.1-9)。

其中有三个环节是我们发音过程中不可或缺的。首先，呼吸时产生的气流为我们的发音提供动力来源。然后，是发声活动中最为重要的环节：气流冲击喉管中的两片富有弹性的声带，使其不断开闭、振动而产生声音。气流越强、声带越紧张，振动的频率越快，发出的声音就越高。图9展示的是声带在不同音高时的具体开闭状态及振动情况。最后是调音环节，我们的口鼻腔充当着共鸣器的角色，能使声带发出的声音带上不同的音色。舌位的前后和高低，唇形的圆展等等，都是调节音色的重要手段。

图9 声带振动图（王士元 2008）

五语言中的歧义（ambiguity）

语言会有歧义，别的动物的沟通系统包括人机沟通的语言都没有这种现象。赵元任先生写过一个小故事——《施氏食狮史》：

石室诗士施氏，嗜狮，誓食十狮。氏时时适市视狮。十时，适十狮适市。是时，适施氏适市。氏视是十狮，恃矢势，使是十狮逝世。氏拾是十狮尸，适石室。石室湿，氏使侍拭石室。石室拭，氏始试食十狮尸。食时，始识是十狮尸，实十石狮尸。试释是事。

全文都由[ʂʅ]这个音节构成，我们如果查字典，可以查到好几十个读作[ʂʅ]的字，这是词汇层次的歧义。句子层次也有歧义。比如，“行人等不得在此小便”这个句子，如果在中间加两个标点，变成“行人，等不得，在此小便”，意思就大为不同。“我们/没有做/不好的/事情”跟“我们/没有/做不好的/事情”也是完全不同的意思。这是语法关系不同造成的歧义，是一种syntax ambiguity。赵元任先生最喜欢用的例子是“鸡不吃了”。这都不只是断句停顿的问题，因为断句停顿一定是“鸡/不吃了”。但是在一种理解中“鸡”是主语，是“鸡不吃东西了”的意思；而另一种理解中“鸡”是宾语，只是移到了句子的最前端，意思是“我们不吃鸡了”。每种语言都有类似的ambiguity。这也是电脑翻译遇到的最大的困难。老人大脑退化的其中一个表现就是，对于歧义句往往只能想到其中的一种解读方式，最明显的那个，别的解读方式就找不出来了。

MIT的两个科学家——Piantadosi和Gibson——提出了一个很有意思的论点，认为ambiguity其实是非常有用的，具体内容可以参看Piantadosi, S. T., H. Tily & E.Gibson（2012）。

我在1978年的那篇文章Explorationsin language evolution.中写过这样一段话：

许多这些能力在他种动物中也不同程度地存在着（看看黑猩猩使用工具与解决问题的例子）。在人类演化中，这些能力也许比语言更早出现，渐渐一步一步地，这些能力在语言精练的过程中越来越为人所运用，好像完成了一片片的马赛克拼贴画一样。同样地，这些能力也被运用在其他精细的人类组织中，特别是在数学与音乐方面。

语言、音乐和数学三者之间有着密切的关系，他们都是在同一种认知的基础上建立起来的。

六语言的变化

语言是变化的。最早提出这个观点的是明代的陈第，他说：“盖时有古今，地有南北，字有更革，音有转移，亦势所必至。”（《毛诗古音考》）这比西方的任何哲学家都讲得早、讲得清楚。我们要真正地了解语言是个什么东西，一定要知道它为什么会变。婴儿如何学语言是我们了解语言为什么会变的关键一环，因为未来的语言就是现在婴儿学到的语言。我们发现婴儿会自觉地将他听到的语料中能够成立的规则慢慢建立起来，这是一种非常奇妙的认知能力。

世界上有几千种不同的语言。因此要真的了解语言，也不能够只看一个语言。在这方面，西方学者相对早走了几步。1786年，威廉·琼斯（William Jones）在加尔各答的亚洲学会（Asiatic Society）上发表了一篇讲话。在这篇讲话中，他说：“梵语不管多么古老，它的结构是令人惊叹的，它比希腊语更完美，比拉丁语更丰富，比二者更精练，但是与它们在动词词根方面和语法形式方面都有很显著的相似性，这不可能是偶然出现的，这种相似性如此显著，没有一个考察这三种语言的语文学家会不相信它们同出一源，这个源头或许已不复存在。”（“The Sanscrit language, whatever be its antiquity, is of a wonderful structure; more perfect than the Greek, more copious than the Latin, and more exquisitely refined than either, yet bearing to both of them a stronger affinity, both in the roots of verbs and in the forms of grammar, than could possibly have been produced by accident; so strong indeed, that no philologer could examine them all three, without believing them to have sprung from some common source, which, perhaps, no longer exists.”）这是印欧语系研究的开始，也是现代语言学的开端。

紧接着有很多人赞同这个看法，并开始做具体的研究。其中一个德国的语言学家——雅各布·格林（Jacob Grimm）——将很多日耳曼语的辅音跟印欧语的辅音作了比较和对应，得出了著名的“格林定律”（Grimm’s Law），即印欧语里送气浊辅音日耳曼语变成不送气，不送气浊辅音清化，而清的塞擦音变为了擦音，如表1。

（本图源于公众号“汉语史与汉藏语研究”）

1066年，英国同法国发生了一场大战——黑斯廷斯战役（Battle of Hastings），英国战败，被法国占领。之后几百年，英国的贵族阶层说的不是英语，而是法语。所以现在英文里面的词汇差不多有一半是从法文借过去的。也因此英语中有很多词没有遵循日耳曼语的音变规律。比如pedal（踏板）与foot（脚）是同源词，词根是ped。日耳曼语中p变为了f，d变为了t，从而产生了foot这一形式；pedal借自法文，因此辅音没有发生变化。decade（十年）与ten（十）也是一对同源词，d就相对于t。像这样的对应关系还可以找到很多。

汉语中也有类似的例子。上海话还保留了浊辅音，普通话的“头”[thəu35]上海话念作[dø24]，“抬”[thai35]上海话念作[dɛ24]，“地”[ti51]上海话念作[di24]，这是中古的[d]在普通话中变成了[t]，而上海话没有变，因此形成了规律的对应。闽语是在语音方面比较保守的一个方言。很多双唇音在其他方言中都已变成唇齿音，但闽语没有。比如“饭”字，普通话读作[fan51]，闽南话则为[pəŋ212]，“芳”[faŋ55]闽南话为[paŋ55]，“肥”[fei35]闽南话为[pui33]，普通话的[f]与闽南话的[p]相对应。

世界上所有活的语言都处在变化中。就语音里的个别特征而言，有的变，有的没变，就会形成一组组对应关系。比如广东话的y对应于普通话的r，“人”是yan，“入”是yap，“热”是yit，“肉”是yuk。不只是辅音，声调也可以形成对应。广东话的阳平为低降调21对应普通话的高升调35，所以“人”是yan21，“云”是wan21，“林”是lam21，“蓝”是laam21。

现代方言里的音节比之古汉语已经简化了很多。汉语原来有辅音串，像kl-、pl-、sl-等，后来辅音串消失，汉语就衍生出声调来增加区别度。普通话有4个声调，用五度标音法表示的话，分别是1调55，2调35，3调214，4调51。用电脑画出来就是图10a右边的4种曲线。广东话要复杂得多，有9个声调，其中3个是入声调，如图10b。

图10a 普通话的四声（W. S-Y. Wang. Feb. 1973）

图10b 广东话的九个声调（Peng &Wang，2005）

传统的归类方法将汉语声调归为平上去入四大类。这四个大类在音变的历史中有一个重要的变化，就是根据声母的清浊，各个声调又分化为阴阳两类。现在的汉语方言中，温州话就是很整齐的8个声调——阴平、阳平、阴上、阳上、阴去、阳去、阴入、阳入。图11是潘悟云先生发音的温州话8个声调的曲线图。普通话中阳上、阳去和阴去都合并为一类了，入声消失，入声字分别派入其他三个声调中。合并是音变很常见的一种现象。

图11温州话的八个声调（Wang，W. S-Y. 1996）

如果将声调的高度作为纵轴，斜度作为横轴，就可以得到如下的两张图。左图表示的是普通话的声调，右图表示的是广东话（香港）的声调。可以看到普通话的四个声调分布得比较均匀，而广东话除了阴平其他的八个声调都挤在一块儿，这就很不稳定。现在香港话变化得非常厉害，声调在合并，辅音也在消失。当有外来语言和本地语言混合之后，该地的语言变化速度就会加快。

图12 普通话和广东话的声调特征对比（Peng，G. 2006）

中古时期的汉语有6种韵尾-p，-t，-k，-m，-n，-ng，广东话还完整保存着，普通话已经丢失了4个，只剩下-n和-ng这两个韵尾了。柳宗元有一首诗《江雪》：“千山鸟飞绝，万径人踪灭。孤舟蓑笠翁，独钓寒江雪。”“绝、灭、雪”三个字押韵，虽然现在的普通话中“绝”是阳平，“灭”是去声，“雪”是上声，但在唐朝这三个字都是入声，都有一个-t韵尾。粤语、日语和韩语的材料都支持这个构拟。

（本图源于公众号“汉语史与汉藏语研究”）

在过去的几百年里西方的科学要比我们厉害得多，那是因为他们有累积性。自从Jones提出“印欧语系共同源头”的概念，Grimm找到了辅音之间的对应关系，之后又有很多语言学家将“格林定律”中的例外一个一个解释出来，比如Lachmann解释了元音的长短问题，Grassmann解释了一个字里头是否可以有连串的送气辅音，Verner研究了音的轻重、高低等问题。经过一步步的累积，现在我们对印欧语系的了解已经很深入了。

现有的汉语研究都集中在把音变找出来，对于音变之间关系的探究还远远不够。王士元（1996）认为可以把这些音变分解为一个个规律，表3中的R就是Rule的缩写，M. C.代表中古时代的拟音，Beijing指的是现在的北京话，中间的拟音来自各种汉语方言。隋唐时期的语音经过不同的音变，变成现在北京话的读音，其中有三种情形，有的是接受这个音变，有的是与这个音变无关，有的是这个音变的例外。

（本图源于公众号“汉语史与汉藏语研究”）

在Grimm，Lachmann，Grassmann，Verner之后又有两个很杰出的德国语言学家，Schleicher和Schmidt。他们对于语言中的音变有不同的看法。但这两个看法并不冲突，反而是互补的。Schleicher关注的是音变的纵向传递，即在时间上的变化，他仿照达尔文给生物画树图的方法，画了下面这张印欧语系的树图（图13）。Schmidt关注的是音变的横向传递，即在空间上的变化，并提出了著名的“波浪理论”。

图13 Schleicher的印欧语系树图（Schleicher 1876）

七语言研究的方法

20世纪语言学有一个很伟大的大师——费尔迪南·德·索绪尔（Ferdinand de Saussure）。他在博士论文《论印欧系语元音的原始系统》（Mémoire sur le système primitif des voyelles dans leslangues indoeuropéens）中，提出了一个很惊人的想法，他说，“我相信在古印欧语（Proto-Indo-European）里一定还有些元音，尽管这些元音在目前的印欧语系里已经找不到了”。比如infront和white在希腊语中为分别为anti、arges，protect在拉丁语中为pāsco，索绪尔推测远古的时候这些词的形式分别为aanti、aarges和paask-。这是一种非常有远见的系统研究，是根据语言的结构提出的假设，有着科学的根据。虽然在他提出这一假设的时候没有任何可见的语言材料作支撑，但二三十年后，在土耳其发现了一个新的语言——赫梯语（Hittite），赫梯语也属于一种印欧语系的语言，而且在这种语言中看得到索绪尔假设的那个元音。这三个词在赫梯语中的形式为ħanti、ħarkis和paħsanzi，索绪尔假设的那个元音a赫梯语都以喉音ħ的形式出现。我们做学问，研究语言，一定要大胆地假设，只要有足够的理由支持，看不到的东西反而更有趣。索绪尔开创了语言学中一个新的派别——结构学派。

图14是2004年《科学》（Science）杂志中所画的144个印欧语系语言的树形图。赫梯语就属于安那托利亚语（Anatolian）下的一个分支，是一组完全绝种的语言。很多语言用了一阵子没有人用它就绝种了，比如西夏语。西夏语还有文字，但没有人说西夏语了。土耳其的很多原来的语言现在也没有人说了。日耳曼语的东支也绝种了。绝种的语言比现在说的语言要多得多，可以参看澳大利亚语言学家Nicholas Evans写的Dying Words，这本书讨论的就是现在快要绝种的语言。

图14 源自同一个祖先的144种印欧语系语言（David Graddol. 2004）

J. H. Greenberg教授将世界上的六七千种语言归为十几个超级语族（super phylum）。非洲作为人类的起源地，它的语言情形也最复杂，有Khoisan，Niger-Kordofanian，Nilo-Saharan，Afro-Asiatic以及Austric五个超级语族的语言。Niger-Kordofanian中有一个比较大的语言叫做Swahili。一般我们熟悉的语言有词缀的时候往往是后缀，比如dog/dogs，枕/枕头，我/我们。Swahili则非常喜欢利用前缀，比如“人”在Swahili中是tu,但是“一个人”是mtu,“多数的人”是watu。Swahili将名词分为六大类，在一个句子中，跟名词邻近的一些词都得跟着名词屈折变形。比如“那个好人摔倒了”Swahili为“Mtu mzuri mmoja yule ameanguka”(加粗的都是前缀。tu是“人”，zuri是“好”,moja是“一”，le是“那个”，meanguka是“摔倒了”)。这是指单数的人，当句子主语为复数的人时，这个句子就变为“Watu wazuri wawili wale wameanguka”。这种词缀有点像量词，又有点像词类的“性”，但与它们又不完全等同。我们研究语言一定要放宽眼界，不能只盯着一种语言材料，要尽可能多地涉猎各种各样的语言。

图15 Greenberg划分的12个超级语族

研究语言不只是纵向的，也有横向的。南开大学的意西微萨阿错教授研究四川西南部的倒话，这便是一种横向的研究。“一个骑马的人来了”，倒话是“马骑人一个来了”。倒话还有很多藏语的语法在里头，它是藏语跟汉语合并的一种语言。比如“他在喝茶”，倒话是“他-ki茶喝（-tsv4-tsu4-di-jiu3-li）”，包含了一些汉语不用的成分。

各种语言之间的分化大概发生在什么时候？我们又该怎么来研究它？这当然是一个非常复杂的问题，我们现在只走了一小步。这一小步就是同源词比较，即把一个语言里面的基本词汇比较一下。为什么只挑基本词汇？因为像“手机”“电话”“电脑”等都是最近出现的东西，哪个国家发明了这些东西，这个词往往就会被其他语言直接借去。每个语言里头都有很多借词，这些借词不能拿来证明这个语言的历史。但是像“手”“头”“水”“山”“树”等基本词汇，就不大容易借来借去。从表4中我们可以看到，北京和苏州的基本词汇，73%是一样的，广州和北京，74%是一样的，苏州、长沙和南昌，相同的比例更高。因此我们可以用统计的方法给这些语言及其分支画树图。图16是我在1998年画的一棵汉藏语系的谱系树。跟印欧语系比起来，汉藏语系的历史要稍微短一点。印欧语系大概是七八千年的历史，汉藏语大概是六千年的历史。

（本图源于公众号“汉语史与汉藏语研究”）

图16汉藏语谱系树（Wang，W. S-Y. 1998）

八结语

人是有语言的动物，这是我们之所以能成为人类，而区别于其他动物的最主要的原因。苏东坡有句名句，“识庐山真面目，只缘身在此山中”，实际上，语言对我们而言也是一座山，我们一辈子都在跟语言打交道，都住在语言这座山里。在此我想说，“不识语言真面目，只缘身在言语中”。也许我们根本就不可能彻底了解语言的真面目，自始至终走不出语言这座山，这是研究语言最大的挑战，但这也正是语言研究的乐趣所在。

语言学是一门非常活跃的学问，语言的研究涉及到如语言学、人类学、民族学、社会学、考古学、心理学、生物学、神经学、遗传学、统计学、计算机学等等多方面的学科，21世纪语言学的进一步发展，是用跨学科宏观的眼光来了解语言，分析、探讨语言的真实面貌，并研究语言的生物基础及社会关系。

中国语言学从荀子开始有辉煌的传统以及得天独厚的材料，我们希望中国的语言学能在21世纪做出众多世界级的突破，充分发辉自己的光彩。

后记：2016年4月25-26日，王士元先生应张玉来教授之邀，莅临南京大学，为文学院老师和学生做了“语言与演化”“语言与大脑”两场演讲。本文是根据这两场演讲的内容，略加删改，整理而成，最后经王先生审定。

中国学者首次证实：我们的母语起源于中国北方

著名的人面鱼纹彩陶盆，它是仰韶文化的重要文物证据。图片来源：维基百科

语言不仅是日常交流的工具，更是文化传承最悠远的载体。语言的分裂和融合背后往往伴随着群体的迁移与交汇，所以近十几年来，科研人员开始将演化研究方法应用于语言学，探索不同语言之间的演化关系。但是汉语从何处来？又是怎样演化的？一直以来在语言学界充满着各种假设和争论。复旦大学金力教授研究团队对汉藏语言中同源词汇进行分析，利用统计学分析方法，结合遗传学、语言学、考古学等证据，首次确认了包含汉语在内的汉藏语系起源于大约4000-6000年前的中国北方黄河流域。而汉语是最早从汉藏语系中的分化的语族，这一时间可以追溯到大约5900年前。认为汉语与藏缅语族在 5900 年前左右出现分化，大约相当于仰韶文化晚期、马家窑文化早期，为汉藏语系的“北方起源假说”提供了有力支持。

汉藏语系

所有具有同一起源的语言构成一个语系。汉藏语系包含逾 400 种语言和方言，如汉语、缅甸语和藏语等，总使用人数达 15 亿左右，是仅次于印欧语系的第二大语系。语系下一级的分类单位是语族，汉藏语系又分为汉语语族和藏缅语族。

世界主要语系分布图，其中浅绿色为印欧语系，红色为汉藏语系。图片来源：Wikipedia

南北起源之争

汉藏语系是语言学家按照谱系分类法划分的一组语群，按照使用人数计算，是仅次于印欧语系的第二大语系，它包含超过400种语言和方言，总使用人数达到15亿左右，汉语、藏语、缅甸语都属于该语系。

汉藏语系的分支（图片来源：STEDT/UC Berkeley）

对汉藏语系从何处何时起源，之后又是如何演化进行研究，一方面可以深入了解不同语言之间的关系，以及它们之间的相互作用；另一方面，由于史前的语言发展与人类活动息息相关，了解语言的演化过程对于回答欧亚大陆东部人口迁徙等问题也至关重要。

此前，对于汉藏语系起源于何时何地，语言学家们一直存在争议。一种假说认为，它起源于大约4000-6000年前的中国北方黄河流域，研究人员认为来自黄河流域上游和中游地区的人们说的是汉藏语系的祖先语言，在4000-6000年前，一部分人向西迁徙到了西藏，向南迁徙到了缅甸，他们成为使用藏缅语言的祖先；另外一部分人向东、向南迁移，最终成为说汉语的汉人。这种观点被称为“北方起源假说”，大多数历史语言学家倾向于这一假说，并认为汉藏语系的扩张与新石器时期的仰韶文化和马家窑文化的发展有着密切的联系。

另外一种被称为“西南起源假说”的观点认为，汉藏语系起源于至少9000年前的西南部地区，主要包括现在的中国四川西南部、云南以及印度东北部一带。这种假说进而又分为两种假设，一种认为说汉藏语言的人群起源于13500年前的四川西南部，在大概9000年前分化为两支：一组人群前往印度东北部，另外一组人群向北前往黄河盆地地区，后一群人被认为是当代中国人的前身。另外一个假设认为汉藏语言起源于大约9000年前的印度东北部。

证实北方起源假说

此次，上海复旦大学教授金力及同事对109种汉藏语系语言词汇中词语的字根意义进行了统计学分析，结果与“北方起源假设”一致，同时研究人员得出的结果与遗传学、考古学、人类学等学科收集的证据能够相互验证。

研究人员认为，汉藏语系的分化主要与中国北方的两种新石器时代文化有关。汉藏语系分化为汉语言首次出现于约5900年前，发生在新石器时代仰韶文化时期，而藏缅语的分化大约出现于4700年前，发生在马家窑文化中期。同时，藏缅语言的分化时间与来自Y染色体的遗传证据一致。2000年，美国得克萨斯大学休斯顿分校的研究人员，在分析了汉藏语言人群的Y基因组之后，认为在一万年前的黄河中上游地区生活的古代人群，发展了东亚最早的新石器时代文化，他们是现代汉藏人口的祖先。

仰韶文化与马家窑文化的范围（图片来源：Nature）

考古学证据表明，汉藏语言的分化与两种新石器时代文化发展之间的关系，可能归因于人口的快速增长以及农业的发展。黄河流域的大量考古遗址以及森林砍伐情况表明，在大概6000年前这一地区出现了人口的快速增长，这一情况在5000-4500年前加剧。

此外，研究人员认为，汉藏语言的传播可能与小米农业自6000年前起的地理分布有关。小米（又称粟）农业的发展主要出现在的中国北方，特别是黄河流域，之后并向西部、南部，沿着青藏高原边缘传播。

此次研究的作者之一、复旦大学生命科学学院人类学博士后张梦翰表示，在史前，语言的分化和传播都是依赖于人的活动来进行。所以能够看到在史前，语言的分化或多或少也能反应那些群体或者说这些语言的先民的活动情况。

语言学家、上海师范大学教授潘悟云在接受采访时表示，在东亚地区，很早就有人类活动，他们向北迁移，在黄河中下游形成汉藏语系的祖先。这些祖先一部分向东南迁移，到达中原地区，形成汉语。第二部分向西南迁移，主要就是藏民。此后，由于气候和北方长期战乱的原因，汉族的分布、迁徙大部分是从北向南，“我们的语言反应出来的大体上也是这个情况。”潘悟云说。

解决人类重大问题的钥匙

本次研究对 109 种汉藏语系语言词汇中词语的字根意义进行了贝叶斯系统发生学分析（Bayesian phylogenetic analysis）。系统发生学早已被广泛应用于研究生物之间的演化关系，近几年学界开始将它应用于语言学研究。

在演化研究中，系统发生学根据化石、形态学、基因方面的证据对物种进行分类，并确定物种之间在演化上的关联。如果两个物种具备相似的特征，例如相似的 DNA 片段，那么它们在演化上的关系就比较接近。通过对多个物种进行交叉对比，就可以构建出系统发生树，它就像族谱一样，显示出一个个物种在哪一时刻从共同祖先中分化出来，以及它们的共同祖先之间又有怎样的关联。

论文第一作者、复旦大学现代语言学研究院青年研究员张梦翰介绍：“系统发生学方法的两个前提符合我们对语言演化的认识：允许不同语言在历史演化过程中拥有各自不同的演化速度；允许不同词汇拥有属于各自不同的演化速度。”这些性质允许模型具备更高的灵活性，并且它也更符合我们对语言的认识。

在语言学研究中，潘悟云教授介绍：“同源语素就相当于语言中的基因。”同源语素的认定是鉴定语言关系的关键，例如，表示太阳的“日”在汉语、古汉语和藏语中有相似的发音，那么它就是一个同源语素，是体现这些语言之间关联的一个证据。类似这样的词汇还有太阳月亮、身体部位、亲属关系等。同源语素的认定是对语言应用系统发生学分析的前提，本次研究使用的数据就来自于先前语言学界的相关研究工作。

将生物学方法用于语言演化研究是近些年兴起的一个热门研究方向，在德国的马克斯-普朗克研究所、新西兰奥克兰大学都有相关研究。但先前研究主要针对印欧语系进行，对汉藏语系的研究历史更短，因此复旦大学的这项研究工作在这个方向上具有开创性的意义。

潘悟云评论：“本课题用贝叶斯系统发生学方法取代传统的语言年代学方法，才使得语言年代的确定从猜想走向实证，以此明确提出，汉语的历史为 5900 年。这是现代科学技术对语言学的贡献。

同刊发布的评论文章中，新加坡南洋理工大学教授Randy J. LaPolla表示，这一研究成功在很多方面具有重要意义。他认为，对汉藏语系的研究历史远没有印欧语系时间长，因此，关于汉藏语系很多基础性的关键点一直以来并不确定，比如汉藏语系的起源问题。“此次研究，作者加深了人们对汉藏语系基础性问题的认识，这可以让其余学者在此基础上更深入地探索这一语言家族地历史，”Randy J. LaPolla写道，“除此之外，这项研究还有助于其他学科的研究，比如考古学及历史学。”

语群与人群

这次研究独立验证了先前的考古学、遗传学研究工作，研究结论符合语言随农业扩散的观点，而且扩散的时间点与考古证据相符，例如此前的考古证据显示，一些特定的建筑形式和陶器类型有向南扩散的特征。

语言的变迁和人群的活动之间具有密切的联系。研究第一作者张梦翰说：“群体的一些活动，比如分化和混合，可以造成语言的分化和混合；而语言的分化和混合又可以反映不同语言群体各自文化的一些变化。所以对我们来说，语言是架起群体演化和文化演化的一个非常好的桥梁。”

汉语中包含的 14 种方言。图片来源：https://www.ethnologue.com/subgroups/sino-tibetan

不过，潘悟云强调，本课题仅针对汉语和藏缅语族之间的关系，对藏缅语族下属各个语支之间关系的描述还有很多不完善的地方，这是由于材料的缺乏和同源词认定的不当。或许随着未来相关研究的发展，在有了确凿的证据后，这些问题将得到更好的解答。

此外，语言的分化和人群的分化不一定是完全同步的。张梦翰说：“基于我们所知的，我们认为语言分化和群体迁移或者分化之间应该是存在一定的时间差。严格来讲，谁在前，谁在后要基于特定的语言情况来定；一般来说群体迁移和分化在语言分化之前，但是我们不能排除例外。”

“整个东亚地区语言非常复杂，这个研究仅仅是一个开始，”张梦翰说。

参考链接：

https://www.nature.com/articles/s41586-019-1153-z

https://www.nature.com/articles/d41586-019-01214-6

https://www.ncbi.nlm.nih.gov/pubmed/11153912

http://mp.weixin.qq.com/s?__biz=MzI5NDQxNzM5Mw==&mid=2247726892&idx=3&sn=e40d4db2a54a98a43e36992f20eb9f08

行政区

全国34省级【4直辖市23省5自治区2特别行政区】333地级【293地级市7地区30州3盟】2843县级【977市辖区394县级市1418(自治)县52(自治)旗2林(特)区】38741镇级。共687城市。2022.5