访谈 | 沈家煊:语言学家应该拥抱人工智能

文摘   2024-11-20 12:28   甘肃  

日前,四川日报全媒体“文化传承发展百人谈”大型人文融媒报道记者专访中国社会科学院学部委员、著名语言学家沈家煊,听他讲述汉语语言研究的故事,探讨汉语之于世界的意义。

川观新闻记者对话沈家煊(左)

访谈视频节选

对话
语言学是人文科学也是自然科学


语言学是一门既古老又现代的科学


记者:首先还是请您科普一下,语言学是一门怎样的学问?


沈家煊:语言学研究的是语言的本质本性,研究什么是人类的语言。作为中国的语言学家,当然首先要研究汉语,研究它的现状和历史,也离不开研究汉字。


语言学是一门既古老又现代的科学,我们的祖先几千年来对语言的关注和研究从没有中断过,随着现代科技的发展,语言也在不断变化和发展。现在对语言的研究手段也越来越丰富了,通过实验来研究已经是很普遍的现象。


而且,语言学的一大特点是人文科学和自然科学相结合。它首先是有人文性的,比如你现在到北大中文系去学习语言学,都要学传统的文字学、音韵学、训诂学,研究各地的方言有什么区别和联系,汉语的演变历史等。在语言学家看来,语言学也是一门自然科学,我们很早就开始借助科技手段研究语言,例如机器翻译、语音合成、文语转换。我们和中国科学院声学研究所合作,跟科大讯飞合作,对汉语的语音做实验研究,把一段汉语文字转换成语音时,怎么让它听上去像是人在说话,而不是机器在说话,其中都有语言学的贡献。


中国传统语言学研究在清代发展到顶峰,被称作“小学”,包括文字学、音韵学、训诂学、修辞学等。但唯独没有语法学,语法学这门学问确实是舶来品。1898年,马建忠写了《马氏文通》,是中国第一部汉语语法书。


为什么要写这本书呢?当时甲午战败,一些先进的知识分子觉得,中国的落后可能也跟文化落后有关,其中包括语言学的研究。一看人家有语法学,我们怎么没有语法学?所以这才开始有了汉语语法的研究,这个研究的框架是从西方借来的,具体说是从印欧语学来的。


套住汉语这个“大熊猫”

需要一个更大的竹圈


记者:印欧语的语法体系跟汉语的研究适配吗?


沈家煊:印欧语(Indo-European languages)是18世纪英国人威廉·琼斯提出的语言学概念,即认为印度和欧洲的大部分语言都是从“原始印欧语”分化出来的,这些语言彼此之间具有亲属关系和相似性。印欧语系包含了400多种语言,按照母语人口来排名,是世界上第一大语系,占世界人口的41.8%。100多年来,我们就是把印欧语的语法框架、语法体系套用到汉语上来研究的。这套体系讲得简单一点,就是主谓结构,主语谓语加上宾语、定语、状语。还有一套词类体系,就是名词、动词、形容词、副词等,基本上是这么一个框架。用这个框架来研究汉语也取得了很多成绩,因为人类的语言有很多基本规律是相通的。


但总的来说,从很多前辈开始就已经认识到问题所在,就像启功先生说的,好像小孩子的套圈游戏,用一个小竹圈,你只能套住一只小耗子,要套一只大熊猫就套不住了,拿印欧语这个框架来套汉语,就是这个情况。后来到上世纪80年代,吕叔湘先生也说,汉语的语法研究要“大破特破”,要把词、主语谓语这一套术语先暂且抛弃。也许以后还要把这套名称捡起来,但是这一抛一捡之后,我们对这些术语的理解就会跟以前大不相同。


我们要从根本上反思印欧语的语法体系运用到汉语上存在的问题,这样才能够真正揭示出汉语的组织运行之法。语法无非就是语言的组织运行之法,中国过去没有语法学,不等于它没有组织运行之法。


记者:印欧语的“圈圈”套不住汉语,能举个例子吗?


沈家煊:例如名词和动词这一对范畴,是语法里最基本的一对范畴。拿英语来说,在英语里名词和动词是两个不同的范畴,名词是名词,动词是动词,它们的形态标记就是不一样的。比如说“死”,名词是“death”,动词是“die”。又例如“爆炸”,名词是“explosion”,动词是“explode”,是不一样的。在使用中,名词做主语或宾语,动词做谓语,如果要用动词做主语或宾语的话,就要把它“名词化”。


汉语的情况就不一样。汉语的名词和动词没有形态标记区分,同样一个“死”字,可以是名词也可以是动词,所有的动词都可以自由地做主语和宾语。比如“我不怕死”,“死”做“怕”的宾语;“死不可怕”,“死”又是主语。


既然汉语所有的动词都可以做主语、宾语,那就谈不上“名词化”这一说。过去北大的朱德熙先生就很尖锐地指出,“名词化”这完全是理论上的多此一举。100多年来限于印欧语的体系框架,认为名词和动词分为两个类是天经地义的,但这种观点实际上是可以打破的。


我们可以把汉语的动词看作是名词的一个次类,它包含在名词里面,只不过是一种动态名词,是指称动作的名词。名词和动词这对基本的范畴,可以是分立的关系,也可以是包含的关系。在理论上有突破以后,很多问题就能迎刃而解。


我之前写过文章,分析中国学生学习英语的时候出现各种类型的偏误原因,其中一个主要原因就是汉语里名词和动词是包含关系,我们用这种方式来说英语,就造成大量的偏误。外语界研究英语教学把这种情况叫作“母语的负迁移”。


语言学家应该拥抱人工智能


记者:说到语言学习,您怎么看当下流行的网络语言?


沈家煊:其实网络语言也很好地体现了汉语的特点。网络语言非常简洁,比如说一个“亲”字,含义就很丰富;又非常灵活,比如“尴尬”这个词,我们原来觉得它是一个联绵词,是不可以拆分的,但在网络语言里拆分的说法很多,比如“他就尬在那儿了”,“尬聊”“尬舞”,什么都有。这体现汉语的一个特点就是,以字为基本单位,而不是以词为基本单位。


有人认为汉语虽然很简洁,但很多事情都说不明确,会影响交际,我认为这至少不完全对。最近网上引起热议的一件事,一个外国女生失恋了在网上发帖,很多中国网友用中式英语安慰她,说“you pretty,he ugly;you swan,he frog”(你美,他丑;你天鹅,他青蛙,意为:癞蛤蟆想吃天鹅肉),完全是中式表达,很简洁,但外国人看了居然也能领会其中的意思,而且十分感兴趣。还有“不作不死”,翻译成英文“no zuo no die”后,好像已经被美国的词典收录进去了。


语言哲学家格莱斯(H.P.Grice)提出的会话合作原则,其中有一条人人遵循的“适量准则”,就是说话的时候,一方面信息要足量,另一方面是不要过量,不要说得过多,你要相信人依靠常识或者背景知识,也能够理解你简洁的话。说话时提供的信息不要过量,这就是汉语特别注重的方面,很多时候依靠上下文,依靠背景知识,依靠说话的场合来理解。


对于网络语言,我认为总的来说要具体现象具体分析,现在有的人对乱改乱造成语很反感,确实有许多改动或创造的四字语效果不好,我觉得像“喜大普奔”这种就有点过头,但有的东西改得还真好,例如电熨斗的广告词“百衣百顺”。


记者:那么您又如何看待人工智能呢?


沈家煊:最近ChatGPT是一个热门的话题。总的来说,我认为语言学家应该拥抱人工智能。我看到有一些语言学家一味给ChatGPT挑毛病,讲来讲去意思无非就是机器还是人造的,还是人最聪明,机器不如人。但事实上人工智能的表现在很多方面已经超过人类,例如围棋。ChatGPT对人说的话至少字通句顺,条理分明,而人说话颠三倒四的情形还少见吗?


我觉得现在最没有资格给人工智能挑毛病的恰恰是一些主流的语言学家。主流的语言学家信奉和采用的是“符号加规则”的理论和方法,符号就是名词、动词、形容词、主语、谓语、宾语这一套,规则就是“句子=名词短语+动词短语”“动词短语=动词+宾语”这样的造句造语的规则。近一个世纪以来,语言学理论中占据主导地位的就是美国语言学家诺姆·乔姆斯基(Noam Chomsky)主张的生成语言学理论,这套理论就是基于“符号加规则”,认为用这套理论和方法就可以生成所有语言中合乎语法的句子。


但是ChatGPT的成功,它的运作原理完全不是这样的,简单地说就是利用大数据和计算能力“预测”下一个词,比如说“我去吃饭”这句话,先说出“我”这个字,然后通过计算预测接下来那个词最大的概率是什么,还可以微调预测结果。这个过程中没有“符号加规则”这套东西,处理的不是符号,而是一个个实在的词。


在我看来,ChatGPT这种预测下一个词的做法,其实跟汉语的运行很相似。例如“老骥伏枥”这句话,用“符号+规则”来分析是这样的,“老”是形容词,“骥”是名词,“形容词+名词”构成名词短语做主语,“伏”是动词,“枥”又是名词做“伏”的宾语,“动词+宾语”构成动词短语做句子的谓语,符号加规则就是这样。


但是曹操一千八百多年前说出“老骥伏枥”时,是没有也不需要这套东西的。我曾经说汉语是一种动画型的语言,动画是怎么制作的?一帧一帧画面链接起来对吧,链接起来就动起来了。汉语也是这样的,有了“老”预测“骥”,老者骥也,然后又从“骥”预测“伏”,骥者伏也,伏者枥也,这样一步一步串联起来,这就是汉语的构造方式,跟人工智能的语言生成方式很像。


传承发展中华文化

应在比较中寻求普遍意义


记者:从语言学的角度,您认为应该如何传承发展好中华文化?


沈家煊:继承和发展,我认为不可偏废。传统的、优秀的东西我们要继承,但假如没有发展的话,也就谈不上继承,继承和发展是一对,是不能够分割开的。我认为新时代我们研究语言学的任务,就是要用现代语言学的眼光,包括我们已经了解吸收的国外语言学理论中的一些好的、先进的东西,来对中国传统中有价值的观点,重新加以阐发。


作为中国人研究人类语言,当然要挖掘汉语的特点,要继承几千年来我们研究汉语言文字所获得的成果,这是毋庸置疑的。但还有很重要的一点,就是要把汉语放在世界语言变异的范围内来考察,因为你只从汉语看汉语,是看不清汉语的。只有在深入的比较中,我们才能做出一个既具有汉语特色,又具有普遍意义的语法理论。而不是光讲汉语特点,没有普遍价值。最近这一百年来,在语法上我们都是从印欧语特别是英语出发看汉语。但我们现在反过来,我写过好几篇文章,讲如何从汉语出发看英语。我发现汉语的表层表达方式其实跟英语的底层构造方式是相通的。我举个例子,“我们先读《论语》《孟子》”这句话,从英语的角度看,这句话里“我们”是主语,“先读《论语》《孟子》”是谓语,“读”是动词,“《论语》《孟子》”是宾语,“先”是副词修饰动词,完全按英语这一套来分析就是这样的。但是从汉语的角度,还可以这样分析,“我们先读”是主语,“《论语》《孟子》”是谓语,主语和谓语的字数相等,这是中国传统的句读法,口语中甚至还可以“我们先读《论语》”是主语,后面再追加一个“《孟子》”作补充。


由此可见,汉语中的主谓结构是可以有很多种切分方式的,而英语主谓结构的切分方式可以看作是“中式主谓结构”的一个特例。从这个角度看,汉语语法体系的普遍意义就显现出来了。所以我们现在做的,我把它叫作“大语法”,构建了一个新的汉语语法体系大纲,就好像套圈游戏要有一个大竹圈一样,把汉语这只“大熊猫”给套住。寻求汉语“大语法”的普遍意义,这一点我觉得在传承发展中华文化的时候也很重要。


来源:四川日报



往期推荐:

访谈 | 张斌:学习是终身的事情
考博 | 南京师范大学2025年语言学类博士研究生招生导师及方向
书讯 |《现代汉语意外的情理评价研究》出版
讲座 | 语言学线上讲座11场
会议 | 第十三届现代汉语语法国际研讨会征稿启事
考博 | 山东大学2025年博士研究生招生专业目录(语言学)
刊讯 |《云南师范大学学报》(对外汉语教学与研究版) 2024年第5期

现代语言学
专注于语言学学术信息分享
 最新文章