语言与思维的可分性和图灵测试的局限性
丨袁毓林
我们首先介绍关于语言与思维关系的同一性假设及其反对意见,然后介绍乔姆斯基关于“语言的主要功用是思考而不是交际”学说并提出质疑,接着通过介绍巴赫金的“对话”与“多声性”理论来说明思考与交际并不截然分开,最后介绍图灵测试所隐含的语言与思维等同假设和有关人工智能学者的批评意见。
本文收录于《ChatGPT来了——语言科学如何看待ChatGPT》(杨旭 / 罗仁地主编;上海教育出版社,2024年)
可见,乔氏认为语言的内在性使用就是思考(内在思维)。那么,言下之意是不是说:思考必须在内在语言的基础上进行呢?另外,他刻意把寒暄之类的情感交流排除在交流(或沟通)之外,似乎只有传递信息之类的有意义的沟通才算是交流。于是,得出结论:语言的典型功能是思考而不是交流。其实,思考跟交流并不一定能够截然分开。因为,所谓的“内心思考”往往是一个“内心对话、自我争辩、设问拟答、自问自答”式的交谈过程。例如:
首先,我们要晓得,学问有两个部分,一个是“学”,一个是“问”。这个问题两千多年前孔子就说:“学而不思则罔,思而不学则殆”。思考其实就是问,思考与问问题差不了太远,要问就必须思考,思考就会提出问题,这是分不开的。(丘成桐(2022)《学“问”》,数理人文,2022-10-12;https://mp.weixin.qq.com/s/y3drCKaZh0tHLltit_hRPw)
提问质量决定我们的生活质量。为什么会这样呢?因为我们一直都处于一个自我对话的场景中。我们的大脑不断地抛出问题,然后自己回答问题。(德国顶级理财大师博多·费舍尔《财务自由之路》;正和岛,2022-09-29;https://mp.weixin.qq.com/s/P2KMeBM0wr7Gc_sQhtQaKQ。)
当然这些都是非语言学专业的成功人士的直觉性的认识。其实,关于语言与思维的关系,还是Pinker (2002)说得通透:
感知和分类提供了使我们与现实发生联系的概念。而语言使概念与词语联系起来,使我们联系现实的渠道得以扩展。……语言就是一个渠道,通过它人们可以互相交流思想和意图,并由此掌握周围的知识、习俗和价值观。……除了作为一种交流媒介,语言还可以作为大脑储存和处理信息的载体。……语言起到的是作为中央系统的子系统的功能,而非所有思维的媒介。(中译本,第246-7页)
诸如上述丘成桐先生“思考就是提问”的直觉是极具洞察力的。上升到理论层面,就有了巴赫金(1988/)的“对话”与“多声性”理论:
语言只能存在于使用者之间的对话交际之中。对话交际才是语言的生命真正所在之处。语言的整个生命,不论在哪一个运用领域里(日常生活、公事交往、科学、文艺等等),无不渗透着对话关系。……这种对话关系存在于话语领域之中,因为话语就其本质来说便具有对话的性质。(中译本,第252页)
我们生活中的实际语言,充满了他人的话。有的话,我们把它完全同自己的语言融合到一起,已经忘记是出自谁口了。有的话,我们认为有权威性,拿来补充自己语言的不足。最后还有一种他人语言,我们要附加给它我们的意图——不同的或敌对的意图。(中译本,第268页)
[陀思妥耶夫斯基的小说]在主人公的自我意识中,渗入了他人对他的认识;在主人公的自我表述中,嵌入了他人议论他的话。他人意识和他人语言引出了一些特殊的现象,这些特殊现象一方面决定了自我意识的主题发展、他的沮丧、争辩、反抗;另一方面又决定了主人公语言中的语气断续、句法的破碎、种种重复和解释,还有冗赘。(中译本,第287页)
在陀思妥耶夫斯基后期作品中,主人公所有重要的自我表述,也都可以扩展为对话,因为它们好像都是两种对语融合的产物。但是不同声音的交锋却隐藏得很深,渗透到语言和思想的精微之处。……这仍是两种意识、两种观点、两种评价在一个意识和语言的每一成分中的交锋和交错,亦即不同声音在每一内在因素中的交锋。(中译本,第288-9页)
可见,巴赫金在相当程度上把对话与思想等量齐观,看作是人类最基本的一种生存方式;于是,一个人的“言谈”往往就是其某种意识与观点的表达。但是,这种表达不是一种固定不变的思想立场,而是一个发展与开放的过程,是在跟潜在对手的对话与交锋中实现的;并且,跟其他“言谈”一起构建了话语的公共空间,各种不同的声音借此汇聚成一个充满张力的“多声性”的复合体。这也为欧洲的互文本性(intertextuality)理论开辟了道路。
虽然在语言运用上内部的思考与外部的交流是密切相连、不可彻底分割的。但是,这并不意味着语言与思维具有同一性。要正确地认识到这一点也并不容易。比如,Turing (1950)认为“机器会思考吗?”这个问题是无法回答的,倒是可代之以“我们能否区分回答问题的是机器还是人类?”,即通过会话能力来测试机器是否具有人类一样的智能。这就是著名的“图灵测试”(Turing Test)。可见,图灵测试隐含的假设是:语言代表了人类智慧的顶峰,能够进行对话的机器一定是智能的。其实,智力远不止于语言。当前自然语言处理等人工智能系统所犯的许多错误(比如,聊天机器人的答非所问),说明了这种系统在语义、因果推理和常识方面的根本缺乏(详见Zador, et al.,2022)。
Browning and LeCun (2022)直截了当地否认了图灵测试的有效性。他们的论证逻辑大致如下:图灵测试的基础是,如果一台机器说出它要说的一切,就意味着它知道自己在说什么;因为,知道正确的句子以及何时使用这些句子会耗尽它们的知识。但是,这两位人工智能专家认为:机器可以谈论任何事情,这并不意味着它理解自己在说什么。因为,语言并不会穷尽知识;相反,语言只是一种高度具体且非常有限的知识表征。另外还有一些非语言的表征方式,它们可以用一种更易于理解的方式来传达信息。比如,象征性的知识,包括图像、录音、图表和地图等等。在人文学科之外,能够谈论某事往往只停留在表面,还是让事情顺利运转起来的技能更有用、更重要。放弃“所有知识都是语言知识”的错误观点,可以让我们意识到有多少知识是非语言知识。书籍中记载了许多我们可以使用的信息,说明书、论文图表、城市地图也有同样的用处。除了文字体现出的信息,自然特征、人造产品、动物和人类的心理、生理特点都充满了可以被人类利用的信息。这说明在语言之外,这个世界本身就向人类展示了大量的信息,可供人类探索并使用。人类有了深刻的非语言理解,才使得语言有用武之地。正是因为我们对世界有深刻的理解,所以我们可以很快地理解别人在谈论什么。也就是说,语言只承载了人类知识的一小部分,大部分人类知识和所有动物的知识都是非语言的(非象征符号性的)。因此,大型语言模型(large language model, LLD)无法接近人类水平的智能。
可见,在人工智能这种技术背景上思考语言与思维的关系,不仅具有理论意义,而且具有实际的指引人工智能发展方向的应用价值。
袁毓林,澳门大学中国语言文学系主任、讲座教授,研究兴趣为理论语言学和汉语语言学,特别是在句法、语义学、语用学方面,以及计算语言学与汉语语言处理。
转载于“摩登语言学”公众号
来源:《语言战略研究》2023年第4期
推荐阅读