多人谈 | 袁毓林:这是语言统计技术的胜利,也是语言天生理论的失败

文摘   2024-11-15 08:03   中国澳门  

2024年第6期


“辛顿·乔姆斯基·语言学发展”

多人谈

[编者按]2024年4月8日,有“人工智能教父”之称的杰弗里·辛顿(Geoffrey E. Hinton)在都柏林大学接受尤利西斯奖章的获奖感言里,对乔姆斯基提出了毫不客气的批评:“语言学家被一个名叫乔姆斯基的人误导了好几代……他有一个偏执古怪的理论,即语言不是学会的。他成功地说服很多人相信这一点。但这一看就知道纯粹是胡言乱语。语言显然是学会的。大型神经网络学习语言,不需要任何先天结构,只是从随机权重和大量数据开始。乔姆斯基却仍然在说,但这并非真正的语言,这不算数,这是不对的。许多统计学家和认知科学家也说,永远不可能在这样一个大网络里学习语言。乔姆斯基从来没有提出任何一种有关语义的理论。他的理论全是关于句法的。”这篇发言引起了中国语言学界的关注,陈国华教授把它译为中文,以《杰弗里·辛顿接受尤利西斯奖章时发表的获奖感言》为题,发表在《当代语言学》2024年第4期上。10月8日,霍普菲尔德(John J. Hopfield)和辛顿以“通过人工神经网络实现机器学习的基础性发现和发明”获得诺贝尔物理学奖后,关于大语言模型和语言学发展、辛顿和乔姆斯基的话题再度爆火。

一位人工智能大家,获得了诺贝尔物理学奖;他批评了一位美国的著名语言学家,却引发了中国语言学者的热烈讨论,反思中国语言学的问题。这形成了一个奇妙的蝴蝶效应。我刊随即与《当代语言学》编辑部筹划,联合举办“大语言模型与语言学发展座谈会”。10月17日,座谈会在商务印书馆召开,线上线下学者各陈己见。我刊特就此设多人谈栏目与学界共享。


本期嘉宾

袁毓林

澳门大学人文学院中国语言文学系




这是语言统计技术的胜利,也是语言天生理论的失败

语言学素来跟诺贝尔奖没有瓜葛。今年的诺贝尔物理学奖授予人工智能专家霍普菲尔德和辛顿的消息甫一传出,不仅众多网友一脸懵:“凭人工智能的成绩怎么拿物理学奖呢?”而且,在貌似无关的语言学界也掀起不小的风波。虽然从瑞典皇家科学院的授奖理由“表彰他们通过人工神经网络实现机器学习的基础性发现和发明”上,看不出这跟语言学有一丁半点儿的关系;但是,敏锐的语言学家从诺奖官网对辛顿的采访中,再次听到了他批评乔姆斯基的声音:“大语言模型比很多人想象的更接近于真正的理解,乔姆斯基对语言大模型的理解能力的判断是错误的,大模型的成功驳斥了语言学家的理论”,云云。

其实,从2022年底ChatGPT爆火带动人工智能进入大众视野以来,被誉为“深度学习之父”乃至“人工智能教父”的辛顿,已经多次在讲演中直言不讳地批评乔姆斯基的语言观。比如,他在《数字智能会取代生物智能吗?》(2024年2月19日,牛津大学)中说:“乔姆斯基曾说语言是天赋而非学会的,这很荒谬。……一个没有先天知识的大型神经网络仅仅通过观察数据就能实际学习语言的语法和语义,……”。的确,辛顿领导他的团队成功地把误差反向传播算法引入多层神经网络训练,开启了深度学习的爆发式进步,为大语言模型理解和生成自然语言奠定了坚实的基础。这次辛顿的获奖,表明了国际权威学术机构对他在人工智能领域的杰出贡献的认可。从自然语言处理的角度,也许可以说:这是基于大规模语料统计的语言技术的胜利,也是乔姆斯基语言天生理论的失败。因为,根据语言天赋论及与其相应的普遍语法理论,人类语言是受到十分繁复和抽象的规则(原则与参数)控制的,无法用马尔可夫过程模型来刻画,也是机器无法通过统计分析来学会的。但是,现代大型语言模型却以“再造人类语言”的方式,能够以接近于人类的水平来理解和生成自然语言。这种活生生的事实,使得辛顿有底气在尤利西斯奖章颁发仪式(2024年春,都柏林大学学院)上说,乔姆斯基误导了几代人。无独有偶,一位早年跟乔氏有过交集的国际知名语言学家,2023年末访问澳门大学,在谈到乔姆斯基语言学理论和大语言模型时,也语重心长地对我说:“他把语言学的方向带偏了。”话少意多,发人深省。

怀着对于学术研究的敬畏心(不误入歧途)和对于年轻学子的责任心(不误人子弟),趁着大语言模型成为诺奖主角的东风,认真思考和讨论下列问题不仅应景而且必要:


(1)基于统计的语言大模型的成功,能不能颠覆语言天生理论及普遍语法理论?

(2)乔姆斯基生成语法理论及有关主张与研究范式,有没有把语言学的方向带偏?


该文发表于《语言战略研究》2024年第6期,引用请以期刊版为准,转发请注明来源。

编排:韩   畅

审稿:王   飙 余桂林


 

镜海语言学
澳门大学语言学研究中心官方公众号
 最新文章