多人谈 | 袁毓林：这是语言统计技术的胜利，也是语言天生理论的失败

文摘 2024-11-15 08:03 中国澳门

2024年第6期

“辛顿·乔姆斯基·语言学发展”

多人谈

［编者按］2024年4月8日，有“人工智能教父”之称的杰弗里·辛顿（Geoffrey E. Hinton）在都柏林大学接受尤利西斯奖章的获奖感言里，对乔姆斯基提出了毫不客气的批评：“语言学家被一个名叫乔姆斯基的人误导了好几代……他有一个偏执古怪的理论，即语言不是学会的。他成功地说服很多人相信这一点。但这一看就知道纯粹是胡言乱语。语言显然是学会的。大型神经网络学习语言，不需要任何先天结构，只是从随机权重和大量数据开始。乔姆斯基却仍然在说，但这并非真正的语言，这不算数，这是不对的。许多统计学家和认知科学家也说，永远不可能在这样一个大网络里学习语言。乔姆斯基从来没有提出任何一种有关语义的理论。他的理论全是关于句法的。”这篇发言引起了中国语言学界的关注，陈国华教授把它译为中文，以《杰弗里·辛顿接受尤利西斯奖章时发表的获奖感言》为题，发表在《当代语言学》2024年第4期上。10月8日，霍普菲尔德（John J. Hopfield）和辛顿以“通过人工神经网络实现机器学习的基础性发现和发明”获得诺贝尔物理学奖后，关于大语言模型和语言学发展、辛顿和乔姆斯基的话题再度爆火。

一位人工智能大家，获得了诺贝尔物理学奖；他批评了一位美国的著名语言学家，却引发了中国语言学者的热烈讨论，反思中国语言学的问题。这形成了一个奇妙的蝴蝶效应。我刊随即与《当代语言学》编辑部筹划，联合举办“大语言模型与语言学发展座谈会”。10月17日，座谈会在商务印书馆召开，线上线下学者各陈己见。我刊特就此设多人谈栏目与学界共享。

本期嘉宾

袁毓林

澳门大学人文学院中国语言文学系

这是语言统计技术的胜利，也是语言天生理论的失败

语言学素来跟诺贝尔奖没有瓜葛。今年的诺贝尔物理学奖授予人工智能专家霍普菲尔德和辛顿的消息甫一传出，不仅众多网友一脸懵：“凭人工智能的成绩怎么拿物理学奖呢？”而且，在貌似无关的语言学界也掀起不小的风波。虽然从瑞典皇家科学院的授奖理由“表彰他们通过人工神经网络实现机器学习的基础性发现和发明”上，看不出这跟语言学有一丁半点儿的关系；但是，敏锐的语言学家从诺奖官网对辛顿的采访中，再次听到了他批评乔姆斯基的声音：“大语言模型比很多人想象的更接近于真正的理解，乔姆斯基对语言大模型的理解能力的判断是错误的，大模型的成功驳斥了语言学家的理论”，云云。

其实，从2022年底ChatGPT爆火带动人工智能进入大众视野以来，被誉为“深度学习之父”乃至“人工智能教父”的辛顿，已经多次在讲演中直言不讳地批评乔姆斯基的语言观。比如，他在《数字智能会取代生物智能吗？》（2024年2月19日，牛津大学）中说：“乔姆斯基曾说语言是天赋而非学会的，这很荒谬。……一个没有先天知识的大型神经网络仅仅通过观察数据就能实际学习语言的语法和语义，……”。的确，辛顿领导他的团队成功地把误差反向传播算法引入多层神经网络训练，开启了深度学习的爆发式进步，为大语言模型理解和生成自然语言奠定了坚实的基础。这次辛顿的获奖，表明了国际权威学术机构对他在人工智能领域的杰出贡献的认可。从自然语言处理的角度，也许可以说：这是基于大规模语料统计的语言技术的胜利，也是乔姆斯基语言天生理论的失败。因为，根据语言天赋论及与其相应的普遍语法理论，人类语言是受到十分繁复和抽象的规则（原则与参数）控制的，无法用马尔可夫过程模型来刻画，也是机器无法通过统计分析来学会的。但是，现代大型语言模型却以“再造人类语言”的方式，能够以接近于人类的水平来理解和生成自然语言。这种活生生的事实，使得辛顿有底气在尤利西斯奖章颁发仪式（2024年春，都柏林大学学院）上说，乔姆斯基误导了几代人。无独有偶，一位早年跟乔氏有过交集的国际知名语言学家，2023年末访问澳门大学，在谈到乔姆斯基语言学理论和大语言模型时，也语重心长地对我说：“他把语言学的方向带偏了。”话少意多，发人深省。

怀着对于学术研究的敬畏心（不误入歧途）和对于年轻学子的责任心（不误人子弟），趁着大语言模型成为诺奖主角的东风，认真思考和讨论下列问题不仅应景而且必要：

（1）基于统计的语言大模型的成功，能不能颠覆语言天生理论及普遍语法理论？

（2）乔姆斯基生成语法理论及有关主张与研究范式，有没有把语言学的方向带偏？

该文发表于《语言战略研究》2024年第6期，引用请以期刊版为准，转发请注明来源。

编排：韩畅

审稿：王飙余桂林

http://mp.weixin.qq.com/s?__biz=MzkwMzI3ODQ0MQ==&mid=2247488957&idx=1&sn=963899f5c3f33034ade86e8d225fb4f5

镜海语言学

澳门大学语言学研究中心官方公众号

最新文章

多人谈 | 袁毓林：这是语言统计技术的胜利，也是语言天生理论的失败

中国语言学报｜王为民：民族融合与北方标准汉语音系特征的演变（长摘要）

讲座预告｜井茁：临界事件：否定的情感逻辑

中国语言学报｜史皓元：赵元任的《方音调查表格》及其在汉语方言研究历史上所扮演的角色（长摘要）

讲座预告｜史皓元：“儿”缀和粤语 “变音”现象在音系和形态上的深层历史联系

讲座预告｜郭熙：新世纪以来的华语研究及理论演进

讲座预告｜郭利霞：晋语区“可”的音义关联和互动

讲座预告｜陈振宇：再说预期认知模型中的“条件”和“概率”

刊讯｜《中国语言学报》（JCL）2024年第3期论文中文摘要

镜海心得#36｜徐杰：成功实现由知识奴隶至知识主人的转型升级才是读博成功的关键指标

讲座预告｜Prof. Heiko Narrog：语法化的单向性与辖域

讲座预告｜朱冠明：“析断”动词的语义演变

镜海心得#35｜徐杰：刊物之于论文的作用酷似店铺之于产品的功能

讲座预告｜袁毓林：如何测试ChatGPT的语义理解与常识推理水平——兼谈大语言模型时代语言学的挑战与机会

论文推介｜徐杰、张帆：否定类型及与此相关的句法语义问题（概要及全文）

镜海心得#34｜徐杰：在学术问题上有错误的看法远胜没有看法

论文推介｜袁毓林：ChatGPT等大模型的语言处理机制及其理论蕴涵

獨家特稿 | 袁毓林教授談ChatGPT語境下語言學的挑戰和出路

澳大-南师语料库与数字人文暑期学院在中国澳门成功举行

澳大-南师语料库与数字人文暑期学院顺利闭幕

澳大-南師語料庫與數字人文暑期學院特約報道之三

澳大-南師語料庫與數字人文暑期學院特約報道之二

讲座预告｜王东波：荀子古籍多模态大语言模型的开发与应用

讲座预告｜沈威：语言研究中的统计方法

讲座预告｜卢达威：正则表达式的语料库应用

论文推介 | 徐杰：自然语言交际中的语码解读和知识匹配

讲座预告｜唐旭日：搭配自动抽取与可视化分析

澳大-南师语料库与数字人文暑期学院开幕

讲座预告｜龙从军：民族语言OCR文字识别最新进展与应用

讲座预告｜胡韧奋：浅探语言智能技术驱动的人文研究

讲座预告｜袁毓林：如何测试ChatGPT的语义理解与常识推理水平

澳大-南師語料庫與數字人文暑期學院日程表（3號通知）

境外语言学著作文摘｜2024年第1期

会议｜“第一届国际语法研究学术研讨会”征稿启事

录取通知｜致“澳大—南师语料库与数字人文暑期学院”报名者（2号通知）

成果速递｜李华斌：论贵州罗甸方言的归属

报告回顾｜徐杰教授：语言学理论的两种嬗变模式与新旧理论之间的关系

成果速递｜田早慧、邵则遂：西南官话“跟到”的多功能用法及其演变

成果速递｜陈宝贤：福建漳平溪南方言反身代词的连读变调

澳大-南师语料库与数字人文暑期学院（1号通知）

成果速递｜陆方喆、曾君：汉语体标记“了”的语体特征及其自由隐现的语体差异

成果速递｜方清明：NP隐含与“X（的）那种”句式的动态生成

成果速递｜崔四行等：汉语“动+名+动量”结构的韵律及语体制约

刊讯｜《中国语言学报》（JCL）2024年第2期论文中文摘要

袁毓林：语言与思维的可分性和图灵测试的局限性

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉