2024年第6期
[编者按]2024年4月8日,有“人工智能教父”之称的杰弗里·辛顿(Geoffrey E. Hinton)在都柏林大学接受尤利西斯奖章的获奖感言里,对乔姆斯基提出了毫不客气的批评:“语言学家被一个名叫乔姆斯基的人误导了好几代……他有一个偏执古怪的理论,即语言不是学会的。他成功地说服很多人相信这一点。但这一看就知道纯粹是胡言乱语。语言显然是学会的。大型神经网络学习语言,不需要任何先天结构,只是从随机权重和大量数据开始。乔姆斯基却仍然在说,但这并非真正的语言,这不算数,这是不对的。许多统计学家和认知科学家也说,永远不可能在这样一个大网络里学习语言。乔姆斯基从来没有提出任何一种有关语义的理论。他的理论全是关于句法的。”这篇发言引起了中国语言学界的关注,陈国华教授把它译为中文,以《杰弗里·辛顿接受尤利西斯奖章时发表的获奖感言》为题,发表在《当代语言学》2024年第4期上。10月8日,霍普菲尔德(John J. Hopfield)和辛顿以“通过人工神经网络实现机器学习的基础性发现和发明”获得诺贝尔物理学奖后,关于大语言模型和语言学发展、辛顿和乔姆斯基的话题再度爆火。
一位人工智能大家,获得了诺贝尔物理学奖;他批评了一位美国的著名语言学家,却引发了中国语言学者的热烈讨论,反思中国语言学的问题。这形成了一个奇妙的蝴蝶效应。我刊随即与《当代语言学》编辑部筹划,联合举办“大语言模型与语言学发展座谈会”。10月17日,座谈会在商务印书馆召开,线上线下学者各陈己见。我刊特就此设多人谈栏目与学界共享。
本期嘉宾
徐杰
澳门大学人文学院
人工智能给语言学研究带来重大挑战和机遇
当代人工智能突飞猛进,日新月异。这无疑给包括当代语言学在内的学术事业带来了深远影响。在语言学方面,这些影响有的是挑战,有的是机遇。
首先,人工智能给当代语言学领域的重要分支计算语言学带来了重大挑战。曾几何时,就连专做自然语言处理的工程师自己也认为,为了达到其语言工程的目的,应该依靠而且只能依靠语言学科学家对语言规则的揭示和总结。而兼做自然语言处理的语言学家出于自身的专业训练和学术优势,理所当然地,无一例外地,走规则导向的自然语言处理技术路线。但是谁也没有料到,当今的人工智能工程师居然改道而行,抛开了基于语言规则的模式而走大数据路线,并且在工程学意义上取得了很大的成功。原本视野之外的白猫异军突起,居然还真的就捉住了一只大老鼠!这让黑猫何以自处?在我们看来,面对崭新的形势,跨界到自然语言处理工程的语言学科学家们其实大可不必过于纠结焦虑。他们可以要么完全回归对语言本体进行科学研究的老本行;要么干脆不理会ChatGPT们现在走的大数据白猫技术路线,锲而不舍地继续沿着自己原定的规则导向黑猫技术路线朝前走,其工作成果也许是下一代人工智能的突破口和增长点。久久为功,说不定能捉住更大更多的老鼠!
其次,人工智能给本体语言学研究带来了一个重大机遇,那就是新一代人工智能以其强大的数据处理能力,给包括语言学在内的所有学科的科学研究赋能,大幅度地强化其精度,大幅度地提高其效能。人工智能赋能现代语言学研究,在目前阶段主要体现在两个方面。其一是助力语言数据的收集和整理,语言学领域有许多分支学科对语言样本和语料有很高的依赖性。计量语言学,语言类型学,比较语言学,语料库语言学,等等,它们的成效主要取决于收集语言数据的范围、数量和准确度。最早的时候,这些工作基本靠焚膏继晷、兀兀穷年的手工操作自不必说,即使后来有了计算机技术的辅助,效能依然有限。在这些方面,今天的新一代人工智能正可以大显神威。它们不仅可以近乎竭泽而渔式地收集语料数据,还可以对这些数据进行初步的分类、整理和分析。其二是助力语言学数据的收集和整理。语言学是一门古老而崭新的学科,古今中外的研究文献可以说是汗牛充栋,浩如烟海。今天的年轻学者很快会发现,自己一入门就被淹没在各种理论、各类学说、似是而非的观点以及对同一类语言现象多种多样的分析方案中难以自拔,恍如雾里看花。这时大数据和深度学习技术就可以进来,对相关文献进行收集整理,条分缕析,甚至对不同理论进行初步的鉴定和评价,以便去粗取精,让人类学者很快站到学术研究的最前沿,如虎添翼,可收事半功倍之神效。
总而言之,人工智能带来的重大挑战是对当代语言学领域的一个分支学科计算语言学和一种研究范式,也就是对单一语种表面现象的收集、观察、整理和分析的重大挑战;而对本体语言学的高层次理论探索则是一个重大机遇。如能把握好这个机遇,科学规划,人机分工,把语料的收集、整理和初步描写乃至文献综述等粗活重活发包给机器,人类语言学家则可以集中精力和智慧于理论探索和解释,中国语言学整体事业极有可能在较短时间内实现跨越式发展,由现在的对单一语种的现象描写转型升级到跨语种、跨古今的高层次理论解释。这正是我们多年来梦寐以求的美妙愿景!
该文发表于《语言战略研究》2024年第6期,引用请以期刊版为准,转发请注明来源。
编排:逯琳琳
审稿:王 飙 余桂林