“实验语言学+”云上论坛
如何测试ChatGPT的语义理解与常识推理水平
——兼谈大语言模型时代语言学的挑战与机会
时 间:2024年9月10日(周二)
19:00
主讲人:袁毓林
澳门大学人文学院中国语言文学系 讲座教授
腾讯会议:756-344-946(密码:0910)
内容提要
本讲座首先简介ChatGPT等现代大型语言模型在语义理解和常识推理方面的优秀表现,概要地说明它们的工作原理及其所采用的分布式语义学和词语的向量表示;接着简介经典的“图灵测试”及其缺陷,特别介绍“新图灵测试”及其中的维诺格拉德模式挑战,还介绍其升级版本,即WinoGrande数据集;然后介绍我们用维诺格拉德模式的句子测试ChatGPT的情况,展示语言大模型在语言理解和常识推理方面达到了接近人类的水平;最后简单说明语言大模型能够“理解”人类自然语言,而构建维诺格拉德模式挑战之类的测试集是语言学家应该参与的工作,也是语言学在人工智能时代扩展自身学术领域的一个机会。
主讲人简介