讲座预告｜袁毓林：如何测试ChatGPT的语义理解与常识推理水平

文摘 2024-08-08 09:25 中国澳门

澳大-南师语料库与数字人文暑期学院‍‍‍‍‍‍‍

第一讲
‍‍‍‍‍

如何测试ChatGPT的语义理解与常识推理水平

时　间：2024年8月10日

　　　　14：30-17：00

主讲人：袁毓林

　　　　澳门大学人文学院中国语言文学系讲座教授

直播链接：http://live.bilibili.com/1728480216

内容提要

ChatGPT 等大语言模型在语义理解和常识推理方面表现优秀，其技术奥秘在于模型开发者在对词语进行向量表示时，遵循分布式语义学原理，采用了“嵌入”这种代数方法。但是，经典的测试语言运用等智能水平的“图灵测试”，难以识别欺骗回避等作弊手段，因此，计算机科学家设计了“新图灵测试”，其中的威诺格拉德模式挑战与语言学关系密切。这一模式以代词消歧为测试点设计句子对和问题，但是经过大规模语料训练的语言模型可以凭借词汇上的统计相关性，而不是靠真正理解句子的意义来给出正确答案。为克服这一缺陷，学者们又发展出WinoGrande数据集，提高了数据的规模和难度，确保它们无法通过网络搜索等手段来得到正确答案。我们用威诺格拉德模式设计了无偏向双重句子对测试 ChatGPT，展示了大语言模型在语义理解和常识推理方面已达到接近人类的水平。当然，从具身模拟假说来看，大语言模型不可能像人一样富有体验性地理解人类自然语言。最后，我们呼吁：语言学家应该积极参与构建WinoGrade测试集之类的工作，在人工智能时代扩展自身的学术研究领域。

主讲人简介

袁毓林，原北京大学中文系教授，博士生导师，现为澳门大学人文学院中国语言文学系讲座教授。主要研究理论语言学和汉语语言学。在《中国社会科学》《中国语文》《当代语言学》和《中文信息学报》等刊物发表论文100余篇，出版《语言的认知研究和计算分析》等10余部著作。多次获得教育部“高校科学研究优秀成果奖”。入选教育部长江学者特聘教授，国家“万人计划”哲学社会科学领军人才。

主办单位

澳大-南师语料库与数字人文暑期学院‍‍‍‍

http://mp.weixin.qq.com/s?__biz=MzkwMzI3ODQ0MQ==&mid=2247488573&idx=1&sn=ee1766a8b158382f50728bea4cbdf052

镜海语言学

澳门大学语言学研究中心官方公众号

最新文章

多人谈 | 袁毓林：这是语言统计技术的胜利，也是语言天生理论的失败

中国语言学报｜王为民：民族融合与北方标准汉语音系特征的演变（长摘要）

讲座预告｜井茁：临界事件：否定的情感逻辑

中国语言学报｜史皓元：赵元任的《方音调查表格》及其在汉语方言研究历史上所扮演的角色（长摘要）

讲座预告｜史皓元：“儿”缀和粤语 “变音”现象在音系和形态上的深层历史联系

讲座预告｜郭熙：新世纪以来的华语研究及理论演进

讲座预告｜郭利霞：晋语区“可”的音义关联和互动

讲座预告｜陈振宇：再说预期认知模型中的“条件”和“概率”

刊讯｜《中国语言学报》（JCL）2024年第3期论文中文摘要

镜海心得#36｜徐杰：成功实现由知识奴隶至知识主人的转型升级才是读博成功的关键指标

讲座预告｜Prof. Heiko Narrog：语法化的单向性与辖域

讲座预告｜朱冠明：“析断”动词的语义演变

镜海心得#35｜徐杰：刊物之于论文的作用酷似店铺之于产品的功能

讲座预告｜袁毓林：如何测试ChatGPT的语义理解与常识推理水平——兼谈大语言模型时代语言学的挑战与机会

论文推介｜徐杰、张帆：否定类型及与此相关的句法语义问题（概要及全文）

镜海心得#34｜徐杰：在学术问题上有错误的看法远胜没有看法

论文推介｜袁毓林：ChatGPT等大模型的语言处理机制及其理论蕴涵

獨家特稿 | 袁毓林教授談ChatGPT語境下語言學的挑戰和出路

澳大-南师语料库与数字人文暑期学院在中国澳门成功举行

澳大-南师语料库与数字人文暑期学院顺利闭幕

澳大-南師語料庫與數字人文暑期學院特約報道之三

澳大-南師語料庫與數字人文暑期學院特約報道之二

讲座预告｜王东波：荀子古籍多模态大语言模型的开发与应用

讲座预告｜沈威：语言研究中的统计方法

讲座预告｜卢达威：正则表达式的语料库应用

论文推介 | 徐杰：自然语言交际中的语码解读和知识匹配

讲座预告｜唐旭日：搭配自动抽取与可视化分析

澳大-南师语料库与数字人文暑期学院开幕

讲座预告｜龙从军：民族语言OCR文字识别最新进展与应用

讲座预告｜胡韧奋：浅探语言智能技术驱动的人文研究

讲座预告｜袁毓林：如何测试ChatGPT的语义理解与常识推理水平

澳大-南師語料庫與數字人文暑期學院日程表（3號通知）

境外语言学著作文摘｜2024年第1期

会议｜“第一届国际语法研究学术研讨会”征稿启事

录取通知｜致“澳大—南师语料库与数字人文暑期学院”报名者（2号通知）

成果速递｜李华斌：论贵州罗甸方言的归属

报告回顾｜徐杰教授：语言学理论的两种嬗变模式与新旧理论之间的关系

成果速递｜田早慧、邵则遂：西南官话“跟到”的多功能用法及其演变

成果速递｜陈宝贤：福建漳平溪南方言反身代词的连读变调

澳大-南师语料库与数字人文暑期学院（1号通知）

成果速递｜陆方喆、曾君：汉语体标记“了”的语体特征及其自由隐现的语体差异

成果速递｜方清明：NP隐含与“X（的）那种”句式的动态生成

成果速递｜崔四行等：汉语“动+名+动量”结构的韵律及语体制约

刊讯｜《中国语言学报》（JCL）2024年第2期论文中文摘要

袁毓林：语言与思维的可分性和图灵测试的局限性

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉