期刊论文 | 张雨涵、Rachel Ryskin、Edward Gibson--深水炸弹句的语义错觉：来自噪声信道模型的解释

学术 2024-01-19 19:00 北京

深水炸弹句的语义错觉：来自噪声信道模型的解释

张雨涵¹、Rachel Ryskin²、Edward Gibson³

（1. 哈佛大学 2. 加利福尼亚大学默塞德分校 3. 麻省理工学院）

文章来源：Zhang, Y., Ryskin, R., & Gibson, E. (2023). A noisy-channel approach to depth-charge illusions. Cognition, 232, 105346.

一、总述

人们在一开始理解句子（1）时，往往认为这个句子是符合语法规则且符合语义逻辑的。

这个句子的意思似乎是“无论头部损伤多么轻微，我们都不应忽视它们”。然而，这个句子的实际意义 (literal interpretation) 却与人们惯常的理解相反，那就是“无论头部损伤多么轻微，它们都应该被忽视”。英语母语者经常无法意识到这个句子的实际意义与惯常理解不同，即使他人指出这个事实，也需要花一些时间理解。这类句子被称为“深水炸弹”句：就像深水炸弹在水中行进一段时间才爆炸一样，人们总是会过很长一段时间才能理解这个句子的错误所在。这种理解者一开始将有错误的句子理解成正确句子的现象被称为语言错觉（language illusion）。因为“深水炸弹”句错综复杂的根源在于其语义的复杂性，我们也称其为语义错觉（semantic illusion）。

四十年多年来，心理语言学家一直在尝试研究并解释这一语义错觉产生的根源。本研究采用信息论 (information theory) 中的噪声信道理论 (the noisy-channel theory) 为其提供一个可能的解释。通过四组实验，我们发现:（1）人们对深水炸弹句的预期理解越符合常理，就越有可能误解句子原本含义；（2）我们假设的噪声操作（noise operation, 即句子中字符在产出时被干扰替换）的可能性越高，深水炸弹句本身就越有可能被误解。这些结果表明，是否产生语义错觉受到常识常理和句子在信息传递过程中噪声扰动的双重影响，这与噪声信道理论的预测是一致的。

二、信息论与噪声信道理论

噪声信道理论将语言理解视为在语言输入不确定条件下的贝叶斯推断的过程（Gibson, Bergen & Piantadosi, 2013; Levy, 2008; Levy, 2011; Ryskin, Futrell, Kiran & Gibson, 2018, a.o.）。理性的理解者 (rational listener) 在接收可能被噪声污染而变得和原本句子不同的句子时，会在句子的表面含义和其他可能的含义之间进行权衡，而这些其他可能的含义来自于和句子本身近似的句子。例如，在Gibson等人（2013）中，当理解者听到句子The mother gave the candle the daughter，他可能会觉得自己听到了与该句子相似的邻近句子The mother gave the candle to the daughter，后者仅通过删除一个词to就能和所听句子一致，而且其描述的事件有更高的概率发生。由于在语言信息的传递过程中，一个词汇的删除或消失的可能性相对较高，因而理解者有更大的概率认为他们听到的句子含义是The mother gave the candle to the daughter。这一过程可通过示意图1展现。

说话者计划通过句子s_i来传达并编码一个由m_i表示的意思。句子s_i通过嘈杂的噪声信道传递，并可能由于说话者的口误或理解者的理解错误，或环境中的噪声而受到改变，使得说话者说出的s_i和理解者接收的s_p不同。理解者将语言信号视为s_p，并从中提取意义m_p。成功的沟通往往意味着m_p与m_i相同，但由于存在噪声，情况并非总是如此。理解者通过贝叶斯推理来推断给定s_i的概率，这一过程可以通过公式（1）来建模代表：

其中，s_p是理解者感知到的句子，s_i是说话者打算传达消息的假设句子之一。这个模型是图1示意图的简化，我们认为s_i既代表语言字符串，又代表预期的含义。公式（1）的左侧，P(s_i|s_p)，是理解者在输入s_p给定的条件下预测句子含义s_i的后验概率。根据贝叶斯规则，这与公式（1）右侧的s_i的先验概率P(s_i)（说话者打算传达s_i的概率）以及在信息传递期间s_i被噪声改变成为s_p的可能性P(s_p|s_i)成正比。在日常交流中，先验概率P(s_i) 由理解者认为可能表达的含义s_i决定，这与世界知识和常识有关。P(s_p|s_i)代表在传输过程中句子s_i受到改变并以s_p的形式被理解者接收的可能性。

在这一框架内，我们探讨了深水炸弹句的理解是否可以被噪声信道理论解释。我们认为，理解者之所以认为No head injury is too trivial to be ignored是正确的，是因为他们在听到这句话的基础上，错误地认为这句话的意思和临近句子No head injury is so trivial as to be ignored意思一致。这里，有too…to的句子是s_p，有so…as to的句子是s_i。因为s_i的字面意思符合常识，s_p的字面意思不符合常识，所以P(s_i) > P(s_p)。由于说话者将so…as to误说为too…to的概率比将too…to误说为so…as to的概率大（由实验三得出），P(s_p|s_i)比较大。在此基础上，后验概率P(s_i|s_p)就会更大。因此，人们很难对深水炸弹句进行字对字的理解。

三、实验结果

实验一采用接受程度测试（acceptability judgment tasks）的实验方法，验证了英语母语者很难发现深水炸弹句的错误之处。64名英语母语者通过Amazon’s Mechanical Turk参与了本次实验。实验由32个测试句子和60个干扰句子组成。这32个测试句子每个由4种实验组组成，不同的实验组中，句首的量词和句中的形容词不同。针对每一个句子，实验被试需要给出接受度，之后在7级李克特量表（7-point Likert Scale）打分。结果如图2所示。

实验二采用世界知识评分的方法（world knowledge rating study），针对实验一中的32个测试句，翻译了其对应的由贝叶斯推断产生的人们的惯常理解，即s_i。s_i的句式结构是Head injuries are in general too severe to be ignored。共有35名英语母语者通过Amazon’s Mechanical Turk完成了本次实验。他们对32个实验句对应的惯常理解打分情况如图3所示。其中最高分大于6，最低分小于2.5。

我们将实验一的得分看成P(s_i|s_p)的表征，将实验二的得分看成P(s_i)的表征，对两个实验结果进行了相关性分析。如图4所示，实验二中得分越高的实验对象对应的实验一的得分也越高，这证实了P(s_i|s_p)∝P(s_i)的关系。

实验三的目的是收集噪声可能性P(s_p|s_i)的行为学表征。实验假设了两对可能的噪声干扰通路，按照第一种假设，s_i是No head injury is so trivial as to ignored，通过so…as to到too…to的变化，变成s_p—No head injury is too trivial to be ignored。我们假设这一过程发生在语言产出的过程中。第二种假设则是，s_i为No head injury is too trivial to be treated，s_p为No head injury is so trivial as to be treated，对应的噪声变化是too…to转变为so…as to。通过对64名实验对象的噪声可能性评分（noise likelihood rating）进行分析，我们发现英语母语者认为第一种假设比第二种假设更容易发生，如图5。在原实验中，我们还设置了反义词替换这一噪声干扰，请参阅原文查看更多内容。

实验四是一项语言理解实验，其目的是收集关于实验三中涉及的两种s_p的语言理解信息，以找到P(s_i|s_p)的行为学表征。我们将两种s_p和对应的两种s_i分别让72位被试理解，收集他们真正的理解内容。我们发现，相比于s_p（即No head injury is so trivial as to treated），人们更容易对s_p（即No head injury is too trivial to be ignored）产生错误的、非字面含义、富有引申意味的理解，即深水炸弹句的P(s_i|s_p)大于其对应实验组的P(s_i|s_p)（图6）。这一数量关系与实验三中P(s_p|s_i)的数量关系一致，进一步表明P(s_i|s_p)∝P(s_p|s_i)。

四、结论

通过四组实验，我们证明了，（1）人们对深水炸弹句的预期理解越符合常理，就越有可能误解句子原本含义（实验一和实验二）；（2）我们假设的噪声操作（noise operation）的可能性越高，深水炸弹句本身就越有可能被误解（实验三和实验四）。这些结果表明，是否产生语义错觉受到常识常理和句子在信息传递过程中噪声扰动的双重影响，人们理解深水炸弹这一语义错觉的过程可以从信息论的噪声信道理论找到解释。

部分参考文献

Gibson, E., Bergen, L., & Piantadosi, S. T. (2013). Rational integration of noisy evidence and prior semantic expectations in sentence interpretation. Proceedings of the National Academy of Sciences, 110(20), 8051–8056.

Levy, R. (2008). A noisy-channel model of rational human sentence comprehension under uncertain input. Proceedings of the Conference on Empirical Methods in Natural Language Processing - EMNLP 08, 234.

Levy, R. (2011). Integrating surprisal and uncertain-input models in online sentence comprehension: Formal techniques and empirical results‬. Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics, 1055–1065.

Ryskin, R., Futrell, R., Kiran, S., & Gibson, E. (2018). Comprehenders model the nature of noise in the environment. Cognition, 181, 141–150.

审校 | 杨小璐、李彦婷

设计排版 | 李彦婷

http://mp.weixin.qq.com/s?__biz=MzkyNzA4NTUwMg==&mid=2247493353&idx=1&sn=1aede56e514609c0e488299dda64cc67

形式语言学研究

形式语言学研究与学术交流

最新文章

期刊论文丨陈奕勋--汉语个体量词在程度结构中的隐现

期刊论文丨陈子澈、饶琪--中古汉语音系传统术语的形式化陈述

期刊论文丨谭丹丹--汉语量词真的需要两种句法结构吗？案例分析

期刊论文丨杨兆乐--作为小句标句词（complementizer）的“是”

期刊论文丨李旭平、韦焕干、刘鸿勇--量词型语言的计数和可数性：基于东兰壮语的证据

期刊论文丨赖欣祺、李昊明--中心语到指定语的移位：来自于普通话主语前多模态词共存的证据

期刊论文丨潘俊楠、杜雨桥--自由合并框架下的多维度生成模型：句法与C-I接口的分野

博士论文 | 谢媛 -- 汉语普通话儿童如何搭桥？一个句法-语篇-加工模型及其应用

语言学家访谈系列之十七：黄正德教授

形式语言学专委会通讯 | 第十七期目录

《通讯》第十六期完整电子版

形式语言学科普讲堂 | Studying language scientifically

理论探索与争鸣丨胡旭辉--语言官能与外部世界的联结——基于生成语言学的语言模型初探

期刊论文丨包华莉、闫姗姗--汉语进行体标记“在”新议

期刊论文丨胡旭辉、Joe Perry--多功能性与语境实现：基于汉语宜兴方言的个案研究

期刊论文丨龚颖、Elizabeth Coppock--程度抽象到底是一个参数还是普遍现象？——汉语普通话中的程度抽象

期刊论文丨黄新骏蓉、蔡承佑--“唯一”关系句标记

期刊论文丨何雨殷--汉语零形式将来的语义

期刊论文丨顾倩萍--汉语动词系统终结化研究

专著 | 陈旭 --《汉语特殊疑问句孤岛效应的实验研究》

博士论文 | 莫愁 -- 基于平行语料库的汉语体系统组合性研究

语言学家访谈系列之十六：李艳惠教授

形式语言学专委会通讯 | 第十六期目录

《通讯》第十五期完整电子版

形式语言学科普讲堂 | What grammars are and aren’t

理论探索与争鸣丨石定栩-- 语法分析中的“语气”

期刊论文 | 张艺琼等—图形符号对汉语句末助词使用的影响

期刊论文丨张庆文、金佳--语义有定还是语用有定? 以澄海话量名短语的两种解读为例

期刊论文 | 金晶 -- Attributional versus identificational

期刊论文丨罗振南，潘海华--汉语的六个重建现象

会议信息｜第三届汉语形式语义研究研讨会

期刊论文 | 李宝伦 -- Proximity, polarity and scalarity

期刊论文丨罗海琪、李昊泽、Diti Bhadra -- 语气的转换：论粤语语气词“嗬”的语义

期刊论文丨陈哲--从目标-探针理论看汉语描写性V-de结构中的极近效应

期刊论文丨刘莹、程工--再谈汉语“是”字句及几类相关结构的语义

博士论文 | 唐诗吟 -- 从强化到主观性：都匀话“很”的句法语义研究

语言学家访谈系列之十五：郑礼珊教授（下）

语言学家访谈系列之十五：郑礼珊教授（上）

形式语言学专委会通讯 | 第十五期目录

转载 | 北京理工大学将举办中国语言学书院核心科目研讨班和现代语言学高级研讨班

《通讯》第十四期完整电子版

博士论文 | 苗苗 -- 普通话量词早期习得的偏好注视实验研究

GLOW in Asia 14｜会议周边活动日程安排

专著 | 刘明明 --《汉语多功能副词及相关语法现象的双向系统性研究—— 以“都、也”为例看现代汉语的全称量化、任指等现象》

中国英汉语比较研究会形式语言学专业委员会第五届理事会

期刊论文丨史如深等 -- 层级结构依存：来自婴幼儿早期句法加工的证据

期刊论文 | 张雨涵、Rachel Ryskin、Edward Gibson--深水炸弹句的语义错觉：来自噪声信道模型的解释

会议信息丨GLOW in Asia XIV

转载丨浙大—港中大联合举办“第三届汉语形式语义研究国际研讨会（2024.4.19-21）”

期刊论文丨乌云赛娜 --《左传》中的致使转换

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉