深水炸弹句的语义错觉:来自噪声信道模型的解释
张雨涵1、Rachel Ryskin2、Edward Gibson3
(1. 哈佛大学 2. 加利福尼亚大学默塞德分校 3. 麻省理工学院)
文章来源:Zhang, Y., Ryskin, R., & Gibson, E. (2023). A noisy-channel approach to depth-charge illusions. Cognition, 232, 105346.
一、总述
人们在一开始理解句子(1)时,往往认为这个句子是符合语法规则且符合语义逻辑的。
这个句子的意思似乎是“无论头部损伤多么轻微,我们都不应忽视它们”。然而,这个句子的实际意义 (literal interpretation) 却与人们惯常的理解相反,那就是“无论头部损伤多么轻微,它们都应该被忽视”。英语母语者经常无法意识到这个句子的实际意义与惯常理解不同,即使他人指出这个事实,也需要花一些时间理解。这类句子被称为“深水炸弹”句:就像深水炸弹在水中行进一段时间才爆炸一样,人们总是会过很长一段时间才能理解这个句子的错误所在。这种理解者一开始将有错误的句子理解成正确句子的现象被称为语言错觉(language illusion)。因为“深水炸弹”句错综复杂的根源在于其语义的复杂性,我们也称其为语义错觉(semantic illusion)。
四十年多年来,心理语言学家一直在尝试研究并解释这一语义错觉产生的根源。本研究采用信息论 (information theory) 中的噪声信道理论 (the noisy-channel theory) 为其提供一个可能的解释。通过四组实验,我们发现:(1)人们对深水炸弹句的预期理解越符合常理,就越有可能误解句子原本含义;(2)我们假设的噪声操作(noise operation, 即句子中字符在产出时被干扰替换)的可能性越高,深水炸弹句本身就越有可能被误解。这些结果表明,是否产生语义错觉受到常识常理和句子在信息传递过程中噪声扰动的双重影响,这与噪声信道理论的预测是一致的。
二、信息论与噪声信道理论
噪声信道理论将语言理解视为在语言输入不确定条件下的贝叶斯推断的过程(Gibson, Bergen & Piantadosi, 2013; Levy, 2008; Levy, 2011; Ryskin, Futrell, Kiran & Gibson, 2018, a.o.)。理性的理解者 (rational listener) 在接收可能被噪声污染而变得和原本句子不同的句子时,会在句子的表面含义和其他可能的含义之间进行权衡,而这些其他可能的含义来自于和句子本身近似的句子。例如,在Gibson等人(2013)中,当理解者听到句子The mother gave the candle the daughter,他可能会觉得自己听到了与该句子相似的邻近句子The mother gave the candle to the daughter,后者仅通过删除一个词to就能和所听句子一致,而且其描述的事件有更高的概率发生。由于在语言信息的传递过程中,一个词汇的删除或消失的可能性相对较高,因而理解者有更大的概率认为他们听到的句子含义是The mother gave the candle to the daughter。这一过程可通过示意图1展现。
说话者计划通过句子si来传达并编码一个由mi表示的意思。句子si通过嘈杂的噪声信道传递,并可能由于说话者的口误或理解者的理解错误,或环境中的噪声而受到改变,使得说话者说出的si和理解者接收的sp不同。理解者将语言信号视为sp,并从中提取意义mp。成功的沟通往往意味着mp与mi相同,但由于存在噪声,情况并非总是如此。理解者通过贝叶斯推理来推断给定si的概率,这一过程可以通过公式(1)来建模代表:
其中,sp是理解者感知到的句子,si是说话者打算传达消息的假设句子之一。这个模型是图1示意图的简化,我们认为si既代表语言字符串,又代表预期的含义。公式(1)的左侧,P(si|sp),是理解者在输入sp给定的条件下预测句子含义si的后验概率。根据贝叶斯规则,这与公式(1)右侧的si的先验概率P(si)(说话者打算传达si的概率)以及在信息传递期间si被噪声改变成为sp的可能性P(sp|si)成正比。在日常交流中,先验概率P(si) 由理解者认为可能表达的含义si决定,这与世界知识和常识有关。P(sp|si)代表在传输过程中句子si受到改变并以sp的形式被理解者接收的可能性。
在这一框架内,我们探讨了深水炸弹句的理解是否可以被噪声信道理论解释。我们认为,理解者之所以认为No head injury is too trivial to be ignored是正确的,是因为他们在听到这句话的基础上,错误地认为这句话的意思和临近句子No head injury is so trivial as to be ignored意思一致。这里,有too…to的句子是sp,有so…as to的句子是si。因为si的字面意思符合常识,sp的字面意思不符合常识,所以P(si) > P(sp)。由于说话者将so…as to误说为too…to的概率比将too…to误说为so…as to的概率大(由实验三得出),P(sp|si)比较大。在此基础上,后验概率P(si|sp)就会更大。因此,人们很难对深水炸弹句进行字对字的理解。
三、实验结果
实验一采用接受程度测试(acceptability judgment tasks)的实验方法,验证了英语母语者很难发现深水炸弹句的错误之处。64名英语母语者通过Amazon’s Mechanical Turk参与了本次实验。实验由32个测试句子和60个干扰句子组成。这32个测试句子每个由4种实验组组成,不同的实验组中,句首的量词和句中的形容词不同。针对每一个句子,实验被试需要给出接受度,之后在7级李克特量表(7-point Likert Scale)打分。结果如图2所示。
实验二采用世界知识评分的方法(world knowledge rating study),针对实验一中的32个测试句,翻译了其对应的由贝叶斯推断产生的人们的惯常理解,即si。si的句式结构是Head injuries are in general too severe to be ignored。共有35名英语母语者通过Amazon’s Mechanical Turk完成了本次实验。他们对32个实验句对应的惯常理解打分情况如图3所示。其中最高分大于6,最低分小于2.5。
我们将实验一的得分看成P(si|sp)的表征,将实验二的得分看成P(si)的表征,对两个实验结果进行了相关性分析。如图4所示,实验二中得分越高的实验对象对应的实验一的得分也越高,这证实了P(si|sp)∝P(si)的关系。
实验三的目的是收集噪声可能性P(sp|si)的行为学表征。实验假设了两对可能的噪声干扰通路,按照第一种假设,si是No head injury is so trivial as to ignored,通过so…as to到too…to的变化,变成sp—No head injury is too trivial to be ignored。我们假设这一过程发生在语言产出的过程中。第二种假设则是,si为No head injury is too trivial to be treated,sp为No head injury is so trivial as to be treated,对应的噪声变化是too…to转变为so…as to。通过对64名实验对象的噪声可能性评分(noise likelihood rating)进行分析,我们发现英语母语者认为第一种假设比第二种假设更容易发生,如图5。在原实验中,我们还设置了反义词替换这一噪声干扰,请参阅原文查看更多内容。
实验四是一项语言理解实验,其目的是收集关于实验三中涉及的两种sp的语言理解信息,以找到P(si|sp)的行为学表征。我们将两种sp和对应的两种si分别让72位被试理解,收集他们真正的理解内容。我们发现,相比于sp(即No head injury is so trivial as to treated),人们更容易对sp(即No head injury is too trivial to be ignored)产生错误的、非字面含义、富有引申意味的理解,即深水炸弹句的P(si|sp)大于其对应实验组的P(si|sp)(图6)。这一数量关系与实验三中P(sp|si)的数量关系一致,进一步表明P(si|sp)∝P(sp|si)。
四、结论
通过四组实验,我们证明了,(1)人们对深水炸弹句的预期理解越符合常理,就越有可能误解句子原本含义(实验一和实验二);(2)我们假设的噪声操作(noise operation)的可能性越高,深水炸弹句本身就越有可能被误解(实验三和实验四)。这些结果表明,是否产生语义错觉受到常识常理和句子在信息传递过程中噪声扰动的双重影响,人们理解深水炸弹这一语义错觉的过程可以从信息论的噪声信道理论找到解释。
部分参考文献
Gibson, E., Bergen, L., & Piantadosi, S. T. (2013). Rational integration of noisy evidence and prior semantic expectations in sentence interpretation. Proceedings of the National Academy of Sciences, 110(20), 8051–8056.
Levy, R. (2008). A noisy-channel model of rational human sentence comprehension under uncertain input. Proceedings of the Conference on Empirical Methods in Natural Language Processing - EMNLP 08, 234.
Levy, R. (2011). Integrating surprisal and uncertain-input models in online sentence comprehension: Formal techniques and empirical results. Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics, 1055–1065.
Ryskin, R., Futrell, R., Kiran, S., & Gibson, E. (2018). Comprehenders model the nature of noise in the environment. Cognition, 181, 141–150.
审校 | 杨小璐、李彦婷
设计排版 | 李彦婷