趣文赏析：毒药难题

文摘 2024-11-08 08:22 加拿大

大老李按：

本文原载于Recreational Mathematics Magazine, pp. 59–65 DOI 10.2478/rmm-2024-0013，原标题为“Mathematizing the Toxin Puzzle”，现翻译转载如下。文末有大老李的点评。

毒药难题的数学化

Leonard M. Wapner (1) 数学荣誉退休教授，数学科学部，埃尔卡米诺学院，加利福尼亚州托伦斯90506(美国)

摘要

本文构建了Gregory Kavka的"Newcomb's Problem"的数学模型，以提供这个思想实验的最优行动方案。但模型所建议的行动是不理性的，这使得该模型对理性参与者而言毫无用处。然而，正是这种失败本身为我们提供了对意图本质和数学建模一般局限性的更深入洞察。

"好的意图是不够的。它们从未在汤里放过一个洋葱。" -- Sonya Levien

1 引言

Robert Nozick的"Newcomb's Problem"[Noz69]和Gregory Kavka的"毒药难题"[Kav83]是决策理论中密切相关的哲学困境。前者被认为是哲学中最具争议的问题之一，已在文献中广为流传和讨论。毒药难题则受到的关注较少。本文构建了该难题的数学模型，以确定在面对难题场景时的最优(因此也是最理性的)选择。该模型失败了，因为它建议了一个高度不理性的选项作为最优选择。

尽管失败了，但正是由于这种失败，我们可以从残骸中挖掘出与意图心理状态相关的深层真理，并更多地了解我们自身理性对数学建模施加的限制。

2 毒药难题

周一，一位值得信赖的亿万富翁给你发了一封电子邮件，提出如果你在周二之前形成自愿在本周四喝下一种毒药的意图，他就给你100万美元。

这种毒药会让你生病一天，但不会有任何长期影响。你意图的合法性将在周二由一台高度可靠的脑部扫描测谎仪进行验证。如果周二验证了你喝毒药的意图，100万美元将于周三存入你的银行账户。亿万富翁明确表示，你只需形成一个合法且可验证的自愿喝毒药的意图。你是否真的喝下毒药并不重要。

轻松赚钱?也许吧。毕竟，毒药的不良影响是暂时的。而且，你甚至不需要真的喝下毒药。太棒了!

我们将使用一个数学模型来回答两个问题。

你应该形成喝毒药的意图吗?
在周二接受测谎测试时，你应该如实陈述你的意图吗?还是应该撒谎，可能声称你会喝毒药，而实际上你并没有这样的意图，希望测谎仪无法检测到你在撒谎?

图1给出了时间线。

图1:毒药难题时间线，图中文字内容是：星期一，亿万富翁向你提出了一个提议；星期二，测谎仪脑部扫描确认你是否打算喝下或不喝下毒药；星期三，如果扫描显示你打算喝下毒药，$1，000，000 将存入你的账户；星期四，喝下或不喝下毒药

3 数学模型

令表示亿万富翁提供的存款价值(效用)。(在Kavka的例子中，。) 令表示与喝毒药相关的痛苦程度(成本)。

最后，我们采用医学诊断测试的术语来指定测谎测试的准确性。测试的敏感性，表示为，是在你实际上在撒谎的情况下，测试将你的意图陈述解释为谎言的概率。测试的特异性，表示为，是在你实际上给出真实意图的情况下，测试将你的陈述解释为真实的概率。

如果真实性仅由偶然性决定，则。Kavka假设完美准确性对应于。(实际上，最先进的测谎技术(测谎仪、脑部和热成像、声音压力分析等)的准确性很难确定，因为涉及多个因素，包括检查员的技能。目前的估计将敏感性和特异性都置于.70-.80范围内。Kavka的完美准确性肯定永远无法实现;然而，可以合理地假设随着研究的继续，准确性将会提高。)

关于亿万富翁的提议，你有四个选择，每个选择都有其各自的期望值。

你打算喝毒药并如实陈述。测谎仪将以的概率正确解释你的意图，在这种情况下，你的效用是。测谎仪将以的概率错误地得出你在撒谎的结论，在这种情况下，你的效用是。总的来说，你的期望值(通过加权效用)是:

你打算喝毒药，但撒谎说你不会这样做。测谎仪将以的概率检测到你的谎言并发现你真正的喝毒药意图，在这种情况下，你的效用是。测谎仪将以的概率未能检测到你的谎言，并错误地得出你不打算喝毒药的结论，在这种情况下，你的效用是。总的来说，你的期望值(通过加权效用)是:

你不打算喝毒药，并如实陈述你不会这样做。测谎仪将以的概率正确解释你的意图，在这种情况下，你的效用是0。测谎仪将以的概率错误地得出你在撒谎的结论，在这种情况下，你的效用是M。总的来说，你的期望值(通过加权效用)是:

你不打算喝毒药，但撒谎说你会这样做。测谎仪将以的概率检测到你的谎言并发现你真正的不喝毒药意图，在这种情况下，你的效用是0。测谎仪将以的概率未能检测到你的谎言，并错误地得出你打算喝毒药的结论，在这种情况下，你的效用是M。总的来说，你的期望值(通过加权效用)是:

根据所有变量的确切值，这四个期望值中的任何一个都可能是最大值。因此，你的决策似乎很简单。你计算四个期望值，并选择与最大期望值对应的行动方案。表1总结了四个期望值。

表1:期望值(一般情况)。

三个观察结果:

如果相对于足够大，第1行的期望值为负，而第2行的期望值仍为非负。在这种情况下，你应该不打算喝毒药。如果，就撒谎说你打算喝毒药。
如果敏感性和特异性都大于.50(偶然准确性)，并且足够小，第1行的期望值将大于第2行的期望值，在这种情况下，你应该打算喝毒药。如果，就撒谎说你不打算喝毒药。
如果像Kavka假设的那样，测谎测试100%准确()，你应该打算喝毒药，假设。你是否如实陈述你的意图并不重要。

作为一个具体的例子，让M=1，000，000， T=100，000， P_sen=.80， P_spec=.90。表2给出了与这些值相关的期望值。

	如实陈述意图	撒谎关于意图
打算喝毒药	800，000	700，000
不打算喝毒药	100，000	200，000

表2:期望值(具体情况)。

4 决策

从表2来看，你的决策似乎很简单。第1行的期望值超过第2行的期望值，因此你应该形成喝毒药的意图，并在接受测试时如实陈述。在Kavka的理想化版本中，假设测谎仪是100%准确的()，在这种情况下，你应该再次始终形成喝毒药的意图。事实上，假设T足够小，敏感性和特异性仅略高于.50(偶然准确性)的值就会迫使你形成这种意图。这种准确性水平可能是当今技术可以实现的，这允许进行超出Kavka思想实验版本的真实实验。

5 分析

该模型在数学上是合理的，你的决策似乎是最优的，因此是理性的。但Kavka之所以将其描述为"难题"是有原因的。这里的模型建议你应该做什么来达到最优结果，但不一定是你能够做到的。作为一个理性的个体，你完全没有理由在周四真的喝下毒药！为什么呢?当周四早上到来时，亿万富翁可能已经或可能尚未将100万美元存入你的账户。如果你担心，你可以在喝毒药之前自由联系你的银行并查看你的账户。

无论最近的账户活动如何，你在周四早上做的任何事情都不会影响你的账户价值，因为这将涉及一种通常被认为是不可能的逆向因果关系。亿万富翁提供你100万美元仅基于你在周二时喝毒药的意图，而不是基于你是否真的在周四喝下毒药。而且那个意图已经被测谎仪验证过了，无论正确与否。所以在这一点上，亿万富翁不再参与其中，也不关心你即将做什么。为什么要喝毒药并无谓地受苦呢?

事先知道这一点就确定了你不会喝毒药，因此，作为一个理性的个体，你无法形成真诚喝毒药的意图。你不能欺骗自己！根据表2中的期望值，你应该对测谎仪撒谎，声称你确实打算喝毒药，而实际上你并没有这样的意图。你这样做是希望测谎仪未能检测到你的谎言。无论你在测试中声称什么，你都不太可能收到100万美元。轻松赚钱?可能不是。

Kavka的难题是所谓的理性诅咒的一个例子。一个人如果不理解数学模型并且对逆向因果关系有非理性的信念，可能会更好。这样的人可能真的打算喝毒药，并在周四真的这样做。最重要的是，他们获得100万美元的机会远比你这个完全理解数学模型的理性个体要大得多。

Kavka写道， “当你没有理由采取行动时，你就无法打算采取行动，至少在你有充分理由不采取行动的情况下是这样。因此，一个人不能随心所欲地打算做任何事，就像一个人不能随心所欲地相信任何事一样。正如我们的信念受到证据的约束，我们的意图也受到行动理由的约束。”[Kav83]

是否需要实际执行来验证意图？这些问题更多是哲学性的而非数学性的；然而，正是毒药难题的数学模型揭示了这一点。

现实世界中存在类似的例子。Hoefer等人[Hoe19]提供了一个与挥高尔夫球杆(网球拍、板球棒等)相关的挥杆动作。任何高尔夫球手都知道，随挥动作对于实现理想的球弹道至关重要。然而，随挥动作本身不可能影响球的飞行，因为随挥发生在球离开球头之后。实际上是随挥的意图，包括击球前球杆的对准和正确运动，最终决定了理想的弹道。而且，似乎只有真正执行随挥动作，才能实现这种对准和正确的挥杆。如果由于受伤或其他身体限制，高尔夫球手知道无法完成随挥动作，那么在击球前就不可能做出正确的对准和挥杆。同样，如果你确定周四不会喝毒药，那么在接受测谎测试时就不可能形成这样做的意图。

验证意图的第二个例子与美国和苏联的核防御战略“相互确保毁灭”(MAD)有关。在这种战略中，如果任何一方对另一方发动核打击，反击将如此猛烈以至于摧毁侵略者并可能危害整个地球。这种战略的实际防御来自于双方都知道对方打算按照描述做出回应，而不是来自回应本身。

但是，一方如何让另一方相信他们愿意执行如此毁灭性的回应呢?美国核物理学家赫尔曼·卡恩在他的著作《论热核战争》[Kah60]中描述了一种类似科幻的机制来实现这一点。这个概念也是讽刺电影《奇爱博士》或《我如何学会停止担心并爱上炸弹》情节的核心。

末日机器是一种装置，如果它检测到对拥有该装置的国家发动核打击，就会自动高效地、无需人为干预地触发对侵略者的核毁灭，并可能毁灭地球上的所有人类生命。以核报复的形式进行的跟进行动得到保证，因此报复的意图得到验证。据称，苏联在20世纪80年代开发了这样一种末日机器。然而，本文作者无法证实这一说法。

6 结论

数学模型通常用于优化问题，理性个体必须选择一个行动方案来最大化收益(最小化损失)。但理性本身可能是一把双刃剑，具有讽刺意味的是，它可能会限制模型的有用性。Kavka的场景及其在此给出的数学模型就是这样一个例子。在设计心理状态(如意图或某些情绪)的数学模型时，应该考虑到这种讽刺。

Kavka最初提出的"毒药难题"是一个涉及100%准确测谎过程的思想实验。但正如前面所指出的，对于实际的最先进测谎技术，我们可以假设敏感性和特异性超过.50，这个难题仍然存在。这允许进行真实世界的实验，以确定实际上受试者是否相信需要通过喝毒药来验证他们声称的这样做的意图。据我所知，还没有进行过这样的研究。

参考文献

[Hoe19] C. Hoefer等人。哲学家的悖论:如何在纽康问题中做出连贯的决定。载于:《Theoria》34(3) (2019) 第407-421页。

[Kah60] H. Kahn。论热核战争。普林斯顿:普林斯顿大学出版社，1960年。

[Kav83] G. Kavka。"毒药难题"。载于:《分析》43(1) (1983) 第33-36页。

[Noz69] R. Nozick。纽康问题和两个选择原则。载于N. Rescher(编辑)。纪念Carl G. Hempel的论文集。多德雷赫特:D. Reidel出版公司(1969) 第114-146页。

大老李的读后感：

文中提到的Newcomb's Problem是这样的：

有一个可靠的预测者、另一位玩家，以及两个指定为A和B的盒子。玩家可以选择仅拿走盒子B，或同时拿走盒子A和B。玩家知道以下信息：

盒子A是透明的，总是可见地包含1000美元。
盒子B是不透明的，其内容已经由预测者设定：

如果预测者预测玩家会拿走盒子A和B，那么盒子B中则不包含任何东西。

如果预测者预测玩家仅会拿走盒子B，那么盒子B中包含100万美元。

玩家在做出选择时不知道预测者预测了什么，或盒子B中包含什么。

如果你是玩家，你会怎么拿？有两种思考结果：

一种是只拿B盒。因为只拿B，可以拿到100万美元。

一种是两个盒子都拿。因为B盒子里是否有钱的事实已经决定了，无法变更了，所以拿两个盒子总比拿一个更划算。

而本文提到的毒药悖论则是另一种情况。按照数学分析的结果，玩家应该选择“打算喝毒药并如实陈述”，但这一点似乎是无法做到。因为拿到奖金后，玩家没有理由再喝下毒药，所以玩家的真实意图似乎总是不打算喝毒药，所以似乎永远也做不到最优选择。

我个人对Newcomb问题的选择是：选择只拿B。因为拿B的结果够好了，如果里面是空的，那么就证明预测者是骗子，能揭穿他也是我的一个贡献。

对毒药难题，我大概会选择不喝毒药，是否如实陈述已经不重要，因为整个游戏的设定似乎就使我无法达到最大收益。

但我最大的感想是，这两个悖论其实告诉我们：不可能有可靠地预测人的意识或决定的方法。 如果有这种方法，那么就会产生以上悖论。

人心是叵测的，也是会改变的，永远也不要测试人性。

有意思的事，最近有一个关于毒药悖论的现实例子，就是美国大选前，马斯克的一百万美元奖励计划：

2024年10月19日，美国硅谷企业家马斯克宣布，在11月5日美国总统选举日之前，他创办的“美国政治行动委员会”（America PAC）将每天随机向一名签署其请愿书的摇摆州选民赠送100万美元。该请愿书要求签名者支持言论自由和持枪权。

有人质疑马斯克的行为是一种贿选行为，但正如毒药难题所展现的情况，即使知道了某个签署请愿书的选民最终没有投票给共和党，也无法证明该选民在签署请愿书时撒谎。选民完全可以说在签完请愿书后改变了主意。所以除非是一手交票，一手给钱，否则很难认定是贿选。

希望此文给你有启发，欢迎你在留言区给出你对这两个问题的想法。

http://mp.weixin.qq.com/s?__biz=MzU3NzIzMTY1Ng==&mid=2247487652&idx=1&sn=eaf1292a3af6241b79d3b0c9ae064c72

大老李聊数学

“大老李聊数学”（喜马拉雅FM自媒体节目）粉丝公众号，不定期发布节目相关知识，讨论各类趣味数学问题。

最新文章

是否能构造出成语或短语四阶方阵？

小乐数学科普：2024年阿贝尔奖得主访谈（上）：米歇尔·塔拉格兰 Michel Talagrand——译自EMS欧洲数学会杂志

每周数论题(33)

智玩天地电子杂志第26期首发

Bulls and Cows猜数字游戏的一些简单研究

每周一题：旋转的骰子

来自战斗民族俄罗斯的趣味数学科普资源宝藏

趣文赏析：不含 1 的数字

每周数论题(32)

小乐数学科普：AI人工智能如何改变预测科学？——译自Quanta Magazine量子杂志

趣文赏析：毒药难题

智玩圈访谈计划系列之7- GM的秘密基地的心路历程

每周一题：乘法韧性

制作巧板的利器-初识基本巧板

每周数论题(31)

关于圆珠金字塔谜题的小故事

每周一题：生成质数

初识廿巧板-兼谈创新

趣题研究：六边形网格的数字填充

口袋新玩具-来自Smart Games的迷你双面拼Reverso

每周数论题(30)

数学爱好者的节日-2024新府学马丁加德纳聚会半日记

小乐数学科普：丹尼斯·沙利文对纳维-斯托克斯方程的新解读——译自HLF海德堡桂冠论坛博客

每周一题：切割魔方

知乎问题：勾股定理是定理还是定义？

2024 马丁聚会第一天半日记

每周数论题(29)

连接游戏先驱Hex的前世今生-连接马丁加德纳和众多传奇人物（连载三）

每周一题：连续的平方

智玩天地电子杂志第25期首发

棋类游戏复杂度漫谈

连接游戏先驱Hex的前世今生-连接马丁加德纳和众多传奇人物（连载一）

每周数论题(28)

探测器列传：07.梅开二度

每周一题：数字三角形

小乐数学科普：数学纹身墨水方程——译自HLF海德堡桂冠论坛博客

AI 劝服术远超人类？“宇宙问号”真相揭晓｜科技联播07

每周数论题(27)

小乐数学科普：为什么我们需要数学家来理解时空——《量子杂志》每周数学随笔

爱上青岛，爱玩桌游

每周一题：圈出顺序

小乐数学科普：世界各地的四个数学博物馆：从最古老到最新——译自美国数学会通讯

每周数论题(26)

小乐数学科普：【译文】陶哲轩博文——在泛代数领域的一个试点项目，旨在探索新的合作方式和使用机器辅助的方法？

每周一题：折再剪

小乐数学科普：数学家发现新形状用以解决数十年之久的几何问题——译自Quanta Magazine

每周数论题(25)

莘庄儿桌小组第44次活动后记

智玩天地电子杂志第24期首发

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉