我们追求的“确定性”到底是什么

2024-03-21 10:48   上海  

近些年在各种官方的媒体口径中,经济发展的“确定性”成为了一个高频词汇。对此有一种显而易见的反驳:在确定的较差结果和不确定的较好结果之间,一般还是宁可接受不确定性也要追求较好结果。用简单的数学模型表示,不妨假设追求的结果是正态分布,“较好结果”对应较高的期望值,确定性对应较低的标准差,如图所示:


图1:期望值-0.4、标准差0.8(红色)和期望值+0.4、标准差1.5(蓝色)的概率密度(1a)和累计概率(1b)。

可以直观地看出,高期望值、低确定性的分布中,极端不利结果发生的概率较高,但是总体还是优于低期望值、高确定性的分布。只有当目标在避免极端风险(图1b白色区间)时才会选择前者。

如果不确定性可以简单地描述为某种分布中的标准差,那也没有讨论的必要了。最新的心理学研究表明,人类对于不确定性的感知远不止于此。虽然实验条件尚不足以得出确切的结论,初步结果显示,正是这些高阶的不确定性和人类的焦虑等精神障碍密切相关。

潜在变量的不确定性

人类感知世界时获取的信息是片面的。当人专注于某一个变量时,通过不断的感知能够大概了解该变量的分布,或者表面的不确定性。但是,当该变量的分布取决于另一个未被观测的变量时,后者(称为潜在变量或潜在状态)就会给人的主观感受带来更大的不确定性。这么说未免有些抽象,不妨举个例子:

甲每天乘坐地铁一号线通勤。在正常运行条件下发车间隔为5分钟,但是如果线路故障,发车的间隔会延长到30分钟。对于甲而言,候车时间当然是可观测的变量;而地铁线路是否故障虽然无法直接观测,但是影响甲候车时间的分布,因此是个典型的潜在变量。

在这个场景中,甲能感受到两种不同的不确定性:即使甲明知今日地铁线路正常,5分钟以内到底等多久仍然是一种不确定性,但这个不确定性是甲可以预期的。而实际情况下,甲对于今日地铁线路是否正常也是不确定的,而且由于无法直接观测,甲无法对这个概率形成稳定预期,继而影响对于候车时间的预期(如图2)。如果要形成对于候车时间的稳定预期,只能作最不利假设,认为候车时间在30分钟内均匀分布——这显然不是最佳的策略。有没有更好的策略呢?


图2:甲可能形成的关于候车时间的预期。橙色较乐观,蓝色较悲观。

还是有的。人是一个善于学习的动物,因此虽然无法直接观测,也能够通过观测到的变量推测潜在变量,然后根据推测的潜在变量形成对可观测变量的预期。在本例中,如果候车时间超过5分钟,甲就有理由推测今天的地铁线路出现了故障。但是候车时间在5分钟以内时,根据甲目前推测的地铁线路故障的概率(又称先验概率),关于今天线路是否故障的推测也不同。相应地,根据新的信息形成对于地铁线路故障概率新的估测(又称后验概率)也会不同。

一个重要的结论是,先验概率越极端,后验概率就越接近先验概率。例如先验故障率为99%时,即使候车时间在5分钟以内,也可以推断为虽然故障但是运气好。有兴趣的读者可以自行进行更严谨的验算。因此,经历了大量的学习后(使得先验概率大致等于实际的潜在变量概率分布),潜在变量越不确定,人对于可观测概率的预期也就越不稳定。

时间维度的不确定性

继续上面的例子。上述讨论的一个局限在于仅取了一个时间截面,讨论甲当日对于候车时间的不确定性。把连续的一段时间看作一个整体,就能在以下两例中找到细微的区别(举例比较夸张,不代表真实地铁保障水平):

1.      地铁线路每次故障都得维修一周,但是可以保证接下来一个月内正常运营。

2.      地铁线路每次故障都能在1-2日内修好,但是每周都会故障一两次。

虽然两种情况下地铁线路的故障率大致相当,但是一般人直观感受肯定宁愿选择第一种,第二种总会给人一种提心吊胆的感觉。计算机模拟也的确证明,在这两种情况下,虽然地铁的故障率相同,但是最佳策略却不同。这种不同体现在学习速率上。在心理学中的Rescorla-Wagner理论意义上,较高的学习速率表示最近的事件对于将来的预期占有更高的权重,而较低的学习速率表示更久远的信息也能影响对将来的预期,如图所示:


图3:分布的稳定性不同时,理想的学习速率也不同。纵轴表示实际和预期的发车间隔。红色为低学习速率,蓝色为高学习速率,黑色为实际的发车间隔。

可以看出,在第2个场景中,由于地铁的故障率在时间上不稳定,因此用较高的学习速率(仅依照最近一天的候车时间推测第二天的候车时间)更贴近实际;对于故障率在时间上更稳定的第1个场景则恰恰相反。

以上讨论的时间维度的不确定性并不需要观测变量(候车时间)对应一个可具象化的潜在变量(地铁故障)。对于任意分布随时间变化的变量而言,更高的时间稳定性都会对应更低的理想学习速率,如图所示:


图4:一个随机生成的分布,横轴为时间,纵轴为实际取值,右侧的直方图表示该变量在所有时间点的总体分布。

虽然两张图内该变量的总体分布完全相同,但是第二张显然时间上更稳定。通过仔细观察可以发现一个更广泛的结论:对于第一种时间上不稳定的分布,每一个时间点内可测得的不确定性(方差)都不能完全解释总体分布的不确定性(方差)。因此时间上不稳定的分布会带来超预期的不确定性,而较高的学习速率正是针对此超预期不确定性的一种应对策略。

高阶不确定性与焦虑

从实验角度,更高的学习速率意味着受试者更有可能受小概率结果的误导而短暂放弃理想的策略,直到遇到大概率结果后再重回理想策略。因此,对于实验结果的概率分布在时间上稳定的心理测验,此类受试者反而表现不如采用更低学习速率的受试者。于是产生了一个自然的理论假说:具有高焦虑特质(和焦虑状态对应)的人会采用更高的学习速率。

由于学习速率需要估测,误差自然大于直接测量的被试者反应,验证该理论假说的实验至今寥寥无几。Browning et al (2015) 采用了一种经典的二选一操作性条件反射(例如选择A有80%可能被电击、选择B有20%可能被电击),在两部分实验中分别是各选项导致电击的概率恒定/不断变换。通过对比两部分实验的结果,该文作者初步证明了上述假说:具有高焦虑特质的被试者不论对于时间上是否稳定的场景/分布都会采用更高的学习速率,而低焦虑特质者会更好地根据每个场景的时间稳定性调整其学习速率。

而Guitart-Masip et al (2023) 最新的研究采用了类似的二选一设计,但是各选项和被试收到的奖励相关(而不是电击惩罚)。结果表明,在疫情中感受到不可控压力的群体对于小概率反馈(选择正确选项但未收到奖励)的反应更为强烈,更有可能据此改为选择错误选项。相应地,虽然两个选项和奖励相关的概率恒定,但是上述群体的总体表现更差(如图5a)。具有更高焦虑特质的群体在实验中的行为与此高度相似(如图5b)。


图5:按照 (a) 疫情中感受到的不可控压力或 (b) 焦虑特质的中位数进行二分,两部分人群在该实验中的学习曲线对比。原文为开源文献。

结语

随着心理学理论和实验技术的推进,人类对于不确定性感知的各个方面正在逐渐清晰。除了最简单的某个变量在特定时间点的分布,人类强大的学习能力使得人也能感知潜在因素的不确定性,和随时间变化的不确定性。对这类高阶的不确定性的感知理论上可以影响人类的决策、实际上也已有初步验证。区分这类高阶不确定性和简单分布意义上的不确定性对于人类决策的影响力是进一步心理学研究的重要课题。相关实验结果可能可以为焦虑等精神障碍的治疗带来新的前景,也可能进一步充实人对于“不确定性”概念的理解。至于这种新的“不确定性”概念在经济领域有何意义,笔者作为外行就不再大放厥词了。

本文参考的核心文献为https://doi.org/10.1016/j.tics.2019.07.007,点击“阅读原文”查看。


其他文献:

[1] https://doi.org/10.1038/nn.3961

[2] https://doi.org/10.1038/s41598-023-45179-z

Meditatio
在疯狂中沉思, 在沉思中疯狂. Sanitas insana, Sapientia stulta.