Nature Human Behaviour
包括符号性选项的决策中经验价值的权重较低
Experiential values are underweighted in decisions involving symbolic options
摘要
在进行混合决策时,人们是更多根据已有经验还是根据明确的描述,或者结合两者价值共同决定?针对这一问题,近期Nature Human Behavior的一项工作设计了一系列研究,发现在进行混合决策时,人们会忽略经验价值的有趣现象。
Introduction
引言
经济决策的标准模型通常假定决策过程有两步,人们先根据自己的主观判断评估并分配不同选项的价值,然后选择具有最高主观价值的选项。在此过程中,判断不同选项的价值有不同的依据。一方面,先验的中性刺激可以在与过去的经历(奖励和惩罚)相关联后获得积极或消极的经验价值。另一方面,这一选项所能带来的可能结果及其概率的明确描述被结合起来形成一个主观的期望价值(EV)。这种明确的描述可能有许多不同的形式,包括书面语言(配图或数字),传达与决策变量相关信息(报酬和概率)的符号代码,或两者的组合。日常生活中,人们通常也会借助不同来源的信息来辅助决策。试想一下,在选择餐厅时,你是更倾向于依据经验选择你平日里就餐体验很好的那家,还是一个在人群中评分很高的新餐厅呢?
在标准的两步决策模型中,选项价值的建立方式(通过经验或描述)只是决策过程本身的外围,实际上,经验和符号价值会聚到一个中央评估和决策系统。中央评估系统的核心属性是它有能力在给定的选择集中编码所有可能选项(无论这些选项有多大差别)的主观价值或效用,这对于在任何选项集中做出选择都是必要的。
中央评估系统并不关心识别和表征可能选项所需的上游计算,也不关心选择行动所需的下游计算。因此,在经验性选项(E-options)和符号性选项(S-options)之间的做出决策不难,因为它们的价值都被转化为一种相通的内部货币,使其可在不同的选项间进行无偏比较。而在大脑评估系统中,经验价值和符号价值的神经关联在很大程度上重叠,间接支持了中央评估系统的假说。
然而,行为决策研究中的一些证据对中央评估系统提出了质疑。已有证据表明,基于经验的决策和基于描述的决策显示出不同的属性,这种现象被称为描述-经验差距。这表明两类决策存在着特异性模式,依赖于不同的认知表征的评价系统,这种特异性表征会阻碍经验性选项和符号性选项之间的价值比较。
但目前很少有实验证据评估经验价值和符号价值的可通达性,或它们是如何映射到中央评估系统或不同的评价系统中的。回到之前选择餐厅的例子,在真正进行决策时,人们似乎会更倾向于将自己的经验与他人的评价描述同时纳入考虑,即为混合决策(综合了经验的决策和基于描述的决策)。
针对这一问题,该研究设计了一系列实验进行验证。
Method
方法
图1:实验流程示意图
如图1所示,实验由4个阶段构成。下面将对每个阶段的任务进行介绍:
1.LE阶段:
被试首先进行了一个学习任务(LE)。如图2所示,被试需要在一对图形选项(E-options)中选择一个。如图3所示,每对选项都有固定的获得/失去1分的概率,在任务中选择有更高获胜概率的图形即可获得赢得1分(+1),否则就失去1分(-1)。分数的高低决定了被试最终的报酬。
被试需要在任务中学习不同选项的价值,即获得每个选项的经验价值,并做出正确的决策使自己得到尽量多的报酬。
图2:学习(LE)阶段示例,呈现一对选项,被试选择后呈现900-1000ms的过度画面,之后呈现结果(1400-1500ms)。
图3:不同图形(E)选项对应的获得/失去1分的概率。绿色为该选项获得1分(+1)的概率,红色为失去1分(-1)的概率。
2.经验性和符号性选项之间进行选择(ES choices)。
在LE阶段之后,被试需要在经验性(E)选项与符号性的选项(S-options)间进行决策(图4)。符号性(S)选项以饼图的形式呈现,其中绿色表示该选项赢得一分的概率,红色表示失去一分的概率。被试需要结合在LE阶段学习的E选项的经验价值,在E选项和S选项中选出获胜概率更高的选项,使自己获得更多的报酬。
图4:ES阶段,被试需要在学习过的经验性选项和符号性选项间进行选择,符号性选项为饼图,标明选择该选项后获得/失去1分的概率。
E选项与S选项可能的概率值如图5所示。
图5:E选项与S选项可能的概率值
3.在经验性(E)选项之间做出选择(EE choices)
这类决策出现在实验5-9中。
将每个E选项分别与其他7个E选项进行对比。在实验5-9中,EE和ES的组合如图6a所示,且ES阶段与EE阶段交错进行(图6b)。
图6:(a)在实验5-9中EE选项与ES选项示列,橙色方框为ES选项,绿色方框为EE选项;(b)实验5-9中实验顺序,橙色代表ES决策,绿色代表EE决策,两种交错进行,顺序随机,且EE选择中每一E选项集中在同一组块中呈现。
SP评估
在完成所有任务后,被试需要对LE阶段的E选项获胜的概率进行评分。“这个符号出现后得到+1的几率有多大?”,被试将从0%到100%间进行评分。
summary
假设
实验中呈现的是由经验和有饼图代表的符号信息的混合决策,对于被试会根据哪些信息进行决策,如何处理不同来源的信息价值,研究者提出的备选假设是:
1.共同货币假设:E选项和S选项的价值被同等考虑,被试应该在ES阶段做出无偏的决策。因此,选择E选项的概率将由E选项和S选项的EV共同决定(图7,左)。
2.表征差距假设:主观价值以特定模式的方式被建构和表征,E和S选项的价值不会被同时考虑。这种情况会导致两种可能的情况:
(1)随机选择;
(2)被试会优先考虑其中一个信息,这又会出现两种可能的情况;
a) 经验价值忽略:根据明确的描述(S选项)进行选择,而E选项的价值被忽略(图7,中间);
b) 符号价值忽略;被试会表现出对经验价值的过度依赖,即只根据E选项的价值而不考虑S选项的价值(图7,右)。
图7:被试如何在ES阶段做出选择的三种可能的假设。在每张图中,选择E选项的概率与S选项的价值相对应。插图代表无差别点(曲线与50%交叉的地方)。曲线的颜色表示E选项的价值(最低:浅橙色;最高:深橙色)。左边是共同货币假设,中间是经验价值忽略假设,右边是描述信息价值忽视的情况。
Results
结果
实验1:经验价值忽略
在实验1的LE阶段(n = 76),随机呈现成对的E选项。如图8a所示,除了最困难的学习情境(60%/40%)外,在所有决策中,选择的准确性都显著高于随机水平,表明被试都努力使EV最大化。此外,准确率受E选项对的EV值(即决策值)的影响。选择的准确性随着两选项获胜概率差值的增加而增加,在90/10的选项对中正确率最高,从而表明被试对特定的E选项对中特定的EV是敏感的。
图8:实验1-4结果。(a)不同概率的E选项对的正确率。(b)在ES阶段S选项不同胜率下选择E选项的概率。曲线的颜色表示E选项的价值(最低:浅橙色;最高:深橙色)。圆点为经验性信息的无差别点。(c)每个符号的推断值(用赢的概率表示;P(win))和实际值的函数。ES推断值用橙色表示,LE推断值用蓝色表示,SP推断值用粉红色表示。(d)三个阶段(LE、ES和SP分别为蓝色、橙色和粉色)从线性拟合(见c)中得到的单个推断斜率的比较。
ES阶段的分析证明,尽管在LE阶段明确证明了E选项的价值的成功学习和编码,但ES阶段的选择模式与经验性价值忽略的情况一致(图8b,左)。
实验通过E选项赢得1分的概率P(win)对两种选择类型中每个E选项的理论主观价值进行评估。并使用线性回归的斜率估计,计算每个阶段的主观P(win)估计与客观基础概率的匹配程度。
其中斜率等于1对应于E选项的P(win)的无偏差表征,而斜率等于0则对应于随机选择。结果显示,LE阶段的斜率显著高于ES阶段的斜率,且更接近1。从而证实了经验价值忽略的假说。
实验2-4:排除学习和遗忘的可能
为了防止由于学习不足或遗忘而导致的对经验价值的忽略,研究者进行了实验2-4。
在实验2(n=71)中,LE阶段的选项对以固定方式呈现而非实验1中的随机呈现,通过防止工作记忆的饱和来提高成绩和选项识别率。
实验3中(n = 83)还提供了未选择的选项的结果信息—这样能提高准确性。
在这些变化操控的基础上,在实验4(n = 88)将LE阶段的选项对的数量由4对减少到2对。
在这些实验中,LE阶段的准确性的显著提高(是实验1的107-124%),但并没有影响ES阶段的选择(图8b)。即尽管有关E选项价值的不确定性大大降低,但经验性信息价值忽视的模式仍然存在。
同样,如图8所示,LE阶段的推断斜率在各次实验中都有明显增加,证实了这些操作有效提高了学习的效率。但在所有的实验中,LE阶段的推断斜率都显著高于ES的斜率(图8d)。
前四个实验表明,经验值忽略并不仅仅是学习不足的影响。在学习阶段表现的提高并没有转化为经验值忽视效应的类似减少。
实验5、6:排除了缺乏概括性和训练的可能
在实验5 (n = 71)和实验6(n = 66)中,在LE阶段之后,研究者将ES选项与EE选项交错在一起,以所有可能的组合呈现出来(图6),以确保被试对E选项进行了充分的概括并能应用到新决策中。
实验6增添了第二个循环,重复了所有阶段(LE、ES和SP),以排除被试对新任务产生好奇而导致的偏差。其中第二个循环中的E选项是由一组新的符号构成的。
结果显示,被试能够成功地将E选项的价值推断到涉及其他E选项的新决策问题上。同时,ES决策依然出现经验价值忽略的情况(图9a)。
在实验5和实验6中,EE推断的斜率一直明显高于ES的斜率。即ES决策是在忽略了EE决策中原本使用过的信息的情况下做出的。
且在实验6中,第二轮EE与ES阶段的结果同第一轮没有显著差异。被试并没有在第二轮实验中改变策略。
图9: 实验5和6结果。(a)在ES阶段S选项不同胜率下选择E选项的概率。曲线的颜色表示E选项的价值(最低:浅橙色;最高:深橙色)。圆点代表经验性信息的无差别点。实验6.1和实验6.2分别指的是第一个和第二个环节。(b)在EE阶段在ES阶段E选项不同胜率下选择另一个E选项的概率。曲线的颜色表示E选项的价值(最低:浅橙色;最高:深橙色)。圆点代表经验性信息的无差别点;曲线的颜色表示E选项的价值(最低:浅绿色;最高:深绿色)。圆点为经验无差别点;(c)每个符号的推断值(由获胜概率表示;P(win))和实际值的函数。ES估计值用橙色表示,EE估计值用绿色表示;(d)比较两种模式下线性拟合(c)中获得的单个推断斜率(ES和EE分别为橙色和绿色)。*** P < 0.001。
实验7:排除理性忽视
如果E选项的信息处理(例如,记忆访问或检索)是费时费力的,或者忽视E选项并不明显阻碍决策表现,那这样的忽略便是明智的。
为了评估这种可能性,研究者进行了模拟,采用极端的经验忽视方法对实验1-6中的ES阶段的选项进行决策,发现仍然能在77%的情况下做出预期价值最大化的选择。这表明,经验价值忽略可能是一种理性的启发式策略。
图10:实验6、7结果比较。(a)实验1-6中的选项获胜概率与实验7的对比;(b)实验7中S选项不同胜率下选择E选项的概率。曲线的颜色表示E选项的价值(最低:浅橙色;最高:深橙色);(c)实验6、7的ES阶段期望价值最大化的选择对比。*** P < 0.001;(d)在EE阶段E选项不同胜率下选择另一个E选项的概率。曲线的颜色表示E选项的价值(最低:浅绿色;最高:深绿色);(e)实验6和7期望价值最大化的选择的对比。*** P < 0.001;(f)每个选项的推断概率(用获胜概率表示;P(win))与实际概率的函数。ES推断概率用橙色表示,EE推断概率用绿色表示。(g)两个阶段(ES和EE:分别为橙色和绿色)中从线性拟合(f)中得到的单个推断斜率。*** P < 0.001。
为了检验这种解释,进行了实验7。在这个实验中,改变E和S选择的概率,使一半的E选项的期望价值值高于所有的S选项,反之,另一半的EV值较低,这使得忽视经验信息对获得报酬不利(图10a)。但尽管如此,ES阶段的行为模式仍然与经验价值忽略的情况一致(图10b)。
与实验6相比,在实验7中,EE选择的准确性保持不变(图10d,e),但ES选择的准确性显著下降(10c)。即虽然忽略经验价值会导致获得的报酬减少,但被试在决策中仍未考虑经验价值。
这一结果排除了理性忽略的解释。
实验8:排除模糊性厌恶
为了排除被试是因E选项信息更模糊而将其忽略,研究者设计了实验。
研究者采用了无明确获胜概率的S选项(即无明确概率的饼图)(见图11)。结果表明,实验8的结果同之前的实验一致,表现出对经验价值的忽略,因此厌恶模糊性并不能解释对经验价值的忽略。
图11: 实验8结果。(a)上图为经验-模糊(EA)阶段实验示列,下图为符号-模糊阶段(SA)实验示列;(b) 在E选项(上图)或S选项(下图)不同的获胜概率下选择模糊选项(A选项)的平均概率;(c) 比较三种模式下从线性拟合得到的单个推断斜率(LE,ES和EE,分别为蓝色、橙色和绿色)。
反应时分析
通过以上的实验,研究者用一系列相对可靠的结果揭示了ES决策主导的经验价值忽略决策过程。对这一现象的一种可能的解释是,基于EE的决策过程或许更为复杂,其中可能涉及记忆的编码及提取,需要调用更多的认知资源来帮助决策;而相比之下基于ES的选择过程就要直观、迅速的多。为了验证这种可能性,研究者比较了EE和ES选择的反应时间。
结果发现,无论是选择S选项(ESs)还是选择E选项(ESe),ES决策都显著快于EE决策(图12b、c)。在ES决策中,ESe的决策也比ESs的决策更慢,这可能表明,选择E选项需要额外的处理来检索和表示E选项的价值。
为了证实这一解释,研究者采用两种方法对ES决策进行模拟:一种是根据使用被试从LE阶段推断出的估计值的进行选择;另一种是采用完全的经验价值忽略的方式进行选择。
结果证明,采用经验价值忽略的ES决策明显快于只考虑LE阶段估计的E选项价值的选择(图12d)。因此,基于S选项价值的选择能够减少认知处理。
图12: 假设的决策模型和反应时间分析。(a)分别为EE和ES阶段的决策过程示意图。这两个过程的不同之处在于,在前一种情况下(EE),决策是基于检索两个选项的价值,而在后一种情况下(ES),在经验性价值忽略下,只有S选项的价值是重要的;(b)不同模式的反应时中位数。EE决策时间明显长于ES决策时间(无论在ES中采取何种选择)。当比较选择S选项时(ESs)和选择E选项时(ESe),也观察到明显的差异;(c)反应时差异(ESe-ESs为橙色;EE-ESs为绿色);(d)ES选择由经验价值忽视方式(红色)来决策的反应时和只由从LE阶段估计的经验价值来决策(深蓝色)的函数。*P<0.05,**P<0.01,***P<0.001
summary
总结
研究结果表明,在混合决策中,个体对经验性价值和符号性价值并非同等考虑,而会更多地忽略经验价值。这表明人们在决策过程中针对不同来源的信息采用了不同的表征系统,并且赋予它们不同的优先级别。这些发现对基于价值的决策研究中常用的主导模式深具价值。
参考文献
Garcia, B., Lebreton, M., Bourgeois-Gironde, S., & Palminteri, S. (2023). Experiential values are underweighted in decisions involving symbolic options. Nature Human Behaviour. https://doi.org/10.1038/s41562-022-01496-3
文案:Shuhan
校对:Keyu, Haiyan
排版:Tianyan
Email:haiyanwu3@gmail.com