Journal Club | 对自我和他人信心的神经计算机制

文摘   科学   2022-11-10 12:30   中国澳门  


Nature communucations

对自我和他人信心的神经计算机制




      计算对自己和他人的决策的信心对于社会成功至关重要。虽然我们在理解人们对自己的信心估计方面已经有了实质性的进展,但对人们如何形成对他人的信心估计却知之甚少。在本次journal club介绍的一项来自Nature Communications的研究中,Dan Bang等人通过在fMRI中让被试完成对自己或他人的感知决策投注任务,发现对他人决策的信心计算(社会信心计算)结合了对决策难度和他人能力的估计。这种计算与涉及感知决策(LIP,MT+)和心理理论(theory of mind)的大脑(TPJ 和dmPFC)系统之间的相互作用有关,进而揭示了社会信心计算中自我和他人相关过程之间的相互作用。


Introduction


      适应性行为的一个关键特征是能够在没有即时反馈的情况下对我们的决策信心进行估计。近年来,我们对决策信心的理解取得了实质性进展。新兴的共识是,在计算层面,我们对决策的信心反映了使用贝叶斯推理计算出的选择正确的概率,在神经层面,前额叶皮层在计算决策信心,将这种内部估计映射到外显报告,以及将单次试验的信心估计整合到对任务表现的长期估计中起着核心作用。

      然而,人类是高度社会性的群体,在许多情况下,我们不仅要计算对自己决策的信心,还要计算对他人决策的信心,即社会信心计算。例如,在竞争性任务中,了解谁更可能成功有助于我们决定是否要继续竞争。社会信心的计算与自我信心的计算起点相同,即首先评估决策的难度。然而,仅仅通过模拟我们会做出什么样的选择以及我们对这个选择有多大的信心通常是不够的。我们还应该认识到他人的能力与自己不同,并对他人的能力进行评估。以前的研究解释了我们如何追踪他人的能力,但在计算对他人决策的信心时,我们是否或如何将关于自己对决策难度的评估与对他人能力的表征相结合仍然未知。

     整合决策难度和对他人能力估计时,对他人决策的信心可能涉及多个大脑系统。社会信心计算的第一个部分,决策难度的估计,在自我和社会信心的计算应该是相似的,因此可能得到相似的神经基础的支持,包括支持感觉处理的脑区,例如视觉运动区MT+、侧顶内沟(lateral intraparietal sulcus, LIP)。然而,仅靠自己的感官表征是不够的,因为它们不能反映他人感官系统的特征——即他人的感官噪音。因此引入了第二个部分,对他人能力的估计可能由心理理论(ToM)网络支持,包括颞顶联合区(TPJ)和背内侧前额叶皮层(dmPFC),被认为能够将自我与他人属性的表征区分开。

      为了验证以上假设,Dan Bang等人设计了一个实验范式,通过要求被试将赌注(post-decision wager,PDW)押在由自己(self-trials)或其他三个能力不同的参与者 (other-trials)所做的随机点运动任务(random dot motion task)的决策上,来识别社会信心计算的组成部分,并将行为分析与计算建模相结合。最终作者得到了一个ToM模型,并证明相比仅追踪决策难度或他人能力的其他替代模型,ToM模型与被试的决策后投注(PDWs)拟合更优。fMRI 结果表明 MT+/LIP 同等地加工自我和他人试次中的任务难度,而TPJ/dmPFC 则只在对他人信心/能力的加工中起作用。



Method


Experimental paradigm

      该研究采取随机点运动任务,设计了自我试次(self-trials)和他人试次(other-trials),均包含了决策阶段赌博阶段两部分。

图1 随机点运动任务


图2 实验程序示意图

      实验要求被试查看随机点运动(由运动连贯性θ决定的子集点沿运动方向移动,其余点随机移动)后,指出点运动的平均方向是水平向左还是向右(如图1)。在实验开始时,被试被告知他们将进行自我试次还是他人试次(如图2, instruction)。

      决策阶段(图2, decision phase):在自我试次中,被试必须主动判断点运动的平均方向;在他人试次中,被试在其他参与者做反应时被动观看运动刺激,并且被试没有被告知其他参与者此刻做出的决定。

      赌博阶段(图2, gamble phase):要求被试进行决策后下注(PDW),即在安全和风险选项之间进行选择。安全选项提供了少量但有保证的奖励(范围: 5-20个点数)。风险选项则会在正确时带来更大的奖励,在不正确时带来相应的损失(范围: 25-50个点数)。

      每个被试进行了3个run,包括120个试次(3×40 trials),其中每个run包含40个试次,20个自我试次和20次他人试次随机交错。在每个run中被试都与一位新的其他参与者配对,三个不同水平的其他参与者数据来自以往采集的数据集,在不同任务难度下平均达到了大约 60%(低能力)、75%(中等能力)和 90%(高能力)的选择准确率。

       被试被告知配对的其他参与者已在其他时间做出决定,并且研究的三个主要因素——运动连贯性他人的能力以及风险和安全选项之间的奖励差异——在设计上是不相关的。


Quantificant and statistical analysis



Quantification and statistical analysis

      使用多元逻辑回归来预测被试的决策后投注(PDW)。对每个被试进行单独回归,再将被试之间汇总的系数与零比较,来验证组水平的显著性(p < 0.05, 单样本t检验)。

Computational models of confidence

图3 在ToM模型下对自己和他人的信心计算图示

     

      感官样本:每个试次中,被试s会接收到一个感官样本,x,它是从高斯分布 

xN(ₘ, σₛ)中随机抽取的;

mM ={1,2...,n}

运动连贯性θΘ ={θ₁, θ₂, ..., θₙ}

运动方向 kK{-1,1}(-1:left; 1:right),n是连贯性水平数量,σₛ是被试感官噪音的水平。

      自我试次(Self-trials):使用贝叶斯决策理论对被试的自我试次信心进行建模(图4中的自我试次)。假设被试将刺激空间表征在一维坐标系中,每个运动刺激可由坐标方向和连贯性(坐标值)来表示。在每个试次中,被试会收到噪声感官证据——被建模为以真实的运动刺激为中心的高斯分布。然后被试根据感官证据和自己的知觉表征(对当前刺激运动方向的主观估计)计算对当前选择正确性的信心。

      他人试次(Other-trials):ToM模型假设被试通过将自己在刺激空间上的信念状态与其他参与者对每个运动刺激的预期准确性相结合来计算对他人决策的信心(图3中的他人试次)。对其他参与者的心理测量功能的信念的能力表征,来自对其他参与者的感官噪声的估计。该估计值在每个试次结束时根据观察到的与预测的其他参与者选择成功之间的差异进行更新(社会预测错误)。为了完整性,首先考虑一个自我投射模型(S-模型),假设对他人试次的信心仅受决策难度的影响,不受他人能力的影响。其次考虑一个绩效追踪模型(Q-模型),假设对他人试次的信心仅受他人能力的影响,不受决策难度的影响。

      他人试次:被试与三名不同能力的其他参与者配对。作者提出了三种可能的计算机制:

      自我投射模型(S-模型):假设被试将自我决策以及对这个决策的信心投射到其他参与者身上。该模型下,对他人试次的信心受决策难度的影响,但不受他人能力的影响。

      绩效追踪模型(Q-模型):假设被试根据历史选择准确性了解其他参与者的价值,并将该价值用作代表对他们决策的信心。模型符合Rescorla-Wagner 更新规则(如图3)。该模型下,对他人试次的信心受他人能力的影响,但不受决策难度的影响。

      心理理论模型(ToM-模型):估计任务难度的同时保持对另一个参与者的感官噪音的估计(即能力估计)——并综合计算对他人决策的信心。被试与其他参与者的感官样本之间没有共享误差方差(即没有噪声相关性)的情况下,被试对其他参与者成功的预测应该考虑到:(1)给定刺激采样的情况刺激处于某个状态的后验概率;(2)其他参与者在该刺激状态下的表现(即他们在每个状态下的预期准确性)。使用softmax函数对选择风险选项的概率进行建模(如图3)。



Results


图4 行为结果

      自我和他人试次的决策后下注:使用多元逻辑回归模型来预测被试的决策后下注,预测变量包括运动连贯性、奖励差异、他人能力以及试次类型与其他变量间的相互作用。分析表明被试选择风险选项的概率随着运动连贯性和奖励差异的提高而提高。他人能力的增加也能增加选择风险选项的概率,但只在他人试次中出现(图3c黄条),对自我试次没有影响(图3c蓝条)。整体被试更可能在自我试次中选择有风险的选项。被试没有被告知其他参与者的能力高低,而是需要从经验中学习。一个明显的学习信号是每个试次结束时的奖励反馈。根据这一假设,当其他参与者的先前选择是正确的时候,被试更有可能在其他参与者的选择上赌博(图3d黄条),自我试次中则不存在这种历史效应(图3d中的蓝条)。

      结果表明:(1)被试对自我和他人试次的决策难度和奖励特征同样敏感,并且(2)被试追踪其他参与者的能力并使用这些知识指导决策后下注。

      对自我和他人的信心的计算模型:初步行为结果表明,对其他参与者决策的信心既基于反映决策难度的自我相关成分,也基于反映其他参与者能力的他人相关成分,符合ToM过程。为了证实这种猜测,作者比较了不同综合信心计算与被试决策后下注(PDW)的候选模型。任务中,被试通过比较风险选项和安全选项的期望值来决定是否赌博。

ΔEV = EV(risky)-EV(safe) 。使用softmax对ΔEV和赌博选择之间的映射进行建模,以获得选择有风险选项的概率(如图4)。安全选项的期望值只是奖励的数量EV(safe)=V(safe)。风险选项的期望值是通过根据对正确选择的信心对风险奖励进行加权来计算的EV(risky) = P(correct) × V(risky) - [1-P(correct)] × V(risky)。

      最终胜出的是ToM模型,该模型为PDW提供了最佳拟合,捕获了行为数据的所有定性特征以及被试PDW的trial-by-trial的演变。ToM模型假设被试结合感官证据及其感官噪声(蓝色框)他人能力表征(黄色框)相结合来计算对他人的信心。他人能力表征——实际上是一种心理测量函数——从对其他参与者的感官噪声的估计中得出。该估计值在每次试验结束时使用Rescorla-Wagner 学习规则进行更新,该规则考虑了其他参与者选择的准确性以及对该选择正确的信心。由于这次更新,(他人能力表征)心理测量函数在正确选择(绿色)后变得更陡峭,在错误选择后变得更浅(红色)。

社会信心计算的神经基础

      以上行为和建模的结果支持ToM模型,被试通过整合决策难度和他人能力来计算他人决策信心。第一,决策难度与运动刺激,特别是运动连贯性直接相关:连贯性越高,决策越容易。第二,对他人能力的表征,必须与自己的能力分开,并从他人选择准确性的反馈中学习。

      因此,首先进行决策和赌博阶段自我和他人试次之间的全脑对比。全脑分析发现在决策阶段,自我 >他人对比发现了经典的感知决策区域(纹外皮层、后顶叶皮层和扣带皮层)和运动区域。在决策和赌博阶段,他人>自我都识别了经典的ToM网络,包括颞中回、颞顶联合区(TPJ)和背内侧前额叶皮质(dmPFC)(如图5)

图5 在决策阶段进行自我和他人相关处理的全脑激活


ROI分析:假设支持形成运动刺激的感觉表征的区域(视觉运动区MT+和侧顶叶内沟LIP)也应该有助于社会信心计算。假设与社会推理有关的 TPJ和dmPFC可以将运动刺激的感官表征与社会信心计算所需的他人能力的独特表征结合起来(如图6)。因此,TPJ 和 dmPFC 应该在控制运动连贯性的感官表征后追踪对他人选择的信心。使用以下方法验证假设:(1)针对 ROI 进行滑窗回归 encoding 得到不同表征在大脑中的随时间的变化;(2)估计单试次血流动力学响应函数(canonical hemodynamic response functions, c-HRF),进行显著性检验。


图6 任务相关心理成分假设的ROI


      感官ROI:正如预期,MT+和LIP追踪了两种试次的运动连贯性。在MT+中,自我试次和他人试次的反应概况相同:连贯性越高,脑区活动性越强。相比之下,试次类型之间的LIP反应曲线不同:运动连贯性越高,他人试次的脑活动越强,但自我试次的脑活动越弱。这可能是因为在主动选择期间,高连贯性运动刺激的感觉整合过程比低连贯性运动刺激更早终止(自我试次)。因此高连贯性运动刺激的整体神经活动可能低于低连贯性运动刺激。相反,在被动观看期间,不会发生选择过程的提前终止(他人试次)。

     社会ROI:预测ToM网络不仅处理区分自我和他人,还应该对自我和他人的信心进行差异编码。研究者们量化了试次类型(自我/他人)、基于ToM模型的信心估计及其交互的神经影响。分析表明,(颞顶联合区(TPJ)和背内侧前额叶皮质(dmPFC))都编码了试次类型和基于模型的信心估计之间的交互作用。TPJ仅对他人试次的信心估计进行编码,当信心低的时候活动更强。而dmPFC编码了两种试次类型的信心估计:激活随着对他人试次的信心增加而降低,但随着对自我试次的信心增加而增加。在dmPFC中,当信心低时,与信心高时相比,自我试次和他人试次之间神经反应差异更大。

    PPI分析:研究人员在确定TPJ和dmPFC追踪对他人选择的信心估计后,转向社会信心计算的试次内和试次间动态。作者假设如果ToM网络接收来自经典感知决策区域对运动刺激的感觉表征并整合该感觉表征及对其他参与者的能力表征,那么相比自我试次,他人试次中感官ROI和社会ROI之间的功能连接应该更高。研究者们以MT+或LIP作为种子区,试次类型作为心理变量,进行了心理生理学的交互作用(PPI)分析,发现相比自我试次,侧顶叶内沟 (LIP)、颞顶联合区 (TPJ) 和背内侧前额叶皮质 (dmPFC) 之间的连通性在他人试次中较高(如图7)。

      最后分析了对其他参与者能力的表征如何随任务更新,验证行为和建模结果的误差学习机制(如图3),结果发现,TPJ和dmPFC都追踪了ToM模型下计算的社会预测误差(如图8)。

图7 社会信心计算过程中感觉和社交 ROI 之间的功能耦合

图8 TPJ和dmPFC 中社会预测误差


Discussion


      本研究验证了自我和他人信心推理是不同的过程,涉及对自己和他人的不同表征。在行为层面,发现社会信心计算涉及不同的自我和他人相关成分,通过将行为分析与计算建模相结合,发现人们对他人决策的信心结合了决策背景和对他人能力的知识,符合构建的ToM模型。

      在神经层面,fMRI相关分析发现,感觉相关脑区(视觉运动区MT+和侧顶叶内沟LIP)追踪了任务难度,社会脑区(颞顶联合区TPJ和背内侧前额叶皮质dmPFC)追踪了对他人决策的信心,这些结果表明TPJ/dmPFC 增强了 LIP 提供的决策难度和其他参与者能力的表征。这描述了我们是如何预测另一个他人的决策准确性,ToM网络的激活支持了本研究的解释,即被试通过估计其他参与者的感官噪音来计算社会信心。这项研究扩展了我们对社会认知神经基础的理解。

Reference

Bang, D., Moran, R., Daw, N.D. et al. Neurocomputational mechanisms of confidence in self and others. Nat Commun 13, 4238 (2022). https://doi.org/10.1038/s41467-022-31674-w

-END-




   文案 Yilin

   校对 Kun, Haiyan

   排版 Tianyan

     Email: haiyanwu3@gmail.com


好奇帮
本账号是心理学,神经科学和计算科学的结合。
 最新文章