Journal Club| 自我-他人边界的形成

文摘科学 2023-06-10 14:02 澳门

自我-他人边界的形成:

社会性训练对预测误差的重塑

Social training reconfigures prediction errors to shape

Self-Other boundaries

简介

Abstract

选择性地将信念归因到特定主体（Agent）是划分自我-他人边界的关键。先前研究表明，我们可能是通过在具有主体特异性（agent-specific）的神经回路（即表征自我或表征他人）中对不同agent的信念进行模拟计算来实现自我-他人边界划分的，但目前仍不知道这些神经基础是如何特异化的。在本次JC, 我们介绍了一项来自Nature Communication的研究，Sam Ereira和他的合作者们进行了一项fMRI实验，研究主体特异性是否受社会环境影响，并通过改变预测误差影响对自我和他人的不同视角的接受，以及考察这种特异性的变化是如何表征在神经层面。

引言

Introduction

在人际社会中，人们倾向于将自己的信念和价值观与他人保持一致，尤其是当他们属于同一社交群体时。接受和正确表征他人的信念有助于社会融合，使我们能够利用他人对环境的知识。然而，在预测他人行为和进行流畅社交互动时，准确地表征他人的信念而不必接受这些信念同样重要。因此，在自我-他人的区别和自我-他人的融合之间取得一种与当前情况相关的平衡是至关重要的。为了达到这种平衡，需通过计算预测误差（Prediction Error, PE）信号，将内部预测与环境的实际情况进行比较，来选择性地修正我们对世界或他人的信念。

先前研究表明，通过观察他人的行为，我们也可以预测他人的PEs，而关于他人的预测误差的神经信号由腹内侧前额叶皮层（Ventromedial prefrontal cortex, VMPFC）负责。当自己的信念和他人的信念同时出现时，大脑会以不同的特定神经回路分别计算自我和他人的PEs，其中神经信号的差异代表了行为层面上自我-他人的预测差别。这意味着PEs相关的神经信号所包含的信息，不仅包括事件本身，还有经历事件者的身份差异。如果自我-他人的区别确实是在主体特异性回路中被计算的，那么这些回路的主体特异性应该能够适应社会环境的变化。

因此，在当前研究中，研究者们通过两种社会情境下的心智化任务，来研究自我-他人的区别是否容易受到经验依赖的可塑性的影响。具体地说，研究者主要关注两个问题：

1. 我们的大脑是否通过学习主体身份

（自我/他人身份）来学习自我-他者边界？

2. VMPFC在主体特异性神经回路中起什么作用?

方法

Method

实验流程

实验共分三天进行。

第一天，被试进行跨期选择任务，跨期选择任务中被试需要决定是在当下获得一定的金钱还是在未来某个时间点获得相对较多的金钱；然后进行视觉观点采择任务（详情见后文）。

第二天，被试接受了错误信念任务的训练（详情见后文），先后经历两种不同的社会情境。然后，被试再次进行视觉观点采择任务来检验错误信念任务训练的转移效果。

第三天，被试在fMRI中进行错误信念任务。

图一：实验流程

（a）实验时间线，箭头代表下一天

（b）错误信念任务流程

（c）错误信念任务中随机游走概率序列的生成

错误信念任务（False Belief Task, FBT）：

被试在实验第二天接受了FBT的训练，然后在第三天进入核磁扫描，进行了相同范式的正式任务。本研究的FBT包含了两个故事场景：被试作为一个店员，在一个“商店经理”（即他人, others）的帮助下出售商品。在其中一个场景中，被试需要尝试出售粉红色的雨伞和黄色的遮阳伞，被试被告知出售一把粉色伞的概率（波动参数）只受到天气的变化的影响。在另一个场景中，被试则需要向城市里的游客出售红蓝颜色的可乐，被试被告知出售红罐的概率（波动参数）代表着饮料受欢迎程度的变化，只受到商店外广告的影响。

每一个故事场景中，FBT中存在三种具体的情景设置，用于操纵被试对自我信念、对经理信念的学习：

1.特权（Privilege）：经理不会以任何形式去观察店员和销售情况。

2.共享（Shared）：经理会观察店员和销售情况。

3.诱饵（Decoy）：经理会在后屋通过监视器观察店员和销售情况，但其通过监视器所看到的画面是上周的录像，因此其所观察的是一个具有误导性影像。

两个故事场景中，经理的性别进行了平衡处理；两个故事场景中，一位经理的分享试次占该故事场景试次的50%，即高分享率他人（Hi-Share others）；另一位经理的分享试次占对应故事场景试次的12.5%，即低分享率他人（Lo-Share others）。

如图1b所示，在每个试次中，被试会在画面中央看到试次的类型（特权：大门关闭，共享：大门打开，诱饵：摄像头），并在下半部分看到这一试次的结果（粉色/黄色 or 红色可乐/蓝色可乐），在每4至9轮不等的试次后，被试需要依量表预测下一个试次将出现的商品结果，或者估计他人（即经理）对下一试次结果的预测结果。所有试次的结果由预先的随机游走产生，如图1c所示，用于自我和他人（经理）的随机游走序列并不相关，保证了两者结果概率的独立性。被试第二天进行了训练版本的任务，第三天则在fMRI中进行了相同范式，但在第三天的任务中不再设置高分享和低分享，其特权、共享和诱饵试次在两个故事场景中数量都是相等的。

视觉观点采择任务 (Visual Perspective-taking task)：

在这一任务中，屏幕上首先会出现一个目标图案，之后会出现一个数字，最后在屏幕中会出现一个虚拟形象(“Self” “He” “She”或者箭头），面朝（或指向）左右两面墙壁中的一面，墙壁上绘制着一定数量的目标图案，但其中夹杂旋转了60°的干扰图案。被试需要通过按键对正确目标图案的数量与呈现的数字是否一致做出判断。在视觉任务中的“He”和“She” 即为错误信念任务中的Hi-Share others和Lo-Share others。这一任务中的条件共分为四种，视角（自我vs.其他）、情况（一致vs.不一致）、判断结果（是vs.否）、屏幕上的agent（低分享率vs.高分享率vs.箭头）和agent注视的方向（左vs.右），所有条件都进行平衡。被试在第一天和第二天分别进行了一次视角观点采择换位任务。

学习计算模型

Models

Bt+1：被试对下一个试次的结果信念

Bt：被试对当前试次结果的信念

α：对自我预测误差（Prediction Error of Self）的学习参数。

δ：记忆衰减参数，表示向机会参数的漂移程度。

λ：泄露参数，表示学习自我的预测受到学习他人预测误差（Prediction Error of Other）的影响程度。

结果

Results

1. FBT的行为数据分析

首先，研究者发现无论是在训练阶段（day 2）还是在正式实验阶段（day 3），被试在Hi-Share场景中的预测表现都显著差于Lo-Share场景。值得一提的是，在正式实验阶段的Hi-Share场景中，被试对自己经历的结果的预测能力显著低于对他人结果的预测能力，这意味着自我指向的学习能力受到了损害。根据对学习计算模型的结果，发现损害是因为在Hi-Share的情况下，自我对PE-other的学习要优于对PE-self的学习，故而自我指向的学习能力更低。在训练阶段和正式实验阶段中，对Hi-Share场景中自我-他人信念的相关性（r）更高（图2b）。图2c和图2d展示了学习模型的结果，模型很好地拟合了原始数据，相关矩阵表明参数的可识别性。

图二：

行为训练诱导了自我-他人区分能力的持续变化

图2(a) FBT实验的行为结果，r代表正确选择的概率

图2(b) 在不同轮次中自我-他人信念的相关性

图2(c) 学习模型的拟合表现

图2(d) 学习模型的参数可识别性矩阵。其中x轴代表原始参数，y轴代表经过拟合后的参数。

2. FBT对自我-他人区分的影响是否扩展到不同的认知领域

（视觉观点采择任务）

在视觉观点采择任务中，研究者使用漂移-扩散模型（Drift-Diffusion Model，DDM），用漂移率参数拟合反应时间和精度数据（更高的漂移率表明反应时更低、准确率更高）。在FBT训练任务中，被试学习到自我和他人的概率之间的关系，这种关系是特定于他人身份的（即Hi or Lo-Share others）。但在视觉观点采择任务中，结果和概率均不涉及到对他人身份的学习，因此可以用来观测在FBT中学习的他人身份是否会影响观点采择任务中的行为结果。研究者发现，在观点采择任务中，与不一致情况相比，自我-他人一致情况下的漂移率更高，代表着任务中更好的表现（图3b)。并且，控制了重复学习后的漂移率后，面对Lo-Share others，被试的正确率更高地提升了，而在Hi-Share others出现时，正确率提升得更低（图3c）。

图三：

采择任务中的不一致和转移效应。

图3(a)视觉观点采择任务范式

图3(b) 观点采择任务中的不一致效应

图3(c) 观点采择任务中的转移效应

3. 对自我-他人差异适应性的神经表征

研究者在纹状体外、顶叶和辅助运动皮质中发现了对应自我和他人的PEs的神经信号。PE-self 和 PE-other 的神经活动在Hi-Share others出现时中比Lo-Share others出现时更相似（图4a）。进一步地，研究者用一部分数据训练的分类器对Self-Other PEs进行重新分类，并发现对Lo-Share others PEs的分类准确度显著高于Hi-Share’s（如图4b）。

为了确认对Hi-Share others的上述结果反映了重叠的神经活动模式，而非因被噪声数据干扰导致，研究者检测了分类分析的逻辑逆(Logic inverse)，即训练Self-PEs的线性回归模型，并用Others-PEs的数据进行测试，反之亦然，来直接测试Self-Others PEs表征的相似性。分析结果表明，跨种类解码的准确率在Hi-Share他人的试次中明显更高（如图4c）。交叉解码准确性的环境差异（即Hi/Lo Share others）与Hi-Share Others出现时的平均λ：α比率相关。这说明在神经层面上对Self-Others 信号的重合程度与行为层面上对Self-Others学习的结果是一致的（图4d）。在磁化转移（Magnetisation Transfer，MT）的定量MRI图中，研究者观察到髓鞘相关的MT与图4c中交叉解码的差异变化之间的关联（图4e）。这一发现表明，该区域髓磷脂密度较高的受试者可能对学习自我-他人关系更敏感，受他人身份影响地分配这些关系知识。

图四：

FBT任务区分了PEs在神经层面的表征

图4(a)VMPFC中BOLD信号与PEs的对应变化

图4(b) 训练的分类器在不同主体条件下的分类准确度；

图4(c) 自我和他人情况分别作为训练和测试数据的分类准确率结果

图4(d) 分类交叉解码性能的线性模型；

图4(e) 对VMPFC的磁化转移的定量磁共振图

4. VMPFC中对共享信息追踪的神经表征

基于上述结果（未发现VMPFC与PEs存在关系），研究者假设VMPFC可能通过使用一种抽象的表征代码（Abstract Representational Code），与PEs本身分离，来计算Self PEs与Other PEs的关联程度，即VMPFC可能通过对代理身份（Hi-Share或Lo-Share）的学习进而区分自我和他人。为了验证这种想法，研究者构建了一个新的学习因子η代表被试对分享试次的概率学习情况。通过将这一学习因子与双侧VMPFC和左侧颞叶外侧皮层（left lateral temporal cortex）中的神经信号进行相关分析，发现VMPFC的活动与较低的η有关（η = 0.01），而外侧颞叶皮层与较高的η有关（η = 0.025；图5b）。VMPFC的激活程度与Hi-和Lo-Share条件之间的自我-他人的交叉解码差异呈正相关。外侧颞叶皮层的激活程度则与交叉解码没有关系，这或许是因为此处较高的学习率表示更快地调整自我-他人边界，进而在反应相互解码能力上不具备优势（图5c）。上述结果表明，VMPFC在自我-他人边界的学习过程中具有主体特异性，即VMPFC不仅可以对目标身份（Hi-Share或Lo-Share）进行学习，同时也可以反映出自我-他人的神经适应。并且，只有缓慢地学习统计关系时，测试中的神经适应效应才会出现；相反地，快速学习会迅速消除身份先前学习的差异，神经适应效应不会出现。

图5：

在VMPFC和左侧颞叶外皮层中跟踪自我和他人之间共享信息的神经表征

(a) 追踪“分享”试验概率的学习模型。红线表示分享试次出现的概率，黑线表示PEs的大小。

(b) VMPFC和外侧颞叶皮层对不同数值的学习因子之间的关联。其中左图表明VMPFC主要与较低的η相关，右图表明外侧颞叶皮层与较高的η相关。

5. 跨期选择任务中自我-他人边界领域的通用计算

最后，研究者探究了对自我-他人区别的神经计算是否对社会身份敏感。如图6a所示，跨期选择任务中的选择行为由双参数双曲贴现模型描述，每个散点表示超过40个被试选择的延时选项。线性模型结果表明，泄漏因子λ：α与两个贴现参数的对数乘积呈负相关，即表现出更多自我-他人信息融合倾向的被试折扣率更低（即更高估未来奖励）。最后，研究者使用FBT中学习模型的每个参数，将被试分为高或低折现率，发现当把自我-他人的合并测量（即交叉解码性）作为额外的训练特征时，分类精度显著提高。最后，在MT与fMRI训练效应共同变化的同一大脑区域（VMPFC），研究者发现MT与被试的折扣率呈负相关。

图六：

自我-他人区别对延时折扣倾向的预测

图6(a) 跨期选择中的行为表现。每个散点表示一个平均超过40个被试选择的选项所占的比率。条形图显示了单参数和双参数模型的贝叶斯拟合结果

图6(b)

五种逻辑回归模型在预测被试延时选择倾向中的表现，X轴代表交叉熵，这一数值越低代表预测精度越高

总结

Conclusion

本研究发现了一种计算机制，该机制表明对特定agent的信息更新能够影响对其他agent估计情况的变化。首先，自我-他人边界是可由社会经验塑造。其次，PEs的空间表征是可塑的，学习信号在大脑中表征的方式本身是可以学习的，FBT训练足以影响独立认知任务中的行为。

神经层面的结果表明，VMPFC中的髓鞘相关MT与训练诱导的表征变化程度有关。VMPFC以及外侧颞叶皮层可以跟踪自我属性信号和其他属性信号之间的关联强度。此外，自我-他人边界的计算模式可用于社交和非社交环境，在非社交环境中，更高的信息融合程度带来更低的折现率。

本研究表明更新自我-他人边界的过程本身可学习，并且可以迁移到其他任务之中。这可能有助于将知识结构扩展到新的情景。在社会认知的特定情况下，人们可以从一个agent的心理状态推断另一个agent的心理状态，从而能以一种灵活的环境依赖的方式跨越社会和时间维度进行知识结构拓展。

Reference

Ereira, S., Hauser, T.U., Moran, R. et al. Social training reconfigures prediction errors to shape Self-Other boundaries. Nat Commun 11, 3030 (2020).https://doi.org/10.1038/s41467-020-16856-8

文案：Hehe

校对：Jingmin

排版：Iris

Email：haiyanwu3@gmail.com

好奇帮

本账号是心理学，神经科学和计算科学的结合。