Nature:超加合作

文化   2024-09-02 19:52   广东  

为什么人们会在一回合的社会博弈中展现出合作行为?以往研究者从进化角度提出了两种解释:重复互动观点认为远古时代人类祖先群体往往是小规模且具有凝聚力,人们倾向于将一回合制互动视作长期关系的开始,因此会避免做出有损自己声誉的行为。而群际冲突观点认为受到有限资源与外部威胁的影响,种群进化使人们倾向于与群内成员合作,与群外成员自私。因此个体一旦将与其开展博弈的个体视为群内成员,就会展现出合作倾向。那么,究竟哪种解释能够体现一回合博弈进化的本质呢?Charles Efferson等研究者与2024年2月发表在《Nature》上的文章基于演化博弈模型与现场实验探索了博弈中合作的演化机制。

  • 演化博弈模型

  1. 模型构建

研究使用Objective-C中的C.E.构建基于主体的仿真模型(Agent-based model),模型包含40个小组,每组包含24个主体(agent),每次演化150,000代。Agent间基于信任游戏开展博弈。同时,模型操纵了以下特征:博弈策略参数(3种策略)、实验情景(3种情景)、初始条件(3种初始条件)、生命循环模式(2种模式),上述特征组成不同的实验条件,每种条件开展了50次模拟。

  1. 信任游戏

如下图所示,每次有两个agent参与信任游戏,每个agent有50%概率被选为投资者(first mover),其可以投资xn给接受者(second mover),接受者将收到xn×b的投资,随后可以反馈yn给投资者,投资者将收到yn×b的反馈,二者的收益可以使用,表示,其中n是博弈的轮次。

  1. 博弈策略参数

  • 二维策略:每个agent的策略包含2个参数。

初始投资[0, 1]:投资者第一次向接受者投资的资产数量;

反馈参数αi[-1, 1]:接受者反馈的资产数量是接收资产数量的函数。

    • 三维策略:每个agent的策略包含3个参数。

初始投资[0, 1]:投资者第一次向接受者投资的资产数量;

线性反馈函数的左截距ai;线性反馈函数的右截距di

三维策略能够模拟模糊互惠,即接收者反馈模式可以是非负向倾斜的反馈(di – ai [0, 1])。 

    • 四维策略:每个agent的策略包含4个参数。

在三维策略基础上,增加了一个参数γi以模拟广泛的非线性响应函数。

  1. 实验情景

  • 重复互动情景:每个agent只与组内成员进行多轮信任游戏。

    • 组间竞争情景:每个agent分别与组内一位成员进行一回合信任游戏,与组外一位成员进行一回合信任游戏。同时不同组间将开展竞争。

    • 联合情景:每个agent分别与组内一位成员进行多轮信任游戏,与组外一位成员进行一回合信任游戏。同时不同组间将开展竞争。

  1. 初始条件

  • 初始投资者均是自私的投资者:当t = 0时, , aij, dij, ij, uij, vij = 0;

  • 初始投资者均是完美互惠的投资者:当t = 0时, , aij, ij, uij =0, dij, vij = 1;

  • 随机条件:当t = 0时, , aij, dij, ij, uij, vij {0.025,0.05,…., 0.975}。

  • 生命循环

  • 有两种生命循环模式:出生、与组内个体开展信任游戏、迁移、与迁移后的组内个体竞争繁殖;出生、迁移、与有组内个体开展信任游戏、与组内个体竞争繁殖。在第二种模式中,由于一起进行信任游戏的组内成员最终也会为了繁殖而互相竞争,因此能够在一定程度上抵消亲缘关系对合作进化的支持程度。

    以三维策略为例,介绍三种实验情景下生命循环过程的具体设置:

    A.重复互动场景:

    Step0-初始条件:每个agent具有三个策略参数, aij, and dij {0.025,0.05,…., 0.975}。

    Step1-突变:每个参数的突变率为µ = 0.02,如果突变发生,则在{0.025,0.05,…., 0.975}矩阵中向上或向下移动0.025。

    Step2-组的迁移:在每一代开始时,有Ξ{0,20,40}个组被随机抽样进入一个公共池,将公共池中的群体进行混合后再随机分为不同的小组。

    Step3-个体迁移(如果生命循环模式,则本步骤发生):对于每个小组j,随机选择的mj{8,16}个agent离开群体,共同加入一个新的空组。

    Step4-信任游戏:每个agent随机选择一个组内agent进行100轮信任游戏,并根据被试累积收益计算被试的生存适应度W。

    Step5-个体迁移(如果生命循环模式,则本步骤发生):对于每个小组j,随机选择的mj{8,16}个agent离开群体,共同加入一个新的空组。

    Step6-繁殖:对于每个小组j,繁殖意味着将t时间点中的24个agent替换为t + 1中的24个新的agent。每个agent的策略参数根据适应度有Wij/ ∑iWij的概率被复制。

    B.组间竞争场景(step1,2,3,5同上)

    Step0-初始条件:每个agent具有六个策略参数, aij, dij, ij, uij, and vij {0.025,0.05,…., 0.975} 。

    Step4-信任游戏:每个agent随机选择一个组内agent进行1轮信任游戏,随机选择一个组外agent进行1轮信任游戏,并根据被试累积收益计算被试的生存适应度W。

    Step6-组间竞争:群体竞争的成败取决于成对的群体之间资源总量的差异。首先,计算两组之间的资源总量;其次,计算竞争发生的可能性(两组间资源相差越大,竞争发生可能性越大),最后,计算竞争获胜的可能性(纳入群体选择强度参数λ{0,10,25,100},λ越大,拥有更多资源的群体越来越有可能获胜)

    Step7-繁殖:如果发生竞争,获胜群体繁殖产生新的agent,新的agent占领失败群体的领土。

    C. 联合场景(step0,1,2,3,5,6,7同组间竞争场景)

    Step4-信任游戏:每个agent随机选择一个组内agent进行100轮信任游戏,随机选择一个组外agent进行1轮信任游戏,并根据被试累积收益计算被试的生存适应度。

    1. 演化博弈模型结果

    模型模拟结果发现,重复互动受策略灵活性的影响,如图1所示,横轴是agent的策略类型(二维、三维、四维),纵轴是种群演化到最后一代时每个agent在100次组内互动中的平均收益,收益越高说明合作的持续。只有在二维策略空间的时候合作才是可持续的,即策略灵活性提升后重复互动无法支持合作的演化。

    图1 不同策略类型中下合作的演化

    当重复互动和群体间竞争结合在一起时,就会产生超加成合作,即产生1+1大于2的效应。如图2所示,联合情境展示出超成效应的存在,而且该效应受策略空间维度、初始条件设定等参数的影响不大,说明联合情境可以在广泛的条件下解释合作的演化。

    图2 三种实验情景下中下合作的演化

    对三种情境下个体策略的演化进行了分析发现,虽然重复互动与组间竞争情景下,agent最初都是初始转移较高的完美互惠者,而联合情境的agent最初都是无条件自私者,但是联合情境最终演化出更多的合作者。

    图3 三种实验情境下agent策略的演化

    • 现场实验

    1. 实验流程

    实验选择了两个在巴布亚新几内亚西部高地居住的园艺群体Perepka和Ngenika。两个群体的领土相距约30公里,每个群体都知道对方的存在,两个群体之间不存在敌对关系。研究者在两个群体中开展实验,每个群体中的被试分别与本群体内部2名成员,另一群体2名成员进行一次信任博弈。

    1. 实验结果

    行为实验的结果和模型预测的相同。如图4所示,对Perepeka和Ngenika两个部落的行为实验研究发现,投资者对组内成员的初始转移显著高于组外成员。气泡大小显示了不同转移的频率分布,紫色代表向组内成员投资,绿色代表向组外成员投资。接受者的响应函数斜率均为正数,而且其对组内成员采用的是合作升级策略,而对组外成员采用的是合作降级策略,只有联合情境才能预测这种策略模式。

    图4 行为实验结果

    总的来说,该研究表明,重复互动为群内合作提供了基础,但这种状态是不稳定的,而群体竞争作为外部威胁加强了群体内部的合作。因此,合作的演化由重复互动与群体竞争共同塑造的。 

    参考文献

    Efferson, C., Bernhard, H., Fischbacher, U. et al. Super-additive cooperation. Nature 626, 1034–1041 (2024). https://doi.org/10.1038/s41586-024-07077-w

    作者 | 袁  航 黄桂玲
    图文编辑 | 不晓心读写 
    审核 | 神经的罗贝尔博士

    神经的罗贝尔博士
    社会文化与神经科学实验室(Socio-Cultural and Affective Neuroscience Lab)
     最新文章