申晨,Jun Tanimoto,王震等 | 退出机制促进亲社会惩罚,但非一劳永逸的解决方案

文摘   科技   2024-12-28 14:39   北京  

研究团队

申晨,Jun Tanimoto:Kyushu University(日本)

宋曌:Teesside University(英国)

石磊:云南财经大学

王震:西北工业大学

文章下载

Chen Shen, Zhao Song, Lei Shi, Jun Tanimoto & Zhen Wang. Exit options sustain altruistic punishment and decrease the second-order free-riders, but it is not a panacea. Sci China Inf Sci, 2024, doi: 10.1007/s11432-023-4170-3



研究意义

亲社会惩罚在维持群体合作中的作用备受关注,但其产生与持续机制依然是一个跨学科的研究热点。在群体合作中,个体通常通过惩罚不合作者来促进合作,但这种惩罚行为并非没有代价。一方面,惩罚者需要承担相应的成本,这使得他们在面对仅合作而不惩罚的二阶搭便车者时处于劣势。另一方面,惩罚行为可能引发不合作者的报复,进一步增加了惩罚的总成本。这一现象引起了广泛的学术讨论,催生了如强互惠理论等多种解释模型。强互惠理论认为,为了实现公平,个体愿意与对手合作并惩罚背叛者。此外,声望机制、群体选择以及自愿参与等演化理论也为理解亲社会惩罚提供了多样的视角。

自愿参与机制为理解群体合作提供了另一种重要视角。该机制允许个体选择退出博弈,从而避免与不合作者的直接冲突。通过与合作者和不合作者的动态互动,自愿参与机制能够有效地维持群体合作。在这种模式下,亲社会惩罚者(既合作又惩罚不合作者)能够与仅合作但不惩罚的二阶搭便车者共存,并与退出者和不合作者形成一种循环互动的优势关系。然而,传统的自愿参与机制往往假设退出者对公共物品没有任何影响,这一简单假设忽略了退出者可能带来的复杂影响。

实际上,自愿参与作为一种自下而上的措施,退出者对公共物品的影响可能极为复杂,并且与个体特质密切相关。例如,尽管个体选择不参与公共物品的分享,具有竞争性的人可能通过直接或间接的方式破坏公共物品,导致他人受损;而具有亲社会倾向的人则可能通过类似方式维护公共物品,为他人带来额外的利益。现有的自愿参与理论尚未充分考虑这些复杂情况。

本研究探讨了一种特殊的自愿参与形式:个体退出博弈且使对手的收益归零。这一现象可以在科研合作中得到体现:如果一名研究人员选择搭便车或放弃项目,剩余研究人员的成功机会将显著降低。虽然这种策略在一次性互动中可能对所有参与者都不利,但在重复博弈或社交网络中,它有可能促进长期的合作。

基于自愿参与机制解释利他惩罚的研究,自然而然地将这一概念扩展到这种特殊的退出形式。通过研究退出者对利他惩罚的影响,我们旨在确定退出者在多大程度上能够解释利他性惩罚。这一探索不仅有助于增强自愿参与机制在解释利他惩罚方面的稳健性,还进一步丰富了我们对退出者在合作行为中角色的理解。

本文工作

考虑一个两阶段的囚徒困境博弈。在第一阶段,双方需要在合作、背叛和是否参与博弈三种选择中做出决策。如果一方选择退出博弈,则退出者获得一个小额的收益ϵ,同时由于其不再参与博弈,双方的博弈无法进行,其对手的收益为0。如果双方都参与博弈且同时选择合作,则两人分别获得收益R;如果双方都选择背叛,则分别获得收益P。如果一方选择合作,另一方选择背叛,那么合作方的收益为S,背叛方的收益为T。
在第二阶段,参与博弈的双方可以根据第一阶段的结果决定是否对对方进行惩罚。惩罚的机制是,合作方需要付出一个成本γ来使背叛方的收益减少β。为了简化模型,我们只考虑由合作者发起的惩罚,即只有合作方可以选择是否惩罚背叛者。
基于这个博弈模型,产生了四种策略:
合作并惩罚背叛者(AP):这些参与者是利他惩罚者,因为他们即使牺牲自己的利益也要对背叛者进行惩罚。
合作但不惩罚背叛者(NC):这些非惩罚性合作者也被称为二阶搭便车者,因为他们通过不惩罚背叛者来节省惩罚的成本。
背叛但不惩罚(D):这些人被称为一阶搭便车者,因为他们不仅背叛还不承担任何惩罚成本。
退出者(E):无论遇到谁,这些人都选择退出博弈,获得一个小额但正收益ϵ,他们不参与这两个阶段的博弈。
为了简化模型,我们采用了弱囚徒困境博弈作为基础,设置了以下收益:R=1,P=S=0,T=b。为了确保该模型符合经典的囚徒困境博弈的收益排序(T>R>P>S),我们将b设置为1<b<2。同时,为了反映现实情况,我们设定ϵ <1,以保证合作比退出博弈带来的回报更高,从而更符合实际中合作优于退出的情形。详细的收益矩阵请参见表1。

表1 收益矩阵

实验结果

本文分别在混合群体与网络群体场景下,研究了退出机制对利他性惩罚的影响。实验结果表明:
1. 有限混合群体中的动态变化
在有限混合群体中,退出者显著影响了背叛者与利他惩罚者之间的动态平衡。随着对退出行为的激励增强,退出者的比例逐渐上升,取代背叛者的地位(见图1)。尽管利他惩罚者能够在一定程度上生存下来,但他们始终未能成为群体的主导力量。整个群体通常由退出者或背叛者控制,利他惩罚者处于边缘地位。

图1 退出机制在有限混合种群中维持了利他性惩罚,但利他性惩罚无法在种群中占优


2. 无限混合群体中的稳定性
在无限混合群体中,激励参与者退出仅能削弱背叛者的稳定性,但无法有效促进利他性惩罚的形成(见图2)。这一特性表明,退出机制在无限混合群体中对利他性惩罚的促进作用有限。

图2 退出机制在无限混合种群中破坏了背叛的稳定性,却无法促利他性惩罚


3. 有限网络群体中的循环占优
在有限网络群体中,退出者通过与利他性惩罚者和背叛者之间的循环占优机制,维持了利他性惩罚的存在(见图3)。然而,这种循环占优机制并非始终稳定。随着对退出行为激励的增加,不惩罚者可能会取代利他性惩罚者,形成新的循环占优模式,即不惩罚的合作者与背叛者、退出者之间的循环占优关系。此外,系统的最终状态也依赖于初始条件,导致循环占优机制呈现双稳态现象(见图3)。
图3 退出机制在网络群体中对利他性惩罚影响复杂

本文的研究结果揭示了自愿参与机制在促进利他性惩罚涌现方面的局限性。作为自愿参与机制的一种特殊形式,选择清空对手收益的退出者在混合群体中对利他性惩罚的涌现并未表现出显著的促进作用。然而,在网络群体中,这类退出者虽然能够在一定程度上促进利他性惩罚的形成,但这种维持并不总是稳定的。随着对退出行为激励的增强,退出者的存在能够引发循环占优和双稳态等复杂的动力学现象。这表明,退出机制在不同群体结构下的效果存在显著差异。因此,本文建议在通过退出机制激励和维持利他性惩罚时,应谨慎考虑多个因素,如对退出行为的物质激励、社交网络的结构特征以及退出者可能产生的直接影响等,以避免可能出现的不稳定或负面结果。




中国科学信息科学
《中国科学:信息科学》及其英文版《Science China Information Sciences》的宣传平台。
 最新文章