这道题来自LSE EC411 微观经济学2019年期末考试的第5题,也是博弈论的一个经典问题:
两名玩家轮流从一堆有6颗石头的石堆中取石头。玩家1先开始。每一轮,当前玩家观察剩下多少石头,然后可以从石堆中取1颗或2颗石头。取走最后一颗石头的人赢得游戏,并获得10英镑的奖励。找出这个动态游戏的纯策略子博弈完美均衡。如果石堆有n颗石头,你的结论会如何推广?提示:考虑如何解决3颗石头的问题,然后迭代相同的逻辑。
参考答案:
考虑可能的博弈历史。长度为t的历史 是 的一个元素,其中 表示在第t轮取走的石头数量。用 表示剩余的石头数量。
(1) 当 时,移动的玩家通过设置 必定获胜。因此,在这些历史中,这样的策略必须是移动玩家的SPNE策略。
(2) 当 时,移动的玩家必定失败,因为对于任何 ,都有 。因此,在这些历史中,任何策略都可能是SPNE。
(3) 当 时,移动的玩家通过设置 必定获胜,因为 。因此,在这些历史中,这样的策略必须是移动玩家的SPNE策略。
(4) 最后,当 时,移动的玩家必定失败,因为对于任何 ,都有 。因此,在这些历史中,任何策略都可能是SPNE。
当石堆有n颗石头时,同样的逻辑可以通过归纳法扩展。特别地,在任何SPNE中:
当 (其中 )时,移动的玩家失败,可以选择任何策略 。 当 (其中 )时,移动的玩家获胜,可以选择任何策略 。
要正式证明这一点,只需使用归纳法。对于 的情况已经建立。然后假设该主张对所有 $k<k$ 成立,以证明它在k处也成立。<="" p="">
当 时,移动的玩家必须通过设置 来确保获胜,因为 ,根据归纳假设,这是一个失败的位置。因此,在这些历史中,这样的策略必须是移动玩家的SPNE策略。 最后,当 时,移动的玩家必定失败,因为对于任何 ,都有 。因此,在这些历史中,任何策略都可能是SPNE。
这个取石头游戏的子博弈完美均衡(SPNE)可以总结如下:
对于6颗石头的情况:
先手玩家(Player 1)必败 无论先手选择取1颗还是2颗,后手玩家都有必胜策略
对于n颗石头的一般情况:
当剩余石头数量是3的倍数时(即3k,k为正整数),当前玩家处于必败位置 当剩余石头数量不是3的倍数时(即3k-1或3k-2),当前玩家可以通过正确的选择确保胜利
最优策略:
如果面对3k颗石头,玩家可以任意选择取1颗或2颗(因为必败) 如果面对3k-1颗石头,玩家应该取1颗,使对手面对3k-2颗 如果面对3k-2颗石头,玩家应该取2颗,使对手面对3k颗
游戏结果:
如果初始石头数量是3的倍数,后手玩家(Player 2)必胜 如果初始石头数量不是3的倍数,先手玩家(Player 1)必胜
这个结论适用于任意正整数n的情况,展示了一个简单但有趣的动态博弈均衡。