看似简单的选择背后,其实隐藏着一个复杂的博弈过程

文摘   2024-08-06 11:32   上海  

在日常生活中,我们常常会面临各种各样的决策问题:今天午饭吃什么?明天要不要去健身?这周末看什么电影?这些看似简单的选择背后,其实隐藏着一个复杂的博弈过程

尤其是当多个参与者存在时,选择的结果不仅仅依赖于自己的决策,还要考虑他人的决策,这就是“博弈”。

博弈论专门研究决策者之间策略互动及其结果。博弈论的基本单位是“博弈”(game),参与者称为“玩家”,他们通过采取不同的“策略”来达到自己的目标。

在博弈论中,策略可以分为纯策略混合策略

纯策略是指玩家每次总是选择某一个固定的行动。而混合策略则更为复杂,它允许玩家以一定的概率随机选择不同的行动

举个例子,如果你和朋友玩石头剪刀布,你可以每次都选择石头(纯策略),也可以随机选择石头、剪刀或布,每个选择的概率为1/3(混合策略)。使用混合策略的好处在于,它能使对手无法预测你的行动,从而提高自己的胜率。

假设有两个玩家 A 和 B ,每个玩家有 n 种可能的策略。我们用 表示玩家A选择第 i 种策略的概率,用 表示玩家B选择第j种策略的概率。

博弈的结果由支付矩阵(payoff matrix)决定,记作 。对于玩家 A ,支付矩阵的第 行第 列的元素 表示玩家 A 在选择第 i 种策略,而玩家B选择第 j 种策略时的收益。

在混合策略博弈中,玩家A和玩家B的期望收益分别为:

其中, 是玩家B的支付矩阵。对于混合策略的选择,玩家需要考虑如何分配各策略的概率,以最大化自己的期望收益。

博弈论的一个核心概念是纳什均衡(Nash Equilibrium),这是指在一组策略下,没有任何玩家可以通过单方面改变自己的策略而获得更高的收益

换句话说,在纳什均衡下,每个玩家的策略都是对其他玩家策略的最优回应。

对于混合策略博弈,纳什均衡的存在性由纳什定理保证。具体来说,对于任何有限博弈,都至少存在一个混合策略纳什均衡

以足球罚点球为例。罚球者可以选择向左、中间或右射门,守门员则可以选择向左、中间或右扑救。罚球者和守门员的收益矩阵如下:

对于罚球者来说, 表示当罚球者选择射门方向为第 种策略(左、中、右之一),而守门员选择扑救方向为第 种策略时的收益。同样,对于守门员来说, 表示当守门员选择第 种扑救方向,而罚球者选择第 种射门方向时的收益。

表示罚球者选择向左射门而守门员选择向左扑救时,罚球者的收益是3分,而 表示在同样的情况下,守门员的收益是-3分(因为罚球者得分,守门员失分)。

假设罚球者选择向左、中、右射门的概率分别为 ,守门员选择向左、中、右扑救的概率分别为

对于罚球者,其期望收益为:

对于守门员,其期望收益为:

在纳什均衡下,罚球者和守门员的策略组合 必须满足以下条件

  • 对于罚球者,没有任何 的改变能增加其期望收益
  • 对于守门员,没有任何 的改变能增加其期望收益

最后通过使用数学方法或数值求解工具(如线性规划、拉格朗日乘数法)来求解上述均衡条件,找到

希望这篇文章能够帮助读者对博弈论有一个初步的认识,并激发大家在日常生活中更多地思考和应用这种理论。(作者:王海华)

前两天一个非常专业的出版社老师强烈推荐我阅读《数学的雨伞下》这本书,我看完了确实感觉不错!推荐给大家。

该书将数学比作一把雨伞,当撑开这把雨伞时,我们仿佛进入了一个奇特的境界,有了迈向真相、行走在谜团中的勇气;当收起这把雨伞时,我们会发现自己的认知已大不一样,所谓的“理所应当”和“显而易见”将被摒弃,现实背后隐藏的真相将带来巨大的启发。这就是数学的力量。从代数、几何到相对论,从温度计到黑洞,作者用简洁而生动的笔触阐释了如何更好地思索、观察与理解世界。让我们带上好奇心,撑开数学这把大伞,在宇宙的奥秘中漫步,体会解开疑惑后,如雨过天晴般的愉悦。

模型视角
一个资深数学建模爱好者的知识、视角和建模乐趣分享!主理人:王海华,数学建模教师,著有《模型,就是数学化的思维》《数学建模实战:手把手教你参加数学建模竞赛》,参编《数学建模:教学设计与案例》《高中STEM精品课程资源课例》等。
 最新文章