在学校的时候很多学生都要合作完成某个项目,当下国内国外都强调合作学习的价值。比如有时,几个人一起合作完成一个任务,最后总会遇到一个问题:该如何分配每个人的分数?有人熬夜做PPT,有人忙着查资料,还有人在最后时刻提了一点修改建议。每个人都为小组任务做了贡献,但大家的付出显然是不一样的。
那么问题来了:我们该如何公平地评价每个人的贡献呢?
这正是我们今天要聊的两个数学概念:“最后上车者价值”(Last-On-The-Bus Value,简称 LOTB)和“夏普利值”(Shapley Value)。这些概念是数学建模中的工具,能帮助我们合理地衡量每个人在合作中的价值。
什么是合作博弈?
在解决这个问题之前,我们得先谈谈什么是合作博弈。
合作博弈用来研究一群人共同完成某个任务时,如何在他们之间合理分配获得的收益或成果。在合作博弈中,我们用一个价值函数 来表示某个子集 (也称为联盟)所能够获得的价值。
现在来看一个场景:小组里有三个人 ,他们的任务是制作一份关于"食堂排队优化问题"的报告。每个成员都有不同的能力:
A 擅长搜集资料 B 会做精美的PPT C 有出色的分析能力
如果三个人都投入到任务中,整个报告的价值可以达到 100 分。如果只有两个人合作,报告的完成度下降,总分可能只能达到 70 分,而单独一个人做的时候,分数最多只有 30 分。
那么,该如何根据每个人的实际贡献来分配这 100 分呢?
最后上车者价值
"最后上车者价值"描述的是某个成员作为团队中最后一个加入者时所带来的边际贡献,反映了他在最后一刻对团队总价值的增益。
对于某个成员 ,在一个已经形成的联盟 的情况下,参与者 的最后上车者价值定义为:
它表示当 作为"最后一个"加入时,团队的总价值增加了多少。
来看小组作业的例子:
如果 是最后一个加入团队的,已经有 A 和 B 组成的联盟,整个团队的分数从 70 分提高到 100 分,那么 的最后上车者价值就是 分。 如果是 最后加入,他的贡献同样是 分。
但这个方法只衡量了最后时刻的边际贡献,并没有考虑其他可能的加入顺序。
夏普利值:合作中的公平分配
普利值提供了一种更全面、更公平的方式来衡量每个成员的贡献。它考虑了所有可能的加入顺序,并对每个成员的边际贡献取平均值,以确保每个人的贡献都得到公平的评价。
对于一个参与者 在合作博弈中的夏普利值 定义如下:
其中:
是总参与者数量。 表示所有参与者的排列组合(加入顺序)。 表示在加入顺序 中,参与者 加入之前的联盟。
现在有这样一份价值表:
组合 S | V(S) |
---|---|
{} | 0 |
{A} | 30 |
{B} | 20 |
{C} | 40 |
{A, B} | 70 |
{A, C} | 90 |
{B, C} | 80 |
{A, B, C} | 100 |
接下来,我们将根据这个价值表,计算出每个成员的夏普利值,看看 A、B 和 C 各自应得多少分。
为了计算每个人的夏普利值,我们需要考虑所有可能的加入顺序,并计算每个成员在每个顺序中的边际贡献。由于我们有三个人,所有的加入顺序一共有 种,如下所示:
接下来,我们逐一计算每个顺序中每个成员的边际贡献: 顺序 1:
A 首先加入,贡献 B 接着加入,贡献 C 最后加入,贡献
顺序 2:
A 首先加入,贡献 C 接着加入,贡献 B 最后加入,贡献
后面的就不一一列举了。根据夏普利值的计算结果,我们得到:
A 的贡献值是 33.33 分 B 的贡献值是 23.33 分 C 的贡献值是 43.33 分
除了在小组作业中,夏普利值还有很多现实中的应用。例如公司项目分红还有一些西方国家里议会投票权等。
合作博弈的核心在于如何合理、公平地分配合作成果,而夏普利值通过考虑所有可能的加入顺序并计算边际贡献,提供了一种全面、客观的分配方案。它不仅能让我们在小组作业中公平评价每个人的贡献,也可以帮助我们在更复杂的合作场景中找到合理的分配方式。(作者:王海华)参考资料:斯科特·佩奇. 模型思维:数据分析背后的思维方式 [M]. 贾拥民译. 杭州: 浙江科学技术出版社, 2023: 565.