数字经济运营系列讨论(七)——鲁棒优化

文摘   2024-09-30 00:31   中国香港  

TRAVEL

点击蓝字 关注我们

本次组会通过对鲁棒优化、机制设计以及贝叶斯劝说相关理论的学习,关于信息劣势方如何运用合约设计/信息结构设计解决信息不对称问题有了新见解。





鲁棒优化简介(Robust Optimization)

鲁棒优化(Robust Optimization)是最优化理论中用来寻求在不确定(uncertain)环境中使优化问题具有一定程度的鲁棒性(robustness)的方法。其中,不确定性可以通过问题的参数或者解的确定性变异(deterministic variability)来刻画,也就是说鲁棒优化是用来寻求对不确定性免疫的解的一类方法(Bertsimas and Sim, 2004)  。

在传统的优化模型中,通常假设模型的输入数据是具体的、准确的数值。然而,现实生活中所获得的大部分数据都是具有一定的误差。而有时细微的误差也将导致优化问题的最优解不再最优 (suboptimal) 或者导致原问题不具有可行解(infeasible)。 

以NETLIB中题 PILOT4 为例,其某一约束为: 

用Cplex 解得这个问题的解为:

如何解决这个问题?

最直观的方法是,假设每一个系数都在一定范围内变动,从而求一个解使得对所有在这个范围内变动的系数都是最优的。比如,对于约束

然而,此种方法因所得到的解太过于保守(conservative)而饱受诟病。

随后,Ben-Tal and Nemirovski (1998, 1999, 2000) 和 EI-Ghaoui and Lebret (1997); El Ghaoui et al. (1998)为降低保守性而引进了椭球型不确定集(ellipsoids uncertainty set)。同时也考虑了其他形式的不确定性,比如行不确定性。其中,椭球型不确定集一方面比较难跟现实数据结合,另外一方面,转化(reformulate)之后的模型大都是二阶锥规划(second order cone programming)或者半正定规划(semi-definite programming)问题--求解起来比较复杂。此外,这种方法依然比较保守。

2004年,Bertsimas and Sim (2004) 为了克服椭球型不确定集的缺点,引进了预算不确定集(budget uncertainty set),将原问题转化成线性规划问题,并且得出了所得解可行概率的下限,也即所得解对所有约束不可行的概率的上限。

我们把这种将模型参数假定在给定不确定集中而进行优化问题求解的方法统称为经典鲁棒优化(classical robust optimization )。

考虑经典的鲁棒优化,传统的最小最大鲁棒优化模型:

如果在实际中决策者不仅仅已知优化模型某些参数(以下称为随机变量,即random variable)的支撑集(support set),还精确已知这些参数服从某一概率分布,那此类优化问题称为随机优化问题(stochastic programming):

从上述模型可以看出,鲁棒优化和随机规划几乎是两种方向相反的方法,即鲁棒优化完全摆脱任何概率分布而随机优化完全包含于一个固定的概率分布。

但这两种方法也受到其建模前提的限制,具体如下:

如果鲁棒优化忽略了有价值的概率信息,那么可能导致过于保守的计算结果,而随机规划可能需要过多的概率分布信息,但是这些信息对于建模者来说可能是不可用的;

为了解决上述局限性,对鲁棒优化和随机规划进行推广,具体思路如下:相比于假设一个特定的概率分布,现在考虑有一定数量的模糊的概率分布。

例如,不考虑假设随机元素的概率分布是均值为0,方差为1 的标准高斯分布,而是可以考虑均值相同但方差不同的所有高斯分布,或者可以考虑均值接近于0,方差接近于1 的所有分布。

这种关于概率分布的模糊性可以通过指定一个集合来构建,其元素是可能考虑到的所有概率分布,称这个集合为模糊集 (Ambiguity set) 。在模糊集中选取一个分布,使得在最坏情况下进行模型求解。这样所求得的解就具有一定的鲁棒性。也即,模型(1.3)将变成

以上所阐述的经典鲁棒优化模型和分布鲁棒优化模型只适用于单阶段(single stage)问题。

而现实中所面临的决策往往是多阶段(multi-stage)的。其中,最经典的莫过于两阶段随机规划模型:

也即第二阶段的决策不仅依赖于第一阶段决策变量还依赖于随机变量的实现值(realization)。这就导致各阶段之间决策变量和随机变量之间的交互使得问题的复杂度随着阶段的增加而呈指数增长,也即"维度诅咒"。

在随机规划中,学者们通过引入决策规则(decision rule)去近似地解决这一问题。但是,因为近似模型表现不好而被"打入冷宫"。而鲁棒优化的出现,让决策规则重新焕发出了勃勃生机。本书将在第五章详细介绍多阶段随机规划问题以及如何使用不同的决策规则和鲁棒优化的方法对其进行近似,并且取得很好的近似效果。



1



Persuasion with unknown beliefs

https://doi.org/10.3982/TE4742

Svetlana Kosterina


本篇文章与上述鲁棒概念中第一种简单解的情况类似,说服人对于被说服人的信念了解有限,即被说服人的信念是在一定范围内变动,基于此,作者描述了当接收者的信念未知时,说服模型中的最优信息结构。 


1


背景

在试图说服某人时,了解说服对象所持有的信念是非常有用的。然而,实际情况中说服方往往不知道这些信念。当对先验信念的了解有限时,应该如何设计说服工作? 


2


模型


2.1


payoffs

状态空间是一个区间[l,h],l>0。发送方的偏好与状态无关。如果给定接收方的先验值和信号实现,接收方对状态的期望值为e,发送方得到的效用为u(e)。w*:怀疑阈值。


2.2


Priors

发送方有一个已知的状态先验,而接收方有一组先验。Φ:[l,h]上概率测度的所有累积分布函数的集合。发送方先验的累积分布函数为𝐹。假设𝐹的密度𝑓=𝐶。接收方的先验集合由参考先验G和无知指数a∈[0,1]表示。接收方的先验集是

也就是说,接收方的先验集合是所有赋予每个集合 A 的权重至少与参考先验G赋予 A 的权重一样大的先验,其比例为 1-a。 

考虑状态空间离散的模型来理解先验集的假设。那么接收方的先验集由所有为每个状态 w 分配至少 (1 − a)g(w) 概率的先验组成。因此发送方知道接收方相信每个状态 w 的概率至少为 (1−a)g(w),但不知道这个概率到底是多少。 

无知指数a可以衡量发送方的无知程度:a越大,发送方越无知。具体来说,如果 a=0,即不存在无知,那么接收方的先验集合就只剩下一个先验--这就是参考先验G;而如果a=1,即完全无知,那么接收方的先验集合就包括了所有先验。


2.3


Information structures and evaluation of payoffs

行动顺序如下: 

①发送方承诺一个信息结构π。 

②选择接收方的先验F∈Cag来最小化发送方的收益。 

③实现状态(从发送方的角度来看,状态是从分布Fs中得出的)。 

④根据信息结构π实现信号。 

⑤接收方在看到信号实现σ后,通过接收方的先验F和信息结构π,形成对状态的期望。 

考虑在给定每个状态的信号实现数量有限的信息结构上。

如果发送方选择信息结构π,并且具有先验F的接收方看到信号实现σ,则接收方对状态的期望为

那么,如果发送方选择信息结构π且接收方的先验为 F∈Cag,则发送方的收益为

接收方的先验是从集合Cag中选择的,以最小化发送方的收益。因此,发送方选择信息结构π的收益为 

发送方的均衡收益是


3


主要结果:最优信号的特征 

 用 σ1 表示信号实现,并将这一信号实现称为建议批准的信号实现。在此信号下,建议采取高行动的信号实现的概率在阈值 w∗ 以上为 1,在 w∗ 以下为双曲线。接收方动作的分布𝑆^𝑡𝑐如下:给定常数t≥t,c≥0,状态ω中动作1的概率由下式给出

定理1说明,最优信息结构诱导的接收方行动分布是唯一的,最优信息结构有两种实现方式,即σ1和σ0。接收方在看到信号σ1后采取的行动为1,而在看到信号σ0后采取的行动为 0。而且描述了最优信号的特征,证明了最优信号具有双曲线函数形式。


4


结论

对于接收者来说,完全无知的发送者是最好的情况。这是因为当发送者的无知a趋近于1时,发送者会变得非常谨慎,并建议接收者只在发送者和接收者同意的状态下采取高动作。因此,当检察官对法官的先验非常无知时,当且仅当法官在完全信息下判定被告有罪,她建议法官判定被告有罪,这是法官的最佳结果。 

这些结果可能对案件的法官分配产生影响。例如,为了限制检察官在收集证据时对法官的了解,人们可能希望推迟透露将指派哪位法官审理此案。检察官可能知道法官将从一组给定的法官中选出,但不知道将从这组法官中指派哪一位。另一种限制检察官信息的方法可能是将他们与过去没有合作过的法官配对。

本文的主要贡献在于

①描述了当接收者的信念未知时,说服模型中的最优信息结构。 

②考虑发送者无知对福利的影响。 

③最后的贡献在于解决了一个不适用启示原则的机制设计问题。


2


Robust Contract Designs: Linear Contracts and Moral Hazard

Operations Research

https://doi.org/10.1287/opre.2020.1994

Yimin Yu,Xiangyin Kong


本文将上述鲁棒优化理论运用到委托-代理合约设计中,考虑了1.代理人随机产出分布为椭球型不确定集;2.代理人分别为风险中性和风险厌恶,委托人如何运用最大最小(max-min)决策方法求解最优合同,以解决道德风险(隐藏行为)的问题。


1


研究问题

激励合同在现代商业中很普遍,特别是在代理关系中。公司设计了各种激励合同来解决代理人和委托人之间的利益冲突。在各种类型的合同中,简单的线性合同在实践中很流行。 

模型的不确定性是指决策者对分布模型的模糊性或不确定性。在模型不确定性的条件下,由于需要完整的模型信息,基于经典代理理论的传统激励契约可能无法激励代理人。目前尚不清楚存在模型不确定性的情况下如何设计激励合同来激励代理人。合同的形式应该是什么样的?一个简单的线性合同是最优的吗? 


2


分析问题


2.1


模型设定

一个公司(即委托人)雇佣一个代理人进行生产,代理人可以付出高或低的努力,分别用𝑒和𝑒表示,来扩大随机产出。设𝑐(𝑒)为付出努力水平(𝑒=𝑒 ,𝑒)所需要的成本,且𝑐(𝑒 )>𝑐(𝑒)。公司既无法观察到代理人的努力情况,也无法观察到代理人的努力成本,因此这是一个典型的道德风险问题。

如果公司不提供努力激励,代理人将付出较低的努力水平。为了激励代理人,公司提供了一份产出合同。本文考虑的博弈顺序如下:

(1)该公司提供一份合同,根据产出的实现来指定佣金。如果代理人拒绝了合同,博弈终止。如果代理人接受了合同,博弈继续。 

(2)代理人选择努力水平𝑒∈{𝑒 ,𝑒}。 

(3)随机产出γ实现,且双方都能观察到。公司获得利润γ−ω(γ),代理人得到佣金ω(γ)。我们假设随机产出γ遵循一个离散的概率分布。给定代理人的努力𝑒,产出的条件分布如下: 

 其中𝑒∈{𝑒h ,𝑒l}和𝑦0 <𝑦1 <⋯<𝑦n-1 <𝑦n(w.p.代表“以...概率”)。参数𝑎1,𝑎n可以解释为代理人通过付出努力𝑒来提高产出能力。 


2.2


稳健的合同设计

(1)根据公司的知识,任何合同都是根据其最坏情况下的表现来判断的; 

(2)激励相容条件适用于不确定集中的任意参数,例如,公司希望代理人对不确定集中的任意参数付出最大的努力; 

(3)公司希望确定使自身最坏情况表现最大化的合同。


2.3


具有参数不确定性的公司最优稳健合同设计问题——风险中性代理人

公司的合同设计问题可以表述如下:

经过一系列数学变换,文章将最优鲁棒契约设计问题转化为一个社会优化问题,如下式所示:

 分析结果:

最优稳健合同包括两部分:基本薪酬和线性奖金。为了说明主要思想,文章通过图1中证明了线性契约的最优性。

假设在无差异曲线上而不是在𝐷𝐸上的点A是最优的。(15)式中定义的社会总福利是一个常数

减去𝐴𝐷和𝐴𝐸的总距离(从x到0的距离是

)。我们通过矛盾证明点A不可能为最优。如果我们在𝐷𝐸上将点A移动到点B,𝐵𝐷和𝐵𝐸的总距离严格小于𝐴𝐷和𝐴𝐸的对应距离。所以通过从点A移动到B,我们得到了对公司和代理人来说严格的帕累托改进。这表明点A不能是最优的。那么,点C(即无差异曲线和𝐷𝐸的交集)必须是最优的。这表明只有线性契约是最优的。 


2.4


具有参数不确定性的公司最优稳健合同设计问题——风险厌恶代理人

 具体来说,我们假设代理人具有如下效用函数:

为了用分段线性凹效用激励代理人,公司的最优鲁棒合同设计问题如下:

 分析结果:

 命题4指出,对于分段线性凹效用的代理人,最优鲁棒契约仅包括渐进固定支付和具有渐进佣金率的线性奖励。图3说明了最优鲁棒契约的结构。我们把这种类型的合同称为分段线性合同。 


3


研究结论

  1. 对于风险中立的代理人,线性合同是最优的,即公司向代理人支付固定的基础工资和已实现产出的固定佣金率。与现有文献相比,我们证明了线性合同是唯一对参数不确定性具有鲁棒性的契约类型。

  2. 当代理人拥有分段线性效用函数时,唯一的最优鲁棒契约是分段线性合同,它由渐进固定支付和具有渐进佣金率的线性奖励组成。因此,从鲁棒性的角度,我们对为什么线性合同和分段线性合同在实践中如此流行提供了一个新的解释。

识别二维码关注我们

文章推荐人 | 金长志 沈昀函

审核 | 罗陈斌

校对 | 韩小丽 金长志 沈昀函

排版 | 陈正


东南数智港
智能商务分析=数据建模+决策优化+算法实现
 最新文章