下载链接:
https://doi.org/10.1287/opre.2022.0006
研究背景
在传统需求估计假设中,对于每笔交易,消费者从一系列替代品中选择一个选项。然而,消费者可能不会考虑offer set中的所有产品。例如,在零售业中,从咖啡类别中选择的消费者可能不会评估完整的品种,而只考虑在产品全集中的子集(例如,无咖啡因咖啡)。如果忽视这些考虑集,会导致模型偏差。为了解决这个问题,一些研究中提出了先考虑后选择(CTC)模型。
尽管目前关于CTC模型的研究很丰富,但CTC模型往往很难结合实际,因为消费者的考虑集不能被观察到:只能知道消费者的选择和offer set。当观察不到考虑集时,CTC模型可能无法被识别,目前还不清楚它们相比经典模型提供了什么预测优势。
研究问题
主要目标是描述商业环境下,使用CTC模型是否可以提供与基于RUM的评估相比更高质量的评估来描述消费者的选择行为。
模型构建
产品全集 N = {a1,a2,…,an}, a0不购买选项,N+= N∪{a0}.
消费者顺序来到店铺,offer set S⊆N;
选择产品j的概率
假设消费者选择行为遵循两阶段CTC模型。在第一阶段,消费者形成一个考虑集C⊆N。在第二阶段,她从选择集S∩C或不购买选项a0中选择。
在这个模型中,要购买产品,产品必须同时被提供和被考虑。卖方通过决定offer set S来限制消费者的选择。然而,消费者进一步将她的选择限制在她的考虑集C中。
产品的偏好排序由双射排名函数,
为每个产品aj指定偏好σ(aj)。
假设所有的不购买选项在排序的底部,因此
消费者偏好由联合概率分布v表示
当给出S时,消费者会以概率v(σ,C)抽样一个排名σ和一个考虑集C,并选择产品
购买概率建模为:
为了估计,用独立考虑集(ICS)模型的混合形式来近似一般CTC模型。
单类ICS模型由单个偏好排序σ和产品形式考虑集分布定义。每个产品aj都与包含概率(或倾向)参数θj相关联;θj∈[0,1],表示消费者将产品aj纳入其考虑集的概率。消费者相互独立地做出产品包含决定,因此,抽样考虑集C⊆N的概率为
可以得到选择产品aj∈S+的概率是:
第一个表达式对应于没有产品被考虑的情况的概率。第二个表达式对应于产品aj被考虑,且没有一个产品比aj更受欢迎的概率。
CTC模型类的识别条件:能否从购买概率中唯一地识别出底层CTC模型的参数。
考虑集的边际分布,定义为
能从观察到的选择概率中识别。
虽然考虑集的边际分布是可识别的,但排名本身的边际分布却不是。
为了确保完整的识别,需要进一步限制CTC模型。考虑一类模型,其中消费者在其偏好排序中是同质的(即,模型由单个偏好列表描述),但它们在其考虑集中是异构的。把这个模型称为一般考虑集(GCS)模型。有了这个限制,选择规则是可识别的。
观察到的选择概率的集合与潜在的GCS模型是一致的必须满足的充分必要条件。
基于合成数据的offer set抗噪声鲁棒性研究
当offer set没有被完美观察到-存在噪声,并且训练和测试数据之间的噪声不对称,CTC模型的表现优于经典选择模型。在这里,offer set的噪音是指产品被错误地记录为提供或缺货,而实际上并不是。噪音是不对称是指噪音在训练和测试数据集之间有所不同(例如,因为影响库存的因素会随着时间的推移而变化)。相反,当噪声对称时,CTC模型具有与经典模型相当的性能,几乎没有预测优势。
结论
展示了如何有效地估计一般类别的CTC模型,并解决仅依赖销售交易数据时识别此类模型的问题。
在合成数据设置下检查该方法的性能,控制训练和测试数据之间的不同噪音水平和噪音不对称。将CTC模型应用于两个现实世界的环境:零售业务和汽车共享平台。实证结果表明,当offer set的数据中存在噪音时,CTC模型的预测性能明显优于基于RUM的模型。此外还表明,当用于训练模型的offer set描述的准确性与保留样本中用于推导预测的offer set描述的准确性之间存在不对称时,CTC模型在预测性能方面的相对改进就变得更加重要。
识别二维码关注我们
文章推荐人|陈丹颖
笔记审核人 | 王图南
校对 | 罗陈斌
排版 | 安沁文