成果快照 | 面向大规模数据驱动的品类优化的部分排序选择模型

文摘   2023-11-29 11:20   中国香港  

下载链接:

https://doi.org/10.1287/ijoo.2019.0037



研究背景

商店的产品组合选择对其成功与否有着至关重要的影响。然而,找到合适的产品组合来吸引大量的消费者是一项具有挑战性的任务。现阶段已经提出了几种数学模型来优化产品组合。其中大多数都是基于离散选择模型来表示消费者的购买行为。其中,基于排序的选择模型因能够很好地表征高维产品替代效应而得到认可,因而能够较为真实地反映消费者偏好。



研究问题

提出了一种新的部分排序的非参数选择模型,用来解决品类优化问题。



模型

1、选择模型

基于排序的选择模型:假设市场购买行为被划分为不同的消费者行为,每个消费者行为都由一个有序列表表示,该列表在所有产品中建立了严格的偏好。消费者偏好的产品被称为具有较高的等级,而较不偏好的产品被称为具有较低的等级。消费者根据特定的行为,只购买一种产品,这是在她的偏好列表中排序最靠前的,并且在所提出的产品组合中可用。考虑产品集N={1, 2, ... , N},并进一步假设客户总是有不购买选项0。用σ表示消费者行为,用σ(i)≥0表示产品i的排序。

全排序消费者行为

一个具有全排序偏好序列的消费者行为σ可以被写为N∪{0}中所有N+1项的排列。以6种可供选择的产品为例,全排序的消费者行为(3,4,1,2,5,0,6)表示偏好产品为3,次偏好产品为4,以此类推,具有这种偏好的客户将购买该产品组合中排名最高的产品。注意,产品6永远不会被买到,因为它排在不购买选项0之后。一个基于排序的选择模型(σ,λ)定义为一组σ = {σ1, ... , σK}以及一个pmf ,它表示进入商店的随机消费者遵循特定行为的相应概率。

部分排序消费者行为

这里提出的选择模型假设消费者偏好列表并不一定要对所有产品(可能在几百或几千的数量级上)施加严格的排序。相反,消费者可能对这些产品的子集P(σ)有严格的偏好。我们可以将这种选择行为表示为σ = (P(σ), I(σ)),P(σ)⊆N∪{0}是严格排序的偏好产品列表,I(σ)⊆N∪{0}\P(σ)是以均匀概率被选择的无差异产品的子集。假设选项0要么在P(σ), I(σ)或I(σ)后(产品将不会被选择)。

简单部分排序消费者行为

一个简单的消费者行为包含一个严格排序的偏好列表P(σ)和一个无差异集I(σ),这两者互斥。部分排序选择模型允许σ(i) = σ(j),表明产品i和j是同等偏好的,因此属于同一无差异集的一部分。在上面的例子中,产品排序如下:σ(3)=0, σ(4)=1, σ(1)=2, σ(2)=σ(5)=σ(6)=3, σ(0)=4。

具有互补无差异集的简单部分排序消费者行为

将具有互补无差异集的部分排序消费者行为σ定义为简单的部分排序行为并令I(σ) = N∪{0}\P(σ)。我们可以进一步将简单的部分排序消费者行为推广到更复杂的部分排序消费者行为,使用q个偏好产品列表Pl(σ)(l=1,…,q)和无差异集Il(σ)。尽管部分排序的选择模型似乎比全排序的选择模型更普遍,但潜在的偏好行为本质上是等价的。考虑一个简单的部分排序消费者行为(3, {2, 5, 6}, 0)。可以转换为全排序:(3, 2, 5, 6, 0), (3, 2, 6, 5, 0), (3, 5, 2, 6, 0), (3, 5, 6, 2, 0), (3, 6, 2, 5, 0), (3, 6, 5, 2, 0)。这种转换对于任何简单的部分排序偏好列表都成立。



2、消费者偏好学习

M个分类,即 M={S1,S2,…,SM} ,v∈R(N+1)·M,表示在被呈现类别Sm时选择了产品i的消费者。将每个消费者类型的产品选择嵌入到一个矩阵A中,矩阵A中的列表示每个消费者偏好序列,行表示产品和分类。A∈R(N+1)·M×K 。Ak(i,m)=1, 消费者k从Sm∪{0}中选择产品i。∀(k,m):∑iAk(i,m)=1。最小化历史销售观测值v和销售预测:Aλ=∑kAk(i,m)λk之间的l1误差:εTr=∑(i,m)|Aλ-v|i,m。考虑给定的一组潜在相关的顾客行为,可用一个简单的线性规划求出相应的使误差最小的概率分布:

在部分排序选择模型中,选择矩阵A的设定必须满足∀(k,m):∑iAk(i,m)=1, 其中我们可以通过在无差异集上均匀分布来实现:

根据以上定义,一旦确定了消费者偏好的子集σ,就可以高效地计算出相应的选择矩阵A。

基于偏好树的消费者行为学习:A和λ都是指数大的,线性规划不易处理。因此,作者提出了一个列生成算法,进一步提出以下混合整数规划

具有无差异子集的部分排序的消费者行为可以通过偏好树有效地表示,其中明确列出的节点指的是严格排序的产品。这里,无差异集包含了所有没有严格排序的节点,即I(σ) = N\P(σ),因此不需要显式地在树中列出。图1展示了一个有三个产品的小例子,无购买选项为0。

这样的树形结构对于想要了解客户细分的店铺经理来说可能更直观,因为它关注的是那些对解释销售很重要的产品:那些在消费者偏好序列中排名靠前的产品。此外,如果成功地将搜索限制在一个显著较小的空间中,在树结构中搜索新的客户行为可能会显著地加速计算。如果我们首先关注排序靠前的产品,然后在每个分支和迭代中逐步扩展树的深度不超过一个级别,情况就是这样。由于树的逐渐扩大,我们将其称为生长偏好树( growing preference tree, GPT )。

我们的算法在GPT中迭代地搜索新的子行为,扩展树,并解决问题,以找到相应的概率λ。定价步骤在图2中举例说明,其中计算行为σ∈K的所有子行为(以蓝色表示)的成本,除非σ的偏好列表中的最后一个产品是选项0。这将表明客户将离开商店,并且子行为是不相关的。该过程迭代进行,直到l1误差足够小或执行定义的最大迭代次数。



研究结论

(1)用于品类优化的基于排序的非参数选择模型有许多优点。主要是,它们可以在不依赖以往关于市场结构的知识的情况下,以纯数据驱动的方式进行估计。它们也倾向于对过拟合不太敏感。

(2)任何部分排序选择模型都可以转化为等价的全排序选择模型,反之亦然。严格排序产品的部分表示使得我们可以通过逐步扩展一棵树来高效地训练选择模型,其中每个节点代表严格排序产品的部分列表。在这种特殊的结构上,通过列生成可以有效地发现新的偏好列表。

(3)考虑到通过生长树和列生成来训练部分排序选择模型已经被证明在品类优化的情况下是非常有效的,这可能是在其他以离散选择模型为中心的情况下探索的一条有前途的途径。

    ·识别二维码关注我们

        文章推荐人 | 史珑琳

        笔记审核人 | 陆雯慧

        校对 | 罗陈斌

        排版 | 陆雯慧

东南数智港
智能商务分析=数据建模+决策优化+算法实现
 最新文章