智能绿色引导：通过数字足迹和因果机器学习减少产品退货

文摘科学 2024-11-13 12:01 天津

引言

近年来，全球电子商务经历了显著增长，最近双十一，驿站的快递堆积成山。但是网购的退货现象非常普遍，在时尚行业，退货比例可以达到惊人的50%。

这种高比例的退货在财务和环境方面都产生了巨大的负面影响，比如对零售商来说，建立退货基础设施的成本，在这个过程中产生的运输费用，以及准备退回产品以供转售都会削弱盈利能力。而且很多商品退回之后只能降价出售或丢弃。

而在环境方面，在美国，仅退货运输一项就在2022年排放了超过2400万公吨的二氧化碳。同时超过100亿磅的退货产品和包装被送往垃圾填埋场，造成了大量自然资源的浪费。

因此，减少退货已成为零售商的关键业务重点和紧迫的社会目标。那么为了减少退货，零售商可能会转向严格的退货政策（例如收取运费或不退款手续费），但是严格的退货政策未必能持续有效地减少退货，反而可能损害收入和利润，比如很多人买衣服会特意买有运费险的，如果没有运费险就会换一家。

基于此，业界和研究人员都在寻找既能减少产品退货，又不损害零售商经济利益的方法，本文提出了一种称为green nudging，即绿色引导的信息干预措施。作者与一家欧洲的时尚零售商合作，开发了一个绿色引导，主要包括两部分，一部分是在整个购物过程中，顾客只要打开购物车就能看到的购物车提示，以及顾客买完商品之后出现的购买后提示。作者进行了一项大规模实地试验，共有117304个参与者，验证了绿色引导的有效性。之后又基于数字足迹和购物车数据，使用现代因果机器学习方法来处理异质性，依靠非策略性评估来评估仅向特定顾客提供绿色引导是否能增强其效果。

实证研究

实地研究

作者和合作伙伴的用户体验部门进行合作，开发了一种包括两个设计元素的绿色引导：第一个元素是在顾客查看购物车时显示的信息提示（shopping cart prompt，购物车提示），第二个元素是在完成购买后带有自我承诺功能的购后信息提醒（reminder prompt，购买后提示）。购物车提示向顾客告知退货对环境的影响，鼓励更为深思熟虑的购物选择。购买后提示则在顾客收到最终购买确认后触发，强调退货对环境的影响，并鼓励顾客在五分等级上作出减少退货的承诺。

图 1（彩色在线）绿色提示的元素

说明：购物车提示会在消费者第一次查看购物车时出现，而购买后提醒会在支付显示。双重提示包含两个元素，而单一提示仅包括支付后的提醒。

实验将访问这个线上商铺的消费者随机分配到以下三组中的一组，第一组是对照组，是没有任何引导的；第二组是单一引导组，只出现购买后提示，第三组是双重引导组，会出现购物车提示和购买后提示。

实验持续了七周，期间有数百万访问者浏览了该网站，共有73235人完成了购买，转化率与时尚零售行业的水平一致。

表1. 个人顾客现场实验的结果

实验结果如下：

表2.绿色助推分析的统计摘要

图2.（彩色在线）绿色推动相对于对照组的总体效果

说明：描述了实地研究中三个不同组的退货份额（以运输量和价值衡量）、查看购物车后购买的份额以及相对于对照组的销售额。条形图上的垂直线表示95%的置信区间。

实验结果表明，双重绿色引导干预能够在不影响销售的情况下显著减少产品退货。

退货概率：双重引导处理组的顾客平均减少了2.6%的退货概率，即比对照组更不可能退回至少一件产品并进行退货运输（p<0.03）。

退货价值：接触双重引导的顾客退回产品的平均价值为17.88货币单位，而对照组的顾客退回的产品价值为18.49货币单位（−3.29%，p<0.03）。

值得注意的是，这些退货减少效果并未对销售指标产生负面影响（即，从业务角度来看，双重引导似乎并未削弱购买行为）。

销售额：看到双重引导（尤其是购买中的引导元素）的顾客购买了价值51.98货币单位的产品，这一金额与对照组顾客的52.09货币单位无统计显著差异（p=0.81），表明引导并未降低顾客的消费意愿。

实际上，在个体层面的净销售分析中，发现了正向但统计上不显著的处理效应（+1.48%，p=0.29）。

综上所述，这些结果从环境和商业两个角度验证了双重绿色引导的有效性：在环境方面，它显著减少了退货运输，每年可减少约62.4万吨二氧化碳排放量；在商业方面，它在保持销售水平的同时显著降低了退回产品的价值，所以合作伙伴决定在德国线上商店中持续运行这一绿色引导项目。

额外发现，在实行了绿色引导后，行业合作伙伴收到了积极的顾客反馈，NPS值有显著提升，可能表明了绿色引导对合作伙伴的品牌形象和长期增长有额外的积极影响。

这个时候我们很自然的会问，是哪个提示在起作用？根据实验数据分析，应该是购物车提示在起作用。

进一步的，购物车提示究竟改变了什么？通过更深入地对顾客的购物车进行分析，发现购物车提示减少了包退购买行为，即顾客在购买重复产品时已经明确知道会退货了。

实验结果表明，在首次看到购物车提示之前，双重引导组和对照组顾客的购物车中包含重复产品的可能性没有显著差异，但是在看到购物车提示后，与对照组相比，双重引导组的顾客最终购物车中包含重复产品的可能性显著降低。

利用因果机器学习实现个性化提示

在分析了绿色引导干预的总体影响后，作者接下来利用新颖的机器学习方法来探索重要的处理异质性。具体来说，本节展示了如何通过构建CML模型识别双重引导的显著处理异质性，并说明如何通过“智能”地仅对特定顾客实施引导来放大其对减少退货的总体效果。

接下来的分析将专注于双重引导（即研究的主要处理方式，以下简称为绿色引导）。这样做的原因之一是实地实验中的结果已显示出其良好的前景，提供了一个稳固的基础以进行进一步优化。更重要的是，购物车提示被战略性地放置在购物车中，可以影响购买行为。然而，看到该提示后，一些用户可能会产生被施压的感觉，进而对建议的行为产生抵触情绪，或者仅仅被提醒退货的可能性和便利性，这两种情况都可能导致退货量的悖论性增加。

因此，识别处理异质性尤为重要，以减轻潜在的负面影响。

作者首先提出了一个因果机器学习模型，用于估计绿色引导在个体层面的因果效应，从而识别重要的处理异质性。

这个模型由一个因果森林组成，利用选定的顾客数据作为预测变量，来估计双重引导对退货运输的条件平均处理效应（CATE）。具体上，模型使用了这些变量：

表3.CML模型的预测变量

环保商品的数量可能代表了顾客对绿色引导更加敏感。

首次查看购物车中有重复商品可能表明顾客有“包退购买”的意图，即有计划地准备退回一个或多个商品。

“女装”类别可能表明顾客为女性。

“儿童”类别则可能提供关于顾客年龄和家庭状况的信息。

经常选择“促销”类别可能暗示顾客对价格的敏感性。

此外，顾客对绿色引导的响应可能因购物时间（周末或工作日）而异（Grahl et al. 2023）。

个体的数字足迹包含有意义的信息（Berg et al. 2020）。

互联网服务提供商、浏览器类型和IP地理位置，已有研究表明这些变量在解释行为异质性方面具有相关性（CivicScience 2015; Berg et al. 2020; Ebert et al. 2021）。

本文使用因果森林来估计异质性处理效应。这种方法通过各种预测变量组合计算条件平均处理效应（CATE）。实际上，因果森林通过不断将顾客分组，计算每个子组中处理组和对照组效果的差异，将总体平均处理效应细分为局部条件平均值。

因果森林能够捕捉高度非线性的处理异质性，特别适用于涉及大量协变量且其与绿色引导效果的关系复杂且未知的研究。因此，因果森林可以揭示传统方法可能忽略的高维处理异质性。

简单来说，因果森林的作用就是找到最合适的顾客，让我们知道对哪些顾客进行绿色引导最有效。

在本研究中，作者使用因果森林来估计顾客在其退货概率方面的条件平均处理效应，即：

yi,1表示顾客i在接受干预（例如绿色引导，wi=1）后的结果。

yi,0表示顾客i在未接受干预（wi=0，即没有引导）的结果。

X=xi表示顾客的特定特征（例如购物车内容、浏览行为等）。

E(⋅)表示期望值。

公式表示在给定顾客特征X=xi的条件下，绿色引导对顾客退货行为的平均影响。换句话说，条件平均处理效应估计了在特定顾客特征组合下，引导干预对顾客行为的效果差异。

在这种情况下，如果τi为负，表示绿色引导预计可以减少退货；如果 τi为正，表示绿色引导可能会增加退货。

因果森林将这一想法推广到由多个决策树组成的“森林”中。对于给定的个体i，最终的条件平均处理效应（CATE）估计值可以通过对森林中的所有决策树K的估计值取平均来获得，即：

τ^i表示每棵树对CATE的估计值，∣K∣是决策树的数量。

通过组合多棵树并计算每棵树的预测结果，因果森林还可以估CATE的标准误，从而提供置信区间和统计显著性的测量。这使得因果森林方法不仅能给出CATE的估计值，还能衡量估计值的可靠性。

作者对CML模型的评估完全基于测试数据，分为两个步骤。

首先，通过组平均处理效应来评估CML模型的预测效果，其中作者分别估算了CML模型预测会接受干预和不会接受干预的个体的处理效应。

其次，通过非策略性评估来评估基于CML的干预策略。非策略性评估利用在不同策略条件下收集的数据来估计该策略的效果。在本研究中，作者基于测试数据中的可用观测，通过逆倾向得分（IPS）加权估算基于CML的策略效果。

基于CML的干预策略如下：仅当CML模型预测退货将减少时，才对顾客进行干预。

形式上，该策略π将每个用户i映射到一个干预决策：

在第一步中，计算两个组的观察到的平均处理效应，即 CML 模型预测会接受干预的顾客(𝜋(𝑥𝑖)=1)和预测不会接受干预的顾客 (𝜋(𝑥𝑖)=0) 。这两个组中都包含在实地实验中被随机干预（wi=1）和未被干预（wi=0）的顾客。

注意，基于CML的干预策略π仅依赖于τ^i，这是xi的一个函数，因此从定义上它与实际的随机干预独立。因此，观察到的平均处理效应是各自组在总体中的实际效应的无偏估计。分析的目的是确定CML模型的预测是否与未见的测试数据上的结果一致，以及模型是否能够有效识别负面的干预效应。

在评估的第二步中，作者基于可用观测值（即随机分配的干预与基于CML的策略一致的观测值 (𝑤𝑖=𝜋(𝑥𝑖))）来估算智能绿色引导的平均退货率。

为了考虑可用率可能存在的差异，基于倾向得分对观测值进行加权，从而得到总体平均退货的无偏估计量R^_IPS(π)，其计算公式为：

其中N表示测试集中的观测数，(𝑥𝑖)是估计的倾向得分。

本分析提供了基于CML策略的实际效果估计，从而为智能引导潜在的优化效果提供了洞见。

图3.（彩图在线显示）按处理策略划分的组平均处理效应（ATEs）

对于CML模型建议进行引导的顾客组（π(xi)=1，占测试数据的59.3%），双重引导显著减少了退货率超过两个百分点（p<0.03），相当于退货量减少超过7%。这一效果比在实地研究中的总体顾客群效果高出四个百分点。

而对于CML模型不建议引导的顾客组（π(xi)=0，占测试数据的40.7%），绿色引导似乎适得其反（p=0.109），使退货量增加了1.7个百分点。因此，不对这些人进行干预可以从商业和环境角度提升整体效果。

值得注意的是，其他业务指标的分析表明，两组在购物车转化率和销售额方面的处理效果没有显著差异。

为什么绿色引导对大约40%的顾客会适得其反?

CML模型推荐引导的顾客与未推荐引导的顾客之间的特征比较揭示了若干重要发现。

互联网浏览器类型是一个有意义的指标。使用Safari的顾客对绿色引导更敏感。这一趋势可能与Safari与Apple用户的关联有关，Apple用户可能更年轻或收入更高（CivicScience 2015；Berg等人，2020），因此对绿色引导的接受度更高（Goldstein 等人，2008）。

发现互联网服务提供商在两组顾客中有所不同。CML模型识别为对引导有响应的顾客更可能（或不太可能）使用Vodafone（或Telekom）作为其互联网服务提供商，这可能与不同提供商的定价策略相关，从而暗示顾客的收入水平可能不同（Berg等人，2020）。

周末购物者相比工作日购物者更易受到引导，这可能是因为周末的压力较小，与类似文献的发现一致（Grahl等人 2023）。

此外，基于实地实验分析的预期，观察到不同州的顾客对绿色引导的响应存在地区差异。

最后，绿色引导对那些本来退货率高于平均水平的顾客特别有效。相反，对于退货率通常低于平均水平的顾客，绿色引导似乎适得其反。一个可能的原因是绿色引导可能无意间提醒了这些顾客退货的选项，从而导致更多的退货。

表4. 测试数据上智能绿色引导分析的汇总统计

图 4.（彩图在线显示）不同处理顾客比例的智能绿色引导效果
说明：曲线展示了随着测试数据中不同比例的顾客被逐步引导（横轴），平均退货运输率（纵轴）的变化。顾客的选择基于其预测的条件平均处理效应（CATE，），按升序排列。阴影区域表示 95% 的置信区间。退货数据基于 IPS 估计量，标准误相对于随机基准计算。

曲线展示了智能绿色引导的总体效果，随着逐步加入CML模型预测退货减少最多的前10%、20%、30%的顾客，退货率逐渐下降。

如果对相同比例的顾客随机实施绿色引导（虚线），退货率将从控制组（没有顾客接受干预）线性下降至无差别绿色引导（所有顾客都接受干预）的水平。

而基于因果森林的CML模型曲线明显偏离这种线性路径。研究发现，退货率的最优结果（曲线的最低点）是在对大约一半的顾客进行干预时实现的。

曲线旁的置信区间进一步支持了智能绿色引导比无差别绿色引导更为有效的结论，带来了经济和生态上的双重收益。

智能绿色引导通过仅影响大约60%的顾客便达到了其有效性。这种高效的定位为进一步的个性化提供了机会。例如，目前未受到绿色引导影响的剩余约40%的顾客，可能对其他类型的引导策略反应更佳。
使用简单的线性区分器或单变量分割来选择干预对象并未显著提升引导措施的效果。例如，分析显示，不同州之间的处理效果差异显著。然而，排除平均上对绿色引导表现出显著负面反应的巴登-符腾堡州的顾客，仅使引导效果略微提升了0.1个百分点。

总体而言，智能绿色引导的结果展现出乐观前景。从商业角度看，实施智能绿色引导相比无差别策略可以将成本节约潜力翻倍。同样重要的是其环境效益。若在美国的物流行业全面应用，这一方法可以将二氧化碳减排效果翻倍，每年超过100万吨。这些双重优势突显了智能绿色引导作为有效个性化策略的潜力，不仅对企业有益，也对环境有利。

实践启示

本文提出了两个主要发现：

第一个是大规模的实地实验表明绿色引导成功地减少了产品退货，这对行业的合作伙伴相当于每年在处理成本上节省约34万美元，转化为利润增长8.7%。

第二个发现是使用现代因果机器学习分析发现绿色引导显著减少了约60%顾客的退货量，但对剩余40%的顾客却导致了退货量增加，可以通过机器学习模型实行“智能化”的绿色引导，有助于进一步减少商品退货。总而言之，本文通过传统的行为干预+现代机器学习方法，达成Better Marketing for a Better World的目标。

文章来源及解析作者

von Zahn, M., Bauer, K., Mihale-Wilson, C., Jagow, J., Speicher, M., & Hinz, O. (2024). Smart green nudging: Reducing product returns through digital footprints and causal machine learning. Marketing Science.

解析文献作者：张文靖，南开大学商学院2024级硕士研究生

文字编辑、排版：米开静，南开大学商学院2024级硕士研究生

栀子花营销沙龙

本学术沙龙是由南开大学杜建刚教授和任星耀教授于2013年成立，随后天津大学、天津财经大学、天津师范大学、天津理工大学、天津工业大学等多名教师加入，每周共同精读和研讨最新的营销学术成果。