KDD2024 | 基于双重意图转换的搜索推荐联合模型

科技   2024-07-30 08:00   福建  
嘿,记得给“机器学习与推荐算法”添加星标

作者:章玉婷

单位:中国科学院计算技术研究所

TLDR: 推荐系统旨在帮助用户在众多候选商品中发现他们所喜爱的商品,并已服务于各种在线平台的数十亿用户。从直观上看,用户与商品的交互高度受到他们稳定的固有意图(例如,始终偏好高质量的商品)和变化的需求意图(例如,夏天想要一件T恤,冬天想要一件羽绒服)的驱动。然而,这两种意图在推荐场景中都是隐式表达的,这给准确感知用户意图带来了挑战。幸运的是,在通常与推荐系统共存于同一在线平台的搜索场景中,用户通过查询词显式表达了他们的需求意图。直观上,在这两种场景中,同一用户的交互可能受到相似的需求意图的影响,并且其固有意图是稳定的。因此,利用这两个场景中的交互数据来相互增强或补充双重意图,并进行联合意图感知建模是可行的。

然而,搜索和推荐的联合意图感知建模需要解决以下两个问题:(1)准确建模推荐中用户隐式的需求意图;(2)建模双重意图与交互商品之间的关系。为了解决上述问题,我们提出了基于双重意图转换的搜索推荐联合模型(UDITSR)。为了准确模拟推荐中用户的需求意图,我们利用搜索数据中的真实查询作为监督信息来指导其生成。为了显式模拟<固有意图,需求意图,交互商品>三元组之间的关系,我们提出了一个双重意图转换传播机制,实现了在同一语义空间中学习三元组元素间的可解释关系。大量实验表明,UDITSR在搜索和推荐任务中均优于现有的SOTA基线。此外,我们在美团外卖平台上进行了为期一个月的线上实验,平均提升了1.46%的GMV和0.77%的CTR指标。

论文:https://arxiv.org/abs/2407.00912
代码:https://github.com/17231087/UDITSR

背景介绍

推荐系统旨在帮助用户从众多选项中发现感兴趣的物品,已成为各种线上平台的重要组成部分。现有的推荐模型通常利用用户的隐式反馈,如点击行为历史,来预测其兴趣。例如,传统的协同过滤方法假设用户偏好与历史交互相似的物品。

实际上,用户的交互行为很大程度上受其复杂意图的驱动,这些意图可归类为稳定的固有意图和变化的需求意图。例如,Amy和Tom可能都对面条有需求,但由于Amy偏好辣味而Tom偏好甜味,他们会选择不同的餐馆。此外,用户的交互结果也会随需求的变化而有所不同。然而,在推荐系统中,这些意图通常是隐式表达的,这给精确的意图理解和推荐带来了巨大挑战。现有的意图感知推荐模型通常依赖于用户的隐式反馈来学习其意图。然而,这些模型面临着问题:尽管两个用户可能有相同的历史反馈,他们的固有或需求意图仍可能不同。如图1(a)所示,Amy与必胜客的交互可能是由于对意大利面的需求,而Tom的交互则是由于对比萨的需求。理想情况下,推荐系统应该向Amy推荐与意大利面相关的选项,向Tom推荐与比萨相关的选项。然而,现有的推荐模型常常缺乏显式的意图信息,导致无法区别不同的用户意图,从而产生不准确的推荐结果。

幸运的是,在搜索场景中,用户通常会通过显式的查询词表达他们的需求意图,如图1(b)所示。这种明确的搜索需求信息可以作为额外的显式信息,帮助学习推荐中的隐式需求意图。事实上,搜索和推荐任务的目标是一致的,均旨在理解用户意图,以帮助他们找到所需的物品。此外,在搜索场景中,用户的交互结果不仅受显式的需求意图(即搜索词)影响,还会受到其固有意图的影响。然而,现有的搜索模型通常专注于搜索结果与用户需求意图之间的匹配程度,忽视了其固有意图的重要性。直观上,用户在搜索和推荐场景中会保持相同的固有意图,其交互行为也可能由相似的需求意图决定。因此,利用两者的交互数据来加强或补充彼此的双重意图,并进行联合意图感知建模是可行的。然而,这种联合建模存在以下两个主要挑战:

(1) 如何利用搜索数据准确模拟推荐中的隐式需求意图?在推荐中用户意图是隐式的,但在搜索中,用户需求意图通过查询词显式表达。如果能够准确地生成推荐中变化的需求意图,可以很好地实现搜索和推荐的统一建模。现有的方法,如SRJGraph为推荐填充不变的查询信息来进行统一建模。这种方法实际上假设所有推荐交互中的需求意图是相同的,这与实际情况不符,很可能会限制推荐性能。直观的方法是将用户的历史查询数据作为额外的需求信息输入到推荐模型中进行预测。然而,没有合适的监督信息来验证需求意图的准确性,可能会导致生成的需求意图与实际需求存在显著差距。

(2) 如何将双重意图耦合来建模意图和交互物品之间的关系?固有意图和需求意图均会影响着交互的物品结果。用户的固有意图(如总是偏好便宜的物品)和变化的需求意图(如夏天需要T恤,冬天需要羽绒服)叠加在一起,会导致不同的交互结果(比如与便宜的T恤和便宜的羽绒服交互)。需求意图可以被视为从变化的交互物品到稳定的固有意图之间的差距。常见双元素融合方法是将两种意图拼接作为输入特征,但这不能完全捕捉双重意图与交互物品之间的作用关系。

为了应对上述挑战,我们提出了基于双重意图转换的统一搜索推荐联合模型(UDITSR)。UDITSR主要由两个组件组成:搜索监督的需求意图生成器和双重意图转换模块。具体而言,在搜索监督的需求意图生成器中,模型利用搜索查询作为监督信息,从而能够可靠且准确地学习用户在推荐场景中动态变化的需求意图。此外,我们设计了一个双重意图转换传播机制,通过嵌入转换,在共享语义空间中显式模拟用户的<固有意图、需求意图、交互物品>三元组元素之间的可解释关系。此外,我们还引入了意图转换对比学习,以进一步约束和优化意图转换关系。离线和在线实验验证了我们模型的有效性。为了更深入地理解该模型的有效性,我们还提供了相关意图的可视化分析。

模型方法

整体框架

我们的整体框架如图2所示,主要包括两个部分:搜索监督的需求意图生成器和双重意图转换模块。

搜索监督的需求意图生成器

  • 首先我们先定义搜索和推荐场景以及构建相应的图

    • 搜索场景:在搜索数据中,每个交互记录可以形式化为,表示用户 在查询后点击了物品
    • 推荐场景:在推荐数据中,每个交互记录可以形式化为,表示用户 点击了物品 ,但无任何显式查询词
    • 由此根据搜索和推荐数据构建了双场景图。其中用户和物品作为节点,搜索交互边存在需求属性,而推荐交互边则暂无
  • 搜索监督意图生成

    • 需求意图表示生成:由于用户的历史查询和物品的历史查询 包含丰富的需求意图信息,我们将其进行平均或加权池化获得对应表示,然后再拼接用户和物品的id嵌入作为输入信息,输入MLP中来模拟用户的需求意图

    • 搜索监督生成损失:为了约束生成的需求意图与真实的需求意图接近,我们将搜索数据中的真实查询作为监督信息,由此对于搜索数据设计了如下的生成损失:

      该损失函数约束了生成器生成的需求意图接近真实的查询需求意图。由此对推荐数据而言,保证了生成的需求意图的可靠性和准确性

    • 统一图:在为推荐交互数据生成需求意图表示后,图中的每一条边均包含需求意图属性,从而实现搜索和推荐边的统一表示。

双重意图转换

  • 双重意图转换模块:双重意图与交互物品构成三元组

    • 三元组元素:用户的稳定的固有意图和变化的需求意图共同影响着用户交互的物品,由此构成了三元组<固有意图,需求意图,交互物品>。其中用户的固有意图指的是单个用户是稳定的,因此我们利用用户id嵌入来学习用户的固有意图表示。搜索中的查询需求表示和推荐中生成的需求表示作为需求意图,交互物品表示由其id嵌入表示。由此三元组元素实则转化用户节点,边属性以及物品节点的表示。

    • 三元组元素关系(双意图转换传播):直观上,用户的双重意图,即固有意图和需求意图,叠加决定了交互的物品,如图3左图所示。用户存在偏好便宜物品的固有意图,且当前有羽绒服的需求意图,导致了用户交互便宜的羽绒服。由此我们可假设,交互物品可以看作是用户固有意图和需求意图叠加的结果。反之,用户固有意图表示应为交互物品表示与需求意图之差。基于这一假设,双重意图转换的聚合方法可以设计如下:

      双意图转换传播层后,获得不同传播层数的表示。然后按照 的权重,加权获得聚合表示

    • 关系约束(意图转换对比学习):在获得聚合表示后,为了进一步约束转换关系,我们设计了一种意图转换对比学习方法。对于正负样本对,我们认为用户真实交互的物品应该接近转换后的意图,而负样本则应远离,具体如下:

  • 模型预测

    • 获得表示后,本文使用两个MLP分别预测搜索和推荐样本的得分

    • 然后计算BPR损失

    • 总损失:结合上述的搜索监督生成损失、意图转换对比损失和BPR训练损失,通过加权求和获得总损失进行训练

实验结果

主实验结果

离线实验

由于我们未找到包含搜索和推荐数据的公共数据集,我们在美团平台上收集了两个搜索推荐联合数据集,并在这些数据集上进行了实验。表2的实验结果表明:与性能最好的基线相比,UDITSR在搜索和推荐任务中分别获得了6.22%和3.06%的平均性能提升。

在线实验

由于美团外卖平台上的搜索和推荐系统在架构上存在显著差异,我们暂时将方法部署在主页推荐系统上,并进行了从2023年12月18日到2024年1月17日为期一个月的线上A/B测试。我们利用带有查询信息的搜索数据来指导用户需求意图表示的学习,并将学习到的图嵌入作为现有推荐模型中的额外特征。对照组为美团外卖平台现有的线上推荐模型。结果显示,在部署该方法后,平均提升1.46%的GMV和0.77%的CTR指标,证明了该方法的有效性。

意图可视化

为了验证 UDITSR 模型的意图建模能力,我们将 UDITSR 与其没有双重意图转换的消融版本UDITSR(w/o IntTrans)进行了比较。为清楚起见,我们从搜索和推荐测试数据集中各随机抽取了 100 条正样本用于绘图。图中蓝色表示交互的物品,橙色表示学习到的意图。具体来说,在UDITSR(w/o IntTrans)中,类似于传统模型中 NGCF 和 LightGCN 等模型捕获的偏好/意图,我们将学习到的用户嵌入视为意图,如图4(a)和(d)所示。而在UDITSR中,重意图转换机制将固有意图和需求意图耦合起来,构成最终意图,即,如图4(c)和(f)所示。为了与UDITSR(w/o IntTrans)公平比较,我们在图(b)和(e)中可视化UDITSR学习到的固有意图,即

理想情况下,用户最终意图的分布应该与交互物品表示的分布相近。图3(a)和(d)表明,UDITSR(w/o IntTrans)学习到的意图是集中的,而交互物品表示则是分散的,这表明二者之间存在明显差距。相比之下,图3(b)和(e)表明UDITSR学习到的固有意图较为分散,这表明该模型能够更好地捕捉到不同用户个性化的固有意图。然而,学习到的固有意图与交互物品之间仍存在明显差距,这凸显了学习需求意图的必要性。相比之下,UDITSR学习的总意图分散在目标交互物品的空间中,与交互物品分布接近,这展现了其优秀的意图建模能力。

总结

我们提出了一种新的统一意图感知建模方法,用于搜索和推荐任务的联合优化。我们认识到用户行为是由他们的内在意图和变化的需求意图驱动的。为了准确地学习用户对推荐的隐式需求意图,我们创新提出一种搜索监督的需求意图生成方法,该方法利用来自搜索数据的显式查询进行监督学习。此外,我们提出了一种双重意图转换传播机制,用于对用户的双重意图与其交互物品之间的关系进行可解释性建模。特别地,我们引入了意图转换对比法来进一步约束这种关系。广泛的离线实验表明,UDITSR在搜索和推荐任务方面都优于现有的领先基线。此外,在线A/B测试进一步证实了我们模型的卓越性能。最后,意图可视化清晰展示了模型出色效果的深层原因。


欢迎干货投稿 \ 论文宣传 \ 合作交流

推荐阅读

论文周报[0722-0728] | 推荐系统领域最新研究进展
MM2024 | DiffMM: 当多模态推荐遇上扩散模型
KDD2024 | 兴趣点推荐中的隐私风险研究

由于公众号试行乱序推送,您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容, 请将本号设为星标,以及常点文末右下角的“在看”。

喜欢的话点个在看吧👇

机器学习与推荐算法
专注于分享经典的推荐技术,致力于传播基础的机器学习、深度学习、数据挖掘等方面的知识。
 最新文章