WSDM 2024 | 多场景推荐冷启动问题的扩散模型增强范式

文摘其他 2024-03-23 17:30 广东

记得给 “应用机器学习” 添加星标，收取最新干货

作者：香港城市大学汪宇豪

今天跟大家分享一篇WSDM 2024来自香港城市大学和华为诺亚提出的一种多场景推荐的增强方法，以改善在多场景推荐中冷启动场景的表现。具体地，本文提出了基于扩散模型（Diffusion Model）的多场景建模范式，独特地设计了variance schedule和利用了分类器，可以兼容不同的主干模型，并在两个公开数据集取得了更有效和更稳定的表现。

论文地址：https://dl.acm.org/doi/10.1145/3616855.3635807

代码：
1. Torch: https://github.com/Applied-Machine-Learning-Lab/Diff-MSR 2. Mindspore: https://github.com/mindspore-lab/models/tree/master/research/huawei-noah/Diff-MSR

背景

多场景推荐利用来自多个业务场景（例如电商平台的商品类目）的数据以同时提升这些场景上的推荐准确率，并解决数据稀疏问题。由于流行程度不同，这些场景的历史交互数量也不同，所以可以自然地按照数据量划分成丰富场景和冷启动场景，之前的研究也强调了冷启动场景的重要性，尤其是对业务发展和用于满意度的作用。然而，由于丰富场景和冷启动场景数据量之间的差距大，之前的多场景模型往往有以下两个缺点：首先场景特有参数训练不充分，能从稀疏样本中学到的知识有限；其次场景共享参数往往会被丰富场景所主导，并出现负迁移现象，这是由于不相关的信息在场景之间传递。

近期扩散模型（Diffusion Model）引起了非常多的关注，因为它具有高质量生成的能力，尤其是在计算机视觉领域。想在推荐领域引入它很有挑战性，一方面。对于多场景推荐来说，不同领域之间存在复杂的共性和特性。相比之下，现有的冷启动推荐模型只考虑新物品或新用户，这不是同一个维度的问题。其次，现有的扩散模型只能学习到域内分布，因此它无法建立不同场景之间的联系。

我们则是第一个探索多场景推荐的冷启动场景问题，具体地，我们通过加噪的表征和分类器明确地建立了不同场景之间的共性和特性。此外，在丰富场景的帮助下，为冷启动场景生成了高质量且信息丰富的表征。因此，我们是以数据驱动的生成方式解决了训练不足和负迁移的问题。

预备知识

一般地，深度推荐系统（Deep Recommender Systems, DRS）首先将原始特征映射为稠密的表征，并使用特征交互模块捕获不同特征域之间的低阶和高阶交互。接着，输出层产生最终推荐结果，例如对于点击率（CTR）预估任务，预测标签为1代表点击，而标签为0代表不点击。相对地，以往的多场景推荐模型可以大致分为两类，第一是预训练+微调，第二类似于多任务学习（multi-task learning），往往通过场景共享和特有参数来建模场景之间的关系，即共性和特性，比如MMoE给每个场景都建立的自己的塔，通过底部的专家网路和门机制提取有用的信息。

扩散模型如下图所示，主要包括正向和反向过程。前者旨在加入随机噪声，后者则从是降噪和恢复样本。训练的目标（只存在于反向过程）是通过模型生成一个与实际数据分布极为相似的数据分布，这等同于通过变分下界优化负对数似然。

方法

为了解决现有多场景推荐模型在冷启动场景上的学习不足和负迁移问题，我们提出了Diff-MSR作为一种增强的范式，与主流的多场景模型（包括预训练+微调和多任务学习）兼容。具体来说，它配备了我们明确设计的分段variance schedule和引入的分类器。同时，Diff-MSR由以下四个阶段组成：预训练、扩散、分类和微调。该算法流程总结在下图。

框架的直观解释如下图。直觉上说，从计算机视觉的角度来看，一个看起来像猫的狗的模糊轮廓可能会帮助在猫领域中进行高质量的OOD图像的生成，其原因是轮廓信息在计算机视觉中具有丰富信息且重要，比如典型的语义分割任务。同样地，在推荐系统中，每个用户画像和物品特征的表征的拼接也可以被视为一个“图像”。因此，基于这个想法我们提出了Diff-MSR。借助新引入的分类器，通过加噪表征（包含模糊但信息丰富的轮廓），明确建立了丰富场景和冷启动场景之间的联系，从而增强了冷启动场景的表现。

实验

我们在实验部分主要回答了三个研究问题：

① Diff-MSR作为一种范式，对于不同的多场景推荐骨干模型是否有效且兼容？
② 与当前最先进的生成方法相比，Diff-MSR的表现如何？
③ 我们引入的分类器和设计的分段variance schedule有哪些效果？

数据集

我们在两个公开数据集进行了实验，分别是Douban和Amazon-5core，每个数据集都有三个场景，选择的冷启动场景分别是Music和Beauty，评价指标选择AUC。

兼容性实验

我们在两类共八种主干模型上验证了Diff-MSR作为多场景建模范式的兼容性，第一类是预训练+微调，包括FNN, xDeepFM, DCN, 以及PNN。第二类是多任务框架，包括MMoE, PLE, STAR, 以及AITM。如下表所示，Diff-MSR都取得了显著超过主干模型的表现。

对比实验

我们对比了五种生成模型作为基线方法，他们以往在计算机视觉任务上取得了优秀表现。需要注意的是，他们和原本的扩散模型一样，都存在只能生成域内分布的缺陷，不能生成域外（out-of-distribution）数据。从上表结果可以看出，扩散模型的方法取得了更好和更稳定的表现。

消融实验

我们在Douban数据集进行了消融实验，分成两方面，一方面是分类器的效果，我们对比了“Diff”（见上表），虽然它也能取得不错的效果，但无法利用其他场景的信息，所以表现比完整版的Diff-MSR差。

另一方面为了验证提出的分段variance schedule的效果，我们对比了常用的线性和cosine方案。它效果更好可能是因为在正向扩散过程的前几步中，它更好地保持了表征的具有丰富信息的“轮廓”，如下图所示。

超参分析

我们在Douban数据集对扩散模型本身的超参数，即训练目标进行了实验，结果如图4显示，‘pred_v’是最好的方案。

更多细节请见原始论文。

同时欢迎关注我们的知乎账号：应用机器学习
(https://www.zhihu.com/people/aml_cityu)

http://mp.weixin.qq.com/s?__biz=MzI1MjE5MzgwOA==&mid=2247485339&idx=1&sn=bedd404a191037b2defb6a424b9d93af

应用机器学习

介绍机器学习最近技术进展和资讯

最新文章

香港城市大学 AI 机器学习数据挖掘大语言模型全奖PhD/联培PhD

CIKM 2024 | 高效鲁棒的正则化联邦推荐

ICDM 2024 | GPRec: 两级用户增强建模

NeurIPS 2024 | LLM-ESR: 大语言模型增强的长尾序列推荐系统

CIKM 2024 | 基于大语言模型的多场景推荐增强范式

CIKM2024 | 编辑医疗大模型的事实性知识和解释能力

NeurIPS 2024 | G3: 一种基于多模态大模型的高效自适应地理定位框架

KDD 2024 | 基于生成流网络的用户留存建模

KDD 2024 | ControlTraj: 利用路网拓扑指导轨迹生成

TKDE 2024 | 多层次图知识对比学习

CIKM 2024 | HierRec:多场景推荐——场景感知分层建模

CSUR 2024 | 多模态推荐系统综述

祝贺！赵翔宇老师获批第一期CCF-阿里妈妈科技袋基金大模型方向支持！

AML666！AML实验室在KDD CUP 2024 大语言模型多任务挑战赛中获得总榜亚军，全部5个赛道进入前三名的优异成绩

KDD 2024 | ERASE: 深度推荐系统中的特征筛选方法基准

NAACL 2024 | MILL: 一种利用大语言模型进行相互验证的零样本查询扩展方法

KAIS 2023 | AutoAssign+: 流媒体推荐中的自动共享嵌入分配设计

SIGIR 2024 | 当MOE遇上LLMs:针对医疗多任务的参数高效微调方法

CIKM 2023 | 用于医疗文本分类的多任务学习框架KEMTL

ICDE 2024 | 序列推荐的自增强序列去噪框架SSDRec

WSDM 2024 | 多场景推荐冷启动问题的扩散模型增强范式

重磅！OpenAI 官宣上线 GPT Store！超300万个 GPTs 大爆发

综述：LLM驱动的生成式信息抽取

ChatGPT官方登陆应用市场！OpenA再放大招，可精准识别中文

IJCAI22 | 基于纯MLP方法的序列推荐模型

Bard全面升级，新大模型能超GPT-4，谷歌反击ChatGPT

WWW 2023 | 基于MLP序列的自适应结构搜索推荐模型AutoMLP

WWW 2023|基于强化学习的多任务推荐系统

AAAI 2023 | 自动时空多任务学习AutoSTL

WWW 2023 | IMF: 用于链接预测的交互式多模式融合模型

基于反事实因果的图对比学习负样本生成

Decision Transformer 在优化用户留存中的应用

多行为推荐的去噪与提示调节

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉