CIKM 2024 | HierRec:多场景推荐——场景感知分层建模

文摘 2024-10-11 10:00 中国香港

记得给 “应用机器学习” 添加星标，收取最新干货

作者：香港城市大学高璟桐

今天跟大家分享一篇CIKM 2024来自香港城市大学和华为诺亚提出的一种新型多场景推荐模型HierRec。它结合了显式场景信息和隐式数据分布信息，以实现对场景的精细建模，提升了多场景下的整体推荐性能。

Arxiv版论文链接：https://arxiv.org/abs/2309.02061

代码：https://github.com/Applied-Machine-Learning-Lab/HierRec

背景

多场景推荐是近年来推荐系统的一个新发展方向。通过将场景id或场景差异作为样本的补充特征，我们可以将不同场景的数据统合在一起以进行联合建模与训练，以提升整体推荐性能。近期研究表明，实施多场景推荐可以增强信息共享并提高整体性能。

现有的多场景模型仅考虑基于预定义的场景特征的粗粒度显式场景建模。这是由于场景这一特征一般通过不同样本的数据来源人为进行划分（常以id特征形式出现），场景间具有显著的数据分布差异。针对场景特征进行差异化建模有利于提升模型整体性能。

然而，除了场景特征外，通用特征中其实也存在着许多重要特征或特征组合，能够划分出重要的隐式数据分布组，这些隐式数据分布组同样显著影响着整体推荐性能。现有的研究缺乏对这部分内容进行差异化建模，因而会导致整体推荐效果次优。

为了解决这些局限性，我们在提出的HierRec模型中构建了一种基于场景感知的分层建模方式，使该模型能够在以id特征为代表的显式场景下进一步自适应地构建细致的隐式数据分布，以同时进行显式和隐式场景建模。

方法

本文提出了一个场景感知的分层建模多场景推荐模型。如下图所示，整个框架由两个主要模块组成，即用于进行显式场景建模的Explicit Scenario-Aware Module和用于进行隐式场景建模的Implicit Scenario-Aware Module。我们希望通过这种分层建模方式，能够在利用预定义场景特征进行建模（即建模显式场景）的同时，在每个显式场景下进一步从通用特征组合中提取重要的数据分布模式，进行精细化建模（即建模隐式场景）。

1） Scenario-Oriented Module

为了方便对显式/隐式场景进行建模。我们设计了一个基于场景的通用建模模块Scenario-Oriented Module。该模块由数个Linear层构成。与普通全连接网络不同的是，该模块利用了动态网络技巧，首先接收不同的场景信息（SC）以初始化其模块参数，随后才接受输入并产生输出。由于模块参数由场景信息实例化而来，因此通过该模块获取输出时，即可以被视为在特定场景下对输入进行了对应的场景建模。

2） Explicit Scenario-Aware Module

该模块旨在对人为预定义的显式场景进行建模。因此，该模块首先接受由场景id特征转化而来的表征矩阵以初始化Scenario-Oriented Module为Explicit Scenario-Oriented Layer,随后接受经过了一个全连接层处理的通用表征作为输入以进行显式场景建模。

3） Implicit Scenario-Aware Module

为了自适应地在每个显式场景下捕捉重要的隐式数据分布，我们首先根据场景id表征生成数组权值，以加权出G组公共表征组合，作为建模时需要考虑的重要“隐式场景”。随后为每个隐式场景初始化一个Implicit Scenario-Oriented Layer进行建模。

4） Output Layer

在上述建模完成后，输入表征将按顺序经过经过Explicit Scenario-Oriented Layer和多组并列的Implicit Scenario-Oriented Layers以进行显式和隐式场景建模，随后通过concat+FC的形式聚合并生成输出。

实验

本文在实验部分主要回答三个研究问题：

RQ1：与不同多场景推荐基线相比，HierRec的表现如何？
RQ2：所设计的层级结构是否有助于提升不同场景的实际性能？
RQ3：HierRec的推理效率是否满足在线部署的要求？

数据集

本文在两个常用的公开数据集Ali-CCP和KuaiRand上进行了实验，预测任务为点击率预估（CTR Prediction）。

对比实验

本文对比了HierRec与常用的多场景推荐模型的性能，结果如下：

其中，sce_x代表该数据集下不同场景的性能。可以观察到，基于多任务模型（Shared Bottom, MMoE, PLE）的多场景推荐在两个数据集上表现一般，其中 MMoE 和 PLE 因其任务共享和信息隔离机制分别表现较好。相比之下，多场景模型（STAR, AdaSparse）通过有效建模显式场景差异取得了更好的效果，特别是 AdaSparse 的动态权重方法表现出色。APG 和 AdaptDHM 通过学习样本分布以达到了可观的性能，强调了挖掘数据分布的重要性，但性能仍不及 AdaSparse 和 HierRec。因此，本文中HierRec尝试使用分层结构对不同显式场景基于差异化权值进行隐式场景建模，达到了更好的预测效果。

消融实验

为了证明HierRec中不同组件对场景建模的贡献，本文从“是否需要多头注意力以建模多组隐式场景？”（-MI），“是否需要建模隐式场景？”（-I）和“是否需要建模显式场景？”（-E)）三个方面对模型进行了消融实验。结果如下：

实验结果说明，显式场景（人为预定义的场景特征）和隐式场景（公共特征组中的重要数据分布）都是多场景建模中的重要组成部分。而本文通过多头注意力的方式在不同显式场景下进一步建模多组隐式场景的方式有利于模型自适应地根据输入输出捕捉重要的数据分布，以达到细粒度建模的目的。

推理性能分析

为了满足部署要求，本文还进行了推理性能分析（每2000样本平均耗时）：

可以看到，尽管由于添加了一个隐式场景建模模块，模型的推理耗时并没有增加很多。这是因为两个重要的模块（Explicit / Implicit Scenario-Oriented Layers）都采用了bottle neck结构，且网络层数并不深。因此，HierRec满足线上部署要求。

线上部署

为了进一步验证HierRec的有效性，本文在华为广告相关业务方面对HierRec进行了Offline和Online部署实验。并与当前常用的线上多场景推荐模型进行了对比。Offline效果如下：

Online A/B测试中，CTR（点击率预测）和CVR（转化率预测）阶段的eCPM(effective cost per mile)指标分别提升2.21%和10.33%。实验验证了HierRec场景感知分层建模的有效性。

总结

本文提出了一种场景感知分层建模模型HierRec，以在人为预定义的显式场景内执行细粒度的隐式数据分布建模，提升了整体的多场景推荐性能。线上部署实验证明了HierRec的有效性。

更多细节请见原始论文。

END

同时欢迎关注我们的知乎账号：应用机器学习，获取更多内容

https://www.zhihu.com/people/aml_cityu

http://mp.weixin.qq.com/s?__biz=MzI1MjE5MzgwOA==&mid=2247485483&idx=1&sn=593951656ffe5ed7edfa15eb355bf194

应用机器学习

介绍机器学习最近技术进展和资讯

最新文章

香港城市大学 AI 机器学习数据挖掘大语言模型全奖PhD/联培PhD

CIKM 2024 | 高效鲁棒的正则化联邦推荐

ICDM 2024 | GPRec: 两级用户增强建模

NeurIPS 2024 | LLM-ESR: 大语言模型增强的长尾序列推荐系统

CIKM 2024 | 基于大语言模型的多场景推荐增强范式

CIKM2024 | 编辑医疗大模型的事实性知识和解释能力

NeurIPS 2024 | G3: 一种基于多模态大模型的高效自适应地理定位框架

KDD 2024 | 基于生成流网络的用户留存建模

KDD 2024 | ControlTraj: 利用路网拓扑指导轨迹生成

TKDE 2024 | 多层次图知识对比学习

CIKM 2024 | HierRec:多场景推荐——场景感知分层建模

CSUR 2024 | 多模态推荐系统综述

祝贺！赵翔宇老师获批第一期CCF-阿里妈妈科技袋基金大模型方向支持！

AML666！AML实验室在KDD CUP 2024 大语言模型多任务挑战赛中获得总榜亚军，全部5个赛道进入前三名的优异成绩

KDD 2024 | ERASE: 深度推荐系统中的特征筛选方法基准

NAACL 2024 | MILL: 一种利用大语言模型进行相互验证的零样本查询扩展方法

KAIS 2023 | AutoAssign+: 流媒体推荐中的自动共享嵌入分配设计

SIGIR 2024 | 当MOE遇上LLMs:针对医疗多任务的参数高效微调方法

CIKM 2023 | 用于医疗文本分类的多任务学习框架KEMTL

ICDE 2024 | 序列推荐的自增强序列去噪框架SSDRec

WSDM 2024 | 多场景推荐冷启动问题的扩散模型增强范式

重磅！OpenAI 官宣上线 GPT Store！超300万个 GPTs 大爆发

综述：LLM驱动的生成式信息抽取

ChatGPT官方登陆应用市场！OpenA再放大招，可精准识别中文

IJCAI22 | 基于纯MLP方法的序列推荐模型

Bard全面升级，新大模型能超GPT-4，谷歌反击ChatGPT

WWW 2023 | 基于MLP序列的自适应结构搜索推荐模型AutoMLP

WWW 2023|基于强化学习的多任务推荐系统

AAAI 2023 | 自动时空多任务学习AutoSTL

WWW 2023 | IMF: 用于链接预测的交互式多模式融合模型

基于反事实因果的图对比学习负样本生成

Decision Transformer 在优化用户留存中的应用

多行为推荐的去噪与提示调节

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉