大语言模型与图结构的融合：推荐系统中的新兴范式

文摘 2024-11-15 11:44 北京

LLMs与图结构的融合：推荐系统中的新兴范式

一、简介

随着大语言模型（LLMs）的不断发展,如何进一步利用LLMs来增强推荐效果成为了一大研究热点。传统推荐系统生成用户/项目嵌入表示主要依赖用户行为数据,可能会忽略与用户和项目相关的丰富文本信息。本文从如何有效利用用户/项目的文本属性出发聚焦于两项最新工作:RLMRec和GacLLM,展示了如何利用LLMs来理解并优化文本信息和去噪。

二、Representation Learning with Large Language Models for Recommendation（WWW 2024）

大多数传统的基于图的推荐系统仍然依赖于ID数据,而往往忽略了用户和项目的文本信息。此外,许多推荐系统使用隐性反馈数据,这可能会引入噪声和偏差,影响用户偏好学习的准确性。针对上述挑战,RLMRec框架提出了一种新的推荐范式,将LLMs的语义表示能力与传统ID推荐系统结合。首先生成用户和项目的文本画像和协同关系表示,之后通过互信息最大化方法,对齐LLMs的语义空间与协同关系表示,减弱噪声干扰,提升表征质量。

2.1 基于推理的画像生成模块

该模块用于为用户和项目生成画像。首先,系统会设计一个系统提示(System prompt),其中详细定义生成用户或项目画像的目标。这种提示引导大语言模型在生成画像时展示推理过程,避免“幻觉”现象。

项目画像生成:从项目的文本信息中提取内容,如项目标题、原始描述以及用户评论。根据是否存在描述文本,系统会组织相应的输入格式,若缺失,则随机选取用户评论的子集作为描述文本输入。

用户画像生成:借助用户与项目的交互记录,通过已经生成的项目画像来推断用户的偏好。具体来说,首先从用户交互的项目中抽样,然后将这些项目的文本属性和用户对这些项目的评论整合到一个特定格式的输入里面,让LLMs生成一个包含用户真实的偏好表达的用户画像。

图1. 基于推理的画像生成模块

其中,和分别是项目和用户的文本信息,和代表了项目画像和用户画像,和代表了用户画像嵌入和项目画像嵌入。

2.2 对比对齐模块

对比对齐模块的核心是通过对比学习来对齐LLMs生成的语义表示和协同过滤模型的协同关系表示,确保在不同视角下学习到一致的用户和项目嵌入。

具体实现上,定义一个相似度函数（余弦相似度）来度量LLMs生成的语义嵌入与协同过滤模型嵌入的相似性。然后,通过引入对比损失,鼓励正样本对,即实际交互的用户和项目的表示在嵌入空间中更接近,而负样本对则被拉远。本文研究目标即找到满足在先验信念z和文本信息条件下联合概率期望最高的协作嵌入。

其中为协同嵌入,为文本嵌入,为先验信念(通过引入隐藏的先验信念z从而帮助模型结合外部知识识别真实的用户兴趣样本,减少噪声的影响)。

之后问题经过公式推导,将找到使得联合概率期望最高的嵌入e问题转化为如何得到如何最大化互信息度I的问题

再通过寻找互信息度下限并使之最大化,再将问题转化为寻找用于衡量两个不同表征之间的相似度的密度比f(s,e)的最大值问题。

其中为用户/项目i的协同嵌入,为用户/项目i的文本嵌入,为用户/项目i对应的负样本对,即未产生交互记录的项目/用户,密度比f(s,e),函数 sim(·) 表示余弦相似度,而 σ↓ 表示将语义表示映射到的特征空间。

图2. 对比对齐模块

其中和是用户和项目的初始特征表示,和是用户和项目的协作关系表示,f(s,e)代表密度比。

2.3 生成对齐模块

生成对齐模块的核心在于通过单向的重构过程,将推荐模型生成的协同关系表示与大语言模型（LLMs）生成的语义表示对齐,从而在语义和协同关系两个视角下获得一致的用户和项目嵌入。

具体实现上,首先对一部分节点进行掩码操作,屏蔽掉节点的初始特征表示,再通过协同过滤方法生成用户和项目的嵌入表示,之后将协同关系表示与语义表示进行对齐,最大化密度比f(s,e),学习语义空间中的丰富知识,最后对屏蔽的节点进行重建。

其中代表文本嵌入,代表未被屏蔽的协同嵌入,𝜎↑代表将协同嵌入映射到的特征空间。

通过这种生成对齐机制,模型在协同表示的基础上融入了语义层面的信息,确保嵌入空间内的用户和项目表示在语义上保持一致性。

图3. 生成对齐模块

实验效果

RLMRec在Amazon-book、Yelp、Steam等数据集上相对于其他方法有更好的效果

图4. 不同backbone在多数据集上的表现

三、Large Language Model with Graph Convolution for Recommendation

传统的推荐系统主要依赖于协同过滤或基于内容的推荐技术,但在捕捉用户与项目之间的复杂关系时存在一定的局限性。此外,用户和项目的文本描述信息往往被忽略,导致推荐模型在表征用户偏好时缺乏语义层面的细节。针对这一问题,论文提出了一种结合LLMs和GCN的推荐方法。该方法利用LLMs生成的语义嵌入来增强推荐模型的表达能力,同时通过图卷积捕捉用户和项目之间的交互结构。这种结合的目标是解决传统推荐系统中无法充分利用文本信息的问题,从而提升用户与项目匹配的精确度。

图5. GaCLLM模型图

3.1 基于大语言模型的图卷积推理模块

此模块旨在通过卷积推理辅助大语言模型（LLM）感知用户-项目图结构,并基于提示学习生成更高质量的文本描述。

具体而言,该模块中的卷积模块负责对图结构进行建模,将目标节点及其邻居节点的文本描述进行逐层聚合,再将这些聚合后的信息传递给LLMs。LLMs根据提示学习策略,利用项目的文本描述和原始的用户描述,通过预设的提示词来生成优化后的用户描述,并将其拼接到已有的用户描述之后。

这一流程中的关键策略是逐层推理机制:每次仅聚合一阶邻居的文本描述,随着模型层数的增加,逐步捕获高阶邻居的信息。这种逐层推理不仅提高了计算效率,还使得LLM在生成用户描述时能够更有效地利用图结构信息,这是借鉴GCN提供的辅助优势之一。

图6. 基于大语言模型的图卷积推理模块

3.2 基于GCN的嵌入对齐模块

此模块旨在将经过GCN生成的目标节点的嵌入与目标节点的文本嵌入进行元素级相加再经过多层感知机MLP捕捉用户和项目嵌入之间的非线性关系,并处理来自不同来源的特征,将它们组合起来,生成更有效的特征表示。

其中为用户的嵌入表示,为项目的嵌入表示,表示第l层的变换映射矩阵,为和分别为用户和项目的邻居节点,和分别为用户和项目的文本嵌入。

为了对齐后的嵌入更好地为推荐任务服务,论文提出了内积匹配的方法,计算用户和项目的最终嵌入之间的内积,作为推荐评分。

图7. 基于GCN的嵌入对齐模块

3.3.实验效果

GaCLLM在4个数据集上相对于其他方法均取得了较好效果。

图8. 实验结果

四、总结

本文从如何利用文本信息增强推荐效果的角度出发,介绍了两个最新工作 RLMRec 和 GaCLLM 。RLMRec聚焦于对齐文本描述与协同表示从而得到更好的用户/项目的特征表示,实现更好的推荐效果;GaCLLM从如何提高文本质量角度出发构建了图卷积推理模块优化文本信息表示。这些研究表明LLMs在未来的推荐系统中拥有着巨大的作用,未来的研究和应用可能会进一步提升推荐系统的个性化和智能化,主要的方向例如个性化语义理解与推荐、跨模态推荐等等。

北邮 GAMMA Lab

北邮图数据挖掘与机器学习实验室

最新文章

专题解读 | 大语言模型上下文窗口扩展方法

专题解读 | 大语言模型在推荐场景的实践

专题解读 | EDA中逻辑综合的算子序列优化问题

快讯｜北邮GAMMA LAB的四篇工作被AAAI 2025录用

专题解读 | 大语言模型辅助代码文档生成

专题解读 | 动态图计算技术研究进展

专题解读 | 知识图谱表示学习发展概览

专题解读 | 知识蒸馏再升级：用大语言模型赋能图神经网络

LoG2024速递 | 去芜存菁：经典GNN三次问鼎SOTA的反思

专题解读 | 多层GNN训练如何提升效率？

专题解读 | 大语言模型在可解释推荐领域的应用

IEEE TBD 2024 | 以数据为中心的图学习研究综述

快讯 | 北邮GAMMA Lab两篇论文成功被DATE接收

专题解读 | 图基础模型最新研究进展

大语言模型与图结构的融合：推荐系统中的新兴范式

专题解读 | 大语言模型在序列推荐中的应用

Graph为Code Intelligence赋能！

专题解读 | 图检索增强生成研究进展

NeurIPS 2024 让大语言模型使用代码解决图分析推理任务

专题解读|异配图表示学习研究进展

专题解读| Graph Transformer 最新研究进展

GAMMA LAB 2024 秋游团建活动圆满成功

专题解读 | 让大模型正确表达置信度

专题解读｜多模态图学习

专题解读| 大语言模型长文本训练技术解析

专题解读｜代码图概念与应用

专题解读 | 基于图的推荐系统中长尾问题探究

专题解读 | LLM与GNN的结合：数据增强的视角

专题解读 | 混合专家模型在大模型微调领域进展

微调之外的大模型应用技术

技术分享 | LLM Powered Agents概念与实践

WWW24 | 从数据中心化的角度校准图神经网络

WWW24 | 分布偏移下的图公平性学习

技术分享 | DGL分布式GNN

SMP 2024大模型图分析挑战赛在线评测已开放

快讯｜北邮GAMMA LAB的一篇工作被ICCAD 2024 录用

报名参赛赢大奖 | SMP 2024大模型图分析挑战赛

技术分享 | GraphStore & FeatureStore

GammaGL发布0.5版本

OpenHGNN发布0.7版本

专题解读 | 大语言模型中的提示隐私保护

KDD 24 | 基于特权结构识别的分子不变学习

专题解读 | 大语言模型中的记忆设计

图基础模型综述发布V3版本

ICML 24 | 基于特征基匹配的图蒸馏

专题解读 | 图结构公平性

实验室出征WWW2024：学术交流与多彩活动

ICML 24 ｜过犹不及：揭示Graph Transformers 中的过全局化问题

快讯｜北邮GAMMA LAB的两篇工作被KDD 2024 录用

快讯｜北邮GAMMA LAB的两篇工作被ICML 2024 录用

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉