SIGIR2024 | 对齐很重要! 大模型增强知识赋能传统序列推荐

科技 2024-09-03 08:00 新加坡

嘿，记得给“机器学习与推荐算法”添加星标

TLDR: 针对大模型序列推荐中存在的表示能力有限与较长推理延迟的挑战，本文提出了利用对齐的大语言模型的增强知识增强传统序列推荐的模型。通过将大模型生成的文本格式知识与物品id相结合，并将这种丰富的数据提供给基于id的序列推荐器，以此受益于这两种范式的优势。

论文：dl.acm.org/doi/10.1145/3626772.365778

推荐系统已经被广泛应用于各种在线平台。在序列推荐的背景下，准确捕捉用户活动中的时间模式以生成相关推荐至关重要。传统的基于id的序列推荐模型已经展示了出色的推荐能力，但其缺点就是缺乏关于物品侧的全面现实知识，这限制了它们的有效性；大语言模型的最新进展提供了通过利用大模型中封装的广泛现实世界知识来弥合这一差距的潜力。

然而，尽管这些方法具有访问现实世界知识的优势，并在一些少样本设置中产生了较好的结果，但仍未超过传统的基于id的推荐方法的精度和效率。这种大模型-推荐范式的局限性可能归因于几个关键缺点，包括:(i)物品id中包含的序列模式和协作信号的表示不足。 如前所述，提示中的每一项都使用其文本元数据进行编码，如标题和描述。虽然有效地利用了大模型的语言能力，但这未能充分捕捉物品id中包含的用户序列行为模式和协同信息。(ii)较长的推理延迟。 大模型固有的大量参数使得它们直接应用于推荐系统对于现实世界的工业使用非常不切实际。

本文旨在通过整合大模型庞大现实世界知识的存储和推理能力，来增强传统的基于id的序列推荐模型。通过这样的方式，旨在同时实现序列推荐的有效性和效率性。然而，尽管大模型具有非常强的世界知识，但从大模型中提取相关和有益的知识并非易事。主要挑战来自于大模型中包含的广泛和多样化的信息，这些信息可能会引入不利于推荐系统性能的噪声。

为缓解这一问题，关键是将大模型生成的知识定制为序列推荐任务的特定需求。考虑电影推荐的背景:关于电影制作中使用的摄像机的复杂技术规格的增强知识对大多数用户来说可能没有什么价值，并可能导致推荐系统中的噪声。相比之下，提供用户观看列表的电影主题摘要，如“他/她喜欢人们之间的复杂关系”，可以对用户偏好建模产生更大的影响。因此，将大模型生成的知识与序列推荐任务的目标进行对齐，对于有效的知识增强至关重要。

为应对上述挑战，本文提出了一种从对齐的大语言模型中增强知识来增强序列推荐器的方法SeRALM。SeRALM是一种与模型无关的方法，它将大模型与传统的基于id的序列推荐器相匹配，从而实现序列推荐任务的针对性应用。通过这种对齐，大模型产生与上下文相关的有益知识，从而增强推荐过程。将大模型生成的文本格式知识与物品id相结合，并将它们提供给基于id的传统序列推荐模型。这种融合利用了大模型提供的丰富的现实世界知识，同时保持基于id的序列推荐模型在捕获序列行为模式和协同信号方面的优势。此外，它通过在推荐阶段之前预先生成大模型衍生的知识，从而避免了推理延迟问题，从而消除了推荐需要等待耗时的大模型生成的需要。

具体的，本文首先设计了一个提示模板来提取关于物品的知识，其中包括物品描述和反映用户偏好的特征。文本格式的增强知识和物品id都被输入到基于id的序列推荐器中以产生推荐。为了进一步使大模型与基于id的推荐算法在序列推荐任务中保持一致，使用基于id的推荐模型的输出和实际用户的交互物品的反馈对大模型进行微调，以更好地增强知识。另外，本文还开发了一种异步技术来加速集成大模型和基于id的推荐模型的对齐训练，从而提高训练效率。

在公开数据集上的实验结果表明，SeRALM显著提高了基于id的传统序列推荐算法的性能。另外，消融实验和分析证实了SeRALM在指导大模型在不同场景中产生更有针对性和优势的知识方面的优势。

更多技术细节请阅读原始论文。

欢迎干货投稿 \ 论文宣传 \ 合作交流

由于公众号试行乱序推送，您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容，请将本号设为星标，以及常点文末右下角的“在看”。

喜欢的话点个在看吧👇

http://mp.weixin.qq.com/s?__biz=MzA4NTUxNTE4Ng==&mid=2247524813&idx=2&sn=9a8bc2882ff0023776d5394754ddff8f

机器学习与推荐算法

专注于分享经典的推荐技术，致力于传播基础的机器学习、深度学习、数据挖掘等方面的知识。

最新文章

当MoE邂逅图学习: AnyGraph解密图大模型的Scaling Law

KDD2024 | 最佳学生论文: 以数据为中心的序列推荐方法

Kaggle大模型文本预测竞赛入门分享

CIKM2024 | 属性感知匹配的文本序列推荐算法

论文周报[0902-0908] | 推荐系统领域最新研究进展(15篇)

「小而美」的EasyRec来啦, 推荐系统迈入语言模型时代？

学术顶会变成了“大厂”顶会?

大模型推荐最新进展 | 含KDD, RecSys, CIKM, ACL等顶会文章

KDD2024推荐系统/计算广告/大模型论文整理(研究专题)

KDD2024推荐系统/计算广告/大模型论文整理(应用专题)

近期大模型时序预测顶会论文总结

SIGIR2024 | 对齐很重要! 大模型增强知识赋能传统序列推荐

论文周报[0826-0901] | 推荐系统领域最新研究进展(16篇)

ICML2024 | 维度坍塌视角下的大规模推荐系统

CIKM2024 | LightGODE: 挑战传统图推荐范式, 基于轻量级图ODE推荐算法

图像分割模型SAM-2在医疗领域应用总结

LEARN: 大模型知识增强的工业级推荐模型

论文周报[0819-0825] | 推荐系统领域最新研究进展(26篇)

KDD2024 | 用户图增强的联邦推荐系统

多模态融合最新前沿方向进展总结

RecSys2024 | 蒸馏很重要! 大模型赋能传统序列推荐

论文周报[0812-0818] | 推荐系统领域最新研究进展(16篇)

只要敢捞“偏门”，篇篇都是顶会顶刊！

抖音 | 搜索推荐算法工程师招聘

KDD2024 | PolygonGNN: 多边形几何形状的表征学习

RecSys2024推荐系统论文整理

科大讯飞 | 短视频精准推荐挑战赛Baseline

论文周报[0805-0811] | 推荐系统领域最新研究进展(21篇)

浙大数据智能团队最新综述: 生成式AI时代下表格数据增强进展与展望

导师放养, 偷偷发了顶会。。。

CIKM2024 | TWIN-V2: 超长用户行为序列建模在快手的应用

KDD2024 | GFN4Retention: 基于生成流网络的用户留存建模

想中稿顶会？来看看顶会审稿人怎么说

LLM101n 硬核代码解读: 超详解读numpy实现多层感知机MLP

论文周报[0729-0804] | 推荐系统领域最新研究进展(19篇)

最新综述 | 图压缩技术: 如何压缩图数据从而加速GNN训练？

IJCAI2024 | 利用基础模型的联邦推荐系统

CIKM2024 | COLT: 面向完整性的大模型工具检索

KDD2024 | 基于双重意图转换的搜索推荐联合模型

论文周报[0722-0728] | 推荐系统领域最新研究进展(14篇)

首届国家智慧教育平台 | 用户行为序列个性化推荐竞赛

ACM MM2024@Oral | DiffMM: 当多模态推荐遇上Diffusion Model

KDD2024 | 兴趣点推荐中的隐私风险研究

最新开源Transformer压缩与量化方法总结

2024年推荐系统技术全面综述：历史、现状、分类、应用与展望

论文周报[0715-0721] | 推荐系统领域最新研究进展(15篇)

SIGIR2024 | SelfGNN: 自监督图学习序列推荐

大模型微调与对齐在推荐系统中的应用总结

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

SIGIR2024 | 对齐很重要! 大模型增强知识赋能传统序列推荐

欢迎干货投稿 \ 论文宣传 \ 合作交流

推荐阅读

由于公众号试行乱序推送，您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容， 请将本号设为星标，以及常点文末右下角的“在看”。

由于公众号试行乱序推送，您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容，请将本号设为星标，以及常点文末右下角的“在看”。