RecSys2024 | 蒸馏很重要! 大模型赋能传统序列推荐

科技 2024-08-20 08:02 新加坡

嘿，记得给“机器学习与推荐算法”添加星标

TLDR: 为了结合大模型推荐的性能优势与传统推荐模型的效率优势，本文提出了一种新的蒸馏策略来将大模型推荐中的知识迁移到传统推荐模型。

论文：https://arxiv.org/pdf/2405.00338

由于其强大的语义推理能力，大语言模型已被有效地用作推荐模型，并且取得了令人印象深刻的性能。然而，大语言模型的高推理延迟严重限制了其实际部署。如下图所示，大模型推荐算法（BIGRec）的性能优于序列推荐算法（DROS），但其推理效率却明显存在差距。

为解决该问题，本文研究了从"笨重"的大模型推荐算法到轻量级的传统序列模型的知识蒸馏。但其主要面临三个关键挑战:

1)教师的知识可能并不总是可靠的;
2)教师和学生之间的能力差距使得学生难以吸收教师的知识;
3)语义空间的差异对从语义向量中提取知识提出了挑战。

为应对这些挑战，本文提出了一种新的蒸馏策略DLLM2Rec，专门用于从大模型推荐算法到传统序列模型的知识蒸馏。DLLM2Rec包括两个组件:重要性感知的排序蒸馏和协同嵌入蒸馏。

重要性感知的排序蒸馏

本文没有直接对齐教师和学生之间的排序列表，而是通过引入重要性权重，突出可靠和对学生友好的实例来进行蒸馏。该方法评估了大模型响应与目标正例之间的语义相似度，相似度较低表明响应质量较低，建议在蒸馏中对此类实例进行降权。此外，受"群体智慧"的启发，利用学生和教师之间的模型一致性来评估实例的重要性，优先考虑不同模型同意更高项目排名的实例。这样的实例对学生模型来说也是相对容易和友好的，有助于学生从老师那里吸收知识。

协同嵌入蒸馏

为缓解教师和学生嵌入空间之间的语义鸿沟，本文采用可学习投影(如mlp)将原始嵌入从教师映射到学生的嵌入空间。此外，与直接将学生嵌入与教师的投影嵌入对齐不同，其引入了一个灵活的偏移项，可以捕获协同信号，进一步与教师的投影嵌入集成，以生成丰富的学生嵌入。该设计有效地利用了教师的知识，同时保留了其捕获协同信号的能力。

本文通过大量的实验验证了所提出方法的有效性，使三个典型的序列模型的推荐性能平均提升了47.97%，甚至在某些情况下超过了大模型推荐算法。

更多技术细节请阅读原始论文。

欢迎干货投稿 \ 论文宣传 \ 合作交流

由于公众号试行乱序推送，您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容，请将本号设为星标，以及常点文末右下角的“在看”。

喜欢的话点个在看吧👇

http://mp.weixin.qq.com/s?__biz=MzA4NTUxNTE4Ng==&mid=2247524672&idx=2&sn=755e218ffcc26c23b0784cb1472cd46a

机器学习与推荐算法

专注于分享经典的推荐技术，致力于传播基础的机器学习、深度学习、数据挖掘等方面的知识。

最新文章

当MoE邂逅图学习: AnyGraph解密图大模型的Scaling Law

KDD2024 | 最佳学生论文: 以数据为中心的序列推荐方法

Kaggle大模型文本预测竞赛入门分享

CIKM2024 | 属性感知匹配的文本序列推荐算法

论文周报[0902-0908] | 推荐系统领域最新研究进展(15篇)

「小而美」的EasyRec来啦, 推荐系统迈入语言模型时代？

学术顶会变成了“大厂”顶会?

大模型推荐最新进展 | 含KDD, RecSys, CIKM, ACL等顶会文章

KDD2024推荐系统/计算广告/大模型论文整理(研究专题)

KDD2024推荐系统/计算广告/大模型论文整理(应用专题)

近期大模型时序预测顶会论文总结

SIGIR2024 | 对齐很重要! 大模型增强知识赋能传统序列推荐

论文周报[0826-0901] | 推荐系统领域最新研究进展(16篇)

ICML2024 | 维度坍塌视角下的大规模推荐系统

CIKM2024 | LightGODE: 挑战传统图推荐范式, 基于轻量级图ODE推荐算法

图像分割模型SAM-2在医疗领域应用总结

LEARN: 大模型知识增强的工业级推荐模型

论文周报[0819-0825] | 推荐系统领域最新研究进展(26篇)

KDD2024 | 用户图增强的联邦推荐系统

多模态融合最新前沿方向进展总结

RecSys2024 | 蒸馏很重要! 大模型赋能传统序列推荐

论文周报[0812-0818] | 推荐系统领域最新研究进展(16篇)

只要敢捞“偏门”，篇篇都是顶会顶刊！

抖音 | 搜索推荐算法工程师招聘

KDD2024 | PolygonGNN: 多边形几何形状的表征学习

RecSys2024推荐系统论文整理

科大讯飞 | 短视频精准推荐挑战赛Baseline

论文周报[0805-0811] | 推荐系统领域最新研究进展(21篇)

浙大数据智能团队最新综述: 生成式AI时代下表格数据增强进展与展望

导师放养, 偷偷发了顶会。。。

CIKM2024 | TWIN-V2: 超长用户行为序列建模在快手的应用

KDD2024 | GFN4Retention: 基于生成流网络的用户留存建模

想中稿顶会？来看看顶会审稿人怎么说

LLM101n 硬核代码解读: 超详解读numpy实现多层感知机MLP

论文周报[0729-0804] | 推荐系统领域最新研究进展(19篇)

最新综述 | 图压缩技术: 如何压缩图数据从而加速GNN训练？

IJCAI2024 | 利用基础模型的联邦推荐系统

CIKM2024 | COLT: 面向完整性的大模型工具检索

KDD2024 | 基于双重意图转换的搜索推荐联合模型

论文周报[0722-0728] | 推荐系统领域最新研究进展(14篇)

首届国家智慧教育平台 | 用户行为序列个性化推荐竞赛

ACM MM2024@Oral | DiffMM: 当多模态推荐遇上Diffusion Model

KDD2024 | 兴趣点推荐中的隐私风险研究

最新开源Transformer压缩与量化方法总结

2024年推荐系统技术全面综述：历史、现状、分类、应用与展望

论文周报[0715-0721] | 推荐系统领域最新研究进展(15篇)

SIGIR2024 | SelfGNN: 自监督图学习序列推荐

大模型微调与对齐在推荐系统中的应用总结

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

RecSys2024 | 蒸馏很重要! 大模型赋能传统序列推荐

重要性感知的排序蒸馏

协同嵌入蒸馏

欢迎干货投稿 \ 论文宣传 \ 合作交流

推荐阅读

由于公众号试行乱序推送，您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容， 请将本号设为星标，以及常点文末右下角的“在看”。

由于公众号试行乱序推送，您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容，请将本号设为星标，以及常点文末右下角的“在看”。