IJCAI2024 | 利用基础模型的联邦推荐系统

科技 2024-08-01 08:02 新加坡

嘿，记得给“机器学习与推荐算法”添加星标

大语言模型最近在多个领域取得了显著的成功，尤其是具备较强泛化能力的基础模型，将其应用于推荐系统已经成为了一种新的推荐范式。然而，如何能够在保护隐私的前提下，使基础模型能够及时捕捉用户偏好的变化，同时保持合理的通信和计算成本，成为了一个全新的挑战。为此，论文提出了一种新的联邦自适应机制，以保护隐私的方式增强基于基础模型的推荐系统。具体来说，每个客户端首先利用其私有数据学习一个轻量级的个性化适配器，然后，通过协调适配器和预训练的基础模型，以一种细粒度的方式高效地提供推荐服务。该模型可以促进将共享知识融入到所有适配器中，同时有效建模用户的个人偏好。论文在四个实际场景中的基准数据集上对提出的模型进行了验证，实验结果表明，论文提出的方法相比于当前最先进的联邦推荐模型具有显著的性能提升。

论文：https://arxiv.org/pdf/2405.04840
代码：https://github.com/Zhangcx19/IJCAI-24-FedPA

1. 研究动机

基础模型因其具备强大的泛化能力，已成为一种新的范式用以改善现有推荐系统建模。然而，有效整合基础模型和推荐系统面临两个严峻的挑战：第一，用户偏好通常是动态变化的，如何以合理的计算和通信开销及时更新基础推荐模型成为难点；第二，训练基础推荐模型需要统一收集用户数据，对用户隐私构成了严重的威胁。

2. 方法及论文主要贡献

论文提出一种基于基础模型的轻量级联邦推荐系统，在保护用户隐私的同时高效地训练推荐系统，实现对用户的个性化建模，模型结构如下图所示。

论文提出了一种个性化的低秩适配器，能够以轻量化的方式从用户和用户组两种粒度上同时学习用户个性化；此外，设计了一种自适应的门学习机制，能够有效整合用户个性化知识和通用知识，提升系统对用户偏好的建模能力。从而，系统能够在有效整合预训练模型蕴含的丰富知识的同时，保护用户隐私性。

具体来说，对于每个终端模型，对于预测函数的每一层，都为其整合一组用户级的低秩适配器和用户组级的低秩适配器，然后通过自适应的门学习机制对共享信息和个性化信息进行有机融合。在优化开始时，首先利用预训练好的模型对终端模型进行初始化。在优化过程中，终端只需更新和用户个性化建模相关的参数，即，用户嵌入、个性化适配器和自适应门学习机制，有效提升了计算效率，降低了通信开销。

论文的主要贡献可以被概括为以下三点：

首次提出了联邦基础推荐框架，该框架能够在保护用户隐私的同时有效整合预训练模型蕴含的丰富知识；
设计了一种个性化的低秩适配器，能够以轻量化的方式同时从用户级和用户组级两种粒度来建模用户个性化。此外，设计了一种自适应的门学习机制来动态学习权重，能够有效融合通用知识和用户个性化；
基于四个基准数据集进行实验验证，结果表明提出的方法相比于先进的对比方法具有显著的性能提升。此外，提出的方法在部署在计算能力有限的客户端上，以及加强联邦推荐系统中的用户隐私保护能力方面也表现出了出色的可行性。

3. 实验

对比分析实验：论文对比先进的对比算法，结果显示无论是否利用预训练模型初始化，论文提出的模型借助个性化建模机制都能取得比对比算法更优的性能。

低秩个性化分析实验：论文分析用户级低秩个性化和用户组级低秩个性化对模型性能的影响，实验结果显示，同时整合用户级个性化和用户组级个性化能够取得最优的性能。

通用知识对联邦优化的影响分析实验：论文分析了模型中不同模块蕴含的通用知识对模型性能的影响，结果显示，只固定商品嵌入模块和只固定预测函数模块都能够获得更好的性能，但是论文的方法同时固定两个模块依然取得不错的性能，而且显著提升了计算效率。

基于知识蒸馏技术的轻量级模型分析实验：考虑到在实际场景中，终端设备可能计算资源有限，论文验证在利用预训练模型之前先基于知识蒸馏技术缩小模型尺寸，以进一步缓解终端的计算开销，结果表明该方案不会有损模型性能，具有较强的可行性。

隐私保护增强实验：论文向模型中整合局部差分隐私技术来增强隐私保护能力。

4. 总结

论文提出了第一个基于基础模型的联邦推荐系统框架，从一个可靠的起点开始优化，利用预训练模型作为骨干。论文提出的方法基于本地数据为每个客户端学习个性化适配器，针对用户级和用户组级学习轻量化的低秩适配器，从互补的角度建模用户个性化。此外，论文设计了一种自适应的门学习机制，利用动态权重有效融合通用知识和用户个性化。通过在联邦优化期间仅更新用户特定的参数，显著降低了计算和通信成本。与先进的对比算法相比，充分的实验验证表明了FedPA卓越的性能。与此同时，通过从原始预训练模型中蒸馏出小尺寸的模型来解决在资源受限的设备上部署模型的挑战。此外，通过结合局部差分隐私技术来增强FedPA的隐私保护能力，从而在推荐性能和隐私保护之间实现了稳定的平衡。

欢迎干货投稿 \ 论文宣传 \ 合作交流

由于公众号试行乱序推送，您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容，请将本号设为星标，以及常点文末右下角的“在看”。

喜欢的话点个在看吧👇

http://mp.weixin.qq.com/s?__biz=MzA4NTUxNTE4Ng==&mid=2247524415&idx=1&sn=ace2b80dd405e174364ff3ce86aca69a

机器学习与推荐算法

专注于分享经典的推荐技术，致力于传播基础的机器学习、深度学习、数据挖掘等方面的知识。

最新文章

当MoE邂逅图学习: AnyGraph解密图大模型的Scaling Law

KDD2024 | 最佳学生论文: 以数据为中心的序列推荐方法

Kaggle大模型文本预测竞赛入门分享

CIKM2024 | 属性感知匹配的文本序列推荐算法

论文周报[0902-0908] | 推荐系统领域最新研究进展(15篇)

「小而美」的EasyRec来啦, 推荐系统迈入语言模型时代？

学术顶会变成了“大厂”顶会?

大模型推荐最新进展 | 含KDD, RecSys, CIKM, ACL等顶会文章

KDD2024推荐系统/计算广告/大模型论文整理(研究专题)

KDD2024推荐系统/计算广告/大模型论文整理(应用专题)

近期大模型时序预测顶会论文总结

SIGIR2024 | 对齐很重要! 大模型增强知识赋能传统序列推荐

论文周报[0826-0901] | 推荐系统领域最新研究进展(16篇)

ICML2024 | 维度坍塌视角下的大规模推荐系统

CIKM2024 | LightGODE: 挑战传统图推荐范式, 基于轻量级图ODE推荐算法

图像分割模型SAM-2在医疗领域应用总结

LEARN: 大模型知识增强的工业级推荐模型

论文周报[0819-0825] | 推荐系统领域最新研究进展(26篇)

KDD2024 | 用户图增强的联邦推荐系统

多模态融合最新前沿方向进展总结

RecSys2024 | 蒸馏很重要! 大模型赋能传统序列推荐

论文周报[0812-0818] | 推荐系统领域最新研究进展(16篇)

只要敢捞“偏门”，篇篇都是顶会顶刊！

抖音 | 搜索推荐算法工程师招聘

KDD2024 | PolygonGNN: 多边形几何形状的表征学习

RecSys2024推荐系统论文整理

科大讯飞 | 短视频精准推荐挑战赛Baseline

论文周报[0805-0811] | 推荐系统领域最新研究进展(21篇)

浙大数据智能团队最新综述: 生成式AI时代下表格数据增强进展与展望

导师放养, 偷偷发了顶会。。。

CIKM2024 | TWIN-V2: 超长用户行为序列建模在快手的应用

KDD2024 | GFN4Retention: 基于生成流网络的用户留存建模

想中稿顶会？来看看顶会审稿人怎么说

LLM101n 硬核代码解读: 超详解读numpy实现多层感知机MLP

论文周报[0729-0804] | 推荐系统领域最新研究进展(19篇)

最新综述 | 图压缩技术: 如何压缩图数据从而加速GNN训练？

IJCAI2024 | 利用基础模型的联邦推荐系统

CIKM2024 | COLT: 面向完整性的大模型工具检索

KDD2024 | 基于双重意图转换的搜索推荐联合模型

论文周报[0722-0728] | 推荐系统领域最新研究进展(14篇)

首届国家智慧教育平台 | 用户行为序列个性化推荐竞赛

ACM MM2024@Oral | DiffMM: 当多模态推荐遇上Diffusion Model

KDD2024 | 兴趣点推荐中的隐私风险研究

最新开源Transformer压缩与量化方法总结

2024年推荐系统技术全面综述：历史、现状、分类、应用与展望

论文周报[0715-0721] | 推荐系统领域最新研究进展(15篇)

SIGIR2024 | SelfGNN: 自监督图学习序列推荐

大模型微调与对齐在推荐系统中的应用总结

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

IJCAI2024 | 利用基础模型的联邦推荐系统

1. 研究动机

2. 方法及论文主要贡献

3. 实验

4. 总结

欢迎干货投稿 \ 论文宣传 \ 合作交流

推荐阅读

由于公众号试行乱序推送，您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容， 请将本号设为星标，以及常点文末右下角的“在看”。

由于公众号试行乱序推送，您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容，请将本号设为星标，以及常点文末右下角的“在看”。