一篇大模型个性化技术最新综述

科技 2024-11-06 00:01 北京

大语言模型个性化是一个最近特别值得关注的话题，但是LLM个性化研究存在一个明显的割裂：

部分产品专注于让模型生成个性化的文本
另一部分则在用它做推荐系统等下游任务

首次系统地连接了这两个方向，提出了一个分类体系，总结了个性化LLMs使用的关键差异和挑战，并提出了系统化的分类体系：

个性化LLM的三层框架

个性化大型语言模型（LLMs）的三层框架是指根据个性化粒度对LLMs进行分类的三个层次，每个层次针对不同的个性化目标和应用场景：

用户级个性化（User-level Personalization）：

这个层次关注于单个用户的特定需求和偏好。
个性化的目标是利用详细的用户信息，包括历史互动、偏好和行为，通常通过用户ID来识别。
用户级个性化能够提供最精细的个性化体验，但在数据稀疏性、可扩展性和冷启动问题上面临挑战。

角色级个性化（Persona-level Personalization）：

这个层次针对具有共同特征或偏好的用户群体，称为角色（persona）。
个性化基于这些群体的集体属性，例如专业知识、信息丰富度和风格偏好。
角色级个性化在处理具有共同特征的用户群体时有效，但在缺乏用户特定属性的情况下可能不够精细。

全局偏好个性化（Global Preference Personalization）：

这个层次涵盖了被广泛接受的一般偏好和规范，例如文化标准和社会规范。
这种个性化不提供针对特定用户的具体个性化，而是确保LLMs的输出符合一般公众的偏好和期望。
全局偏好个性化简单易行，但可能缺乏针对性，并且可能引入来自聚合数据的噪声。

这个三层框架允许开发者和研究人员根据具体的应用需求和用户互动水平，选择合适的个性化粒度，以平衡个性化的精确度和可扩展性。未来的研究可能会探索这些层次之间的混合方法，例如，对于频繁用户使用用户级个性化，对于偶尔用户使用角色级个性化，而对于新用户则使用全局偏好个性化。这样的混合方法可以动态调整个性化的粒度，根据用户参与度、上下文和数据可用性提供平衡且有效的用户体验。

个性化LLM的技术方法

个性化大型语言模型（LLMs）的技术方法可以根据用户信息的使用方式进行分类：

通过检索增强生成（Personalization via Retrieval-Augmented Generation, RAG）：

稀疏检索（Sparse Retrieval）：使用基于词频的向量进行编码，依赖于精确的术语匹配。
密集检索（Dense Retrieval）：使用深度神经网络，包括基于LLM的编码器，生成查询和文档的连续嵌入。

通过提示工程（Personalization via Prompting）：

上下文提示（Contextual Prompting）：将用户历史信息直接纳入提示中，使LLMs能够根据这些上下文数据执行下游个性化任务。
角色提示（Persona-based Prompting）：在提示中引入特定的角色，如人口统计信息，通过鼓励LLMs扮演这些角色来增强下游个性化任务的性能。
基于档案的提示（Profile-Augmented Prompting）：设计提示策略，通过利用LLMs的内部知识来丰富原始用户历史信息，从而改善下游个性化任务。
提示优化（Prompt Refinement）：开发鲁棒框架，迭代优化初始手工制作的提示，增强下游个性化。

通过表示学习（Personalization via Representation Learning）：

全参数微调（Full-Parameter Fine-tuning）：通过在特定任务上进一步训练预训练的LLM来适应特定任务。
参数高效微调（Parameter-Efficient Fine-tuning）：只更新模型的一小部分参数或引入一组新的参数来适应下游个性化任务。
嵌入学习（Embedding Learning）：学习表示输入文本和用户信息的嵌入，使模型能够更有效地结合个性化特征和偏好。

通过人类反馈的强化学习（Personalization via Reinforcement Learning from Human Feedback, RLHF）：

使用用户信息作为奖励信号，通过强化学习对齐LLMs与个性化偏好。

这些技术方法提供了不同的途径来整合用户特定的数据到LLMs中，以实现个性化。每种方法都有其独特的特点、应用场景和权衡。这些方法大多是正交的，意味着它们可以在同一个系统中共存。通过这些技术方法的分类，研究人员和开发者可以更好地理解和选择适合特定应用和场景的个性化技术。

https://arxiv.org/pdf/2411.00027Personalization of Large Language Models: A Survey

来源 | PaperAgent

http://mp.weixin.qq.com/s?__biz=MzIxNDgzNDg3NQ==&mid=2247549858&idx=5&sn=3f04f2f25f1f3d7ce0c70f0b29dac4c7

深度学习与NLP

专注深度学习、NLP相关技术、资讯，追求纯粹的技术，享受学习、分享的快乐。

最新文章

教育部公布！25考研人数，再降50万！

大模型代肝，自动刷《崩铁》升级材料，Claude操纵计算机还能这么用！

一篇小型语言模型技术最新全面综述

M3DocRAG：文档问答用哪个多模态大模型效果最好？

已公示！“东方理工大学”，来了

聊一聊做角色扮演大模型的经验

绝对顶流！清华博导倾力编写的《图神经网络导论》pdf免费分享

最高9.0分！这16篇最高分ICLR2025论文必看！从生成模型到MOE等

ICLR 高分：深入研究多模态大模型的对齐策略

谷歌大佬编写，我唯一熬夜看完的机器学习神作pdf分享！

双非二战字节算法岗，拿下70k offer.....

猫猫运动方程，首次被物理学家破解！ |《美国物理学杂志》正经研究

o1的风又吹到多模态，直接吹翻了GPT-4o-mini

谷歌大佬编写，我唯一熬夜看完的机器学习神作pdf分享！

微调图像大模型的经验分享

昨夜， LLM 已经彻底凉凉了...

Karpathy后悔了：2015年就看到了语言模型的潜力，却搞了多年强化学习

微软开源角色Agents，直接模拟了整个世界~

2024最新神书-《大模型应用程序构建指南》免费pdf分享

2024最新,李宏毅深度学习教程pdf免费分享！绝对值得反复阅读的神书！

已注销！985新校区，不建了

RAG黑盒被打开了，可视化RAGViz闪亮全场

LLM性能优化中的一些概念扫盲

Nature:「人类亲吻难题」彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

Cursor一不小心把自家的底牌也放出来了~

[送5本]《动手学机器学习》上海交大ACM班总教头团队重磅新作，带你动手学机器学习！

传说中Ilya Sutskever精选论文清单：AI领域40大论文完整版「破解」完成

神书《从零构建大模型》分享，尚未发布，GitHub标星22k！！

LLM性能优化中的一些概念扫盲

暴跌94%，裁员9600人。。。

[送5本]《大语言模型：原理、应用与优化》大模型未来发展方向大揭秘！

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中三篇杰出论文，明年顶会落户苏州

DRL2022新书-《深度强化学习》免费pdf分享

陶哲轩：计算机通用方法，往往比深奥的纯数学更能解决问题

中央批准：中央候补委员、教育部副部长，任C9大学书记

谷歌2024博士奖学金公布，KAN作者刘子鸣等数十位年轻华人学者入选

上交2024最新-《动手学大模型》实战教程及ppt分享！

考古OpenAI RLHF基石之作：探索RL和RM阶段的Scaling Law

【完整视频】黄仁勋对话软银孙正义：打造AI代理和物理AI，强调企业必须在AI浪潮中找准定位

2024最新版，人大赵鑫老师《大语言模型》新书pdf分享

上交2024最新-《动手学大模型》实战教程及ppt分享！

饶毅：全世界没有一个学校把博士后纳入“非升即走”

Scaling Laws终结，量化无用，AI大佬都在审视这篇论文

李飞飞等14位斯坦福微软大牛等撰写《AGENT AI: 综述多模态交互的前沿展望》免费pdf分享

一篇综述告诉你：如何用大语言模型设计算法

SFT洗数据，有多少细节？

LSTM+Transformer王炸创新，荣登Nature...

突发！三星7nm停供！

Ilya认错，Scaling Law崩了？自曝SSI秘密技术路线取代OpenAI

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉