NeurIPS'24大模型LoRA超级变体！仅需参数0.4%达微调效率巅峰！

科技 2024-10-22 16:36 浙江

随着大模型应用发展的深入，参数高效微调（PEFT）凭借定制化、精准性等优势，成为大模型优化的热门方式，其中，LoRA引入‌低秩矩阵，实现了不输全面微调的下游适应性能，但是，增长的训练需求也带来了存储和传输成本，为了显著提升LoRA计算效率，NeurIPS'24最新收录工作VB-LoRA，创新提出了分而共享机制，通过向量库进行全局参数共享，仅需LoRA参数0.4%，调优效率全面超越LoRA！

为了帮助大家掌握大模型顶会微调方法，研梦非凡于10月23日晚（周三），邀请了从事大模型研究的王导师，独家讲解《VB-LoRA：超越LoRA！大模型微调效率巅峰！》（AI前沿直播课NO.76），从大模型全量微调、PEFT，到LoRA及相关变体，重点讲解顶会方法VB-LoRA架构、实验，并介绍相关方法AM-LoRA，最后代码演示微调过程，1节课速通LoRA参数微调技术，get论文改进和实战知识点！

👇🏻扫描二维码找助教0元预约直播课！

凡预约即可领取130篇精选论文（30篇LoRA最新论文&代码&顶会方法+100篇大模型必读）

unsetunset10.23直播课内容概览unsetunset

01 研究背景

关注问题

大模型全量微调
参数高效微调（PEFT）
LoRA变体VB-LoRA（NeurIPS’24）

主要贡献

分而共享机制（divide-and-share）
通过向量库进行全局参数共享
既减少参数量也保证了模型效果

02 知识准备

LoRA方法原理
LoRA相关变体

03 VB-LoRA方法（重点）

模型架构
Divide分解原理
Share共享原理
参数量分析

全量微调 vs LoRA微调 vs VB-LoRA

04 实验分析

实验设置
结果分析

👇🏻扫描二维码找助教0元预约直播课！

凡预约即可领取130篇精选论文（30篇LoRA最新论文&代码&顶会方法+100篇大模型必读）

05 相关工作

南开大学最新论文（2024.9）

AM-LoRA：通过注意力机制自适应混合LoRA以实现语言模型的持续学习

关注问题

大模型灾难性遗忘问题
开源工作O-LoRA

主要贡献

创新提出AM-LoRA
持续学习方法、稀疏学习策略

持续学习方法
AM-LoRA介绍
实验相关

06 代码实现（重点）

LoRA基础微调演示
VB-LoRA微调演示

直播课导师介绍

王导师

【学术背景】985硕出身，拥有丰富的深度学习研究、论文发表经验，多篇SCI论文、EI会议论文（一作）

【研究方向】大语言模型、视觉语言模型、多模态学习，以及自然语言处理、进化算法等

👇🏻扫描二维码找助教0元预约直播课！

凡预约即可领取130篇精选论文（30篇LoRA最新论文&代码&顶会方法+100篇大模型必读）

unsetunset研梦非凡科研论文指导unsetunset

idea并不是直接拍脑门拍出来的，是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。研梦非凡1V1定制化论文指导，和研梦导师一起找idea，研梦导师指导实验，共同解决数据问题。授之以渔——搭建论文写作框架，增删改查，针对性实验指导！哪里薄弱补哪里！

<<< 左右滑动见更多 >>>

👇🏻全程1v1论文辅导扫码咨询助教

unsetunset研梦非凡部分导师介绍unsetunset

研梦非凡导师团队，来自海外QStop50、国内华五、C9、985高校的教授/博士导师/博士后，以及世界500强公司算法工程师、国内外知名人工智能实验室研究员等。

这是一支实力强大的高学历导师团队，在计算机科学、机器学习、深度学习等领域，积累了丰富的科研经历，研究成果也发表在国际各大顶级会议和期刊上，在指导学员的过程中，全程秉持初心，坚持手把手个性化带教。包括但不限于以下导师～

<<< 左右滑动见更多 >>>

👇🏻扫码加助教为你匹配合适课题的大牛导师

我们不是小作坊哦～我们背靠研途考研（就是张雪峰老师和徐涛老师在的那个研途考研），做教育十余年，重交付，重口碑，是我们一贯的公司理念！

机器学习实验室

专注于机器学习和深度学习技术与实践。

最新文章

245个目标检测开源项目合集，建议收藏！

制作个人的第一个RAG demo！

谷歌版Sora发布：最大对手竟是「可灵」，OpenAI反而最拉胯

NeurIPS 2024 | Ilya重磅演讲：预训练将结束，接下来是超级智能「自我意识」

多模态融合，顶会超神了！

今夜凌晨，OpenAI Sora炸裂登场！网页版已经挤爆

LSTM卷土重来！xLSTM和Vision-LSTM共同引领文艺复兴

“让AI不再难学"，知名UP主梗直哥的《破解深度学习》来了！

全球五大巨头GPU总量曝光！谷歌第一微软第二！

245个目标检测开源项目合集，建议收藏！

《深度学习图像分割》第4章：基于编解码结构的分割网络

RAG还是微调，怎么选？

吴恩达：每个AI从业者都应该关注Agent！

Flux已成当下最火热的文生图模型？

计算机视觉顶尖期刊和会议有哪些？

被导师放养，后果可能很严重。。。

两张3090复现SearchGPT！

啥工作量？！60天就卷出一篇CCF-A顶会...

AlphaFold3重磅开源，诺奖级AI颠覆世界！GitHub斩获1.8k星，本地即可部署

《深度学习图像分割》第3章：图像分割关键技术组件

涨点神器！100个即插即用缝合模块【合集下载】

导师一个idea都没有，怎么发CCF-A？

《深度学习图像分割》第2章：传统图像分割算法

ChatGPT变身AI搜索引擎免费用！

大模型可解释性怎么搞？(附代码)

新扩散模型OmniGen一统图像生成！

国内首本大模型推荐系统著作来了！

只要敢捞“偏门”，篇篇都是顶会顶刊！

245个目标检测开源项目合集，建议收藏！

NeurIPS'24大模型LoRA超级变体！仅需参数0.4%达微调效率巅峰！

Windows用户也能使用桌面版ChatGPT了！

发论文别太老实，用对方法篇篇都是顶会顶刊！！！

OpenAI王炸来了！强化学习也有scaling law？

预告 | 《深度学习图像分割》将在GitHub逐步内容开源！

算法岗和开发岗有什么区别？

算法岗就业，Kaggle金牌和CCF-A一作哪个更有用？

82个即插即用的深度学习缝合模块！

Llama 3.2 来了！支持图像推理，还有可在手机上运行的版本

张俊林详细拆解o1：OpenAI o1完整训练过程逆向推演

对标Claude Artifacts！OpenAI canvas一夜封神！

首个Mamba+Transformer混合架构多模态大模型来了！

在深度学习中，是否应该打破正负样本1:1的迷信？

首个工业级异常检测的大模型AnomalyGPT！AAAI 2024已开源！

Claude工程师聊prompt：不要把模型当小孩子、不需要角色扮演、实话实说

张俊林：OpenAI o1的价值意义及强化学习的Scaling Law

ECCV'24最强多模态检测器！详解Grounding DINO：创新架构、训练代码！

Sora年内发布无望？视频生成还有戏吗？

KAN 2.0来了！会是AI+Science的答案吗？

基于YOLO v8融合CLIP！CVPR 2024多模态检测神器！

GPT-4结合SAM 2：免训练多模态分割的全新解决方案！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉