VB-LoRA高效登顶！仅需0.4%参数量，极限超越LoRA！

科技 2024-10-15 19:00 江苏

随着大模型应用发展的深入，参数高效微调（PEFT）凭借定制化、精准性等优势，成为大模型优化的热门方式，其中，LoRA引入‌低秩矩阵，实现了不输全面微调的下游适应性能，但是，增长的训练需求也带来了存储和传输成本，为了显著提升LoRA计算效率，NeurIPS'24最新收录工作VB-LoRA，创新提出了分而共享机制，通过向量库进行全局参数共享，仅需LoRA参数0.4%，调优效率全面超越LoRA！

为了帮助大家掌握大模型顶会微调方法，研梦非凡于10月23日晚（周三），邀请了从事大模型研究的王导师，独家讲解《VB-LoRA：超越LoRA！大模型微调效率巅峰！》（AI前沿直播课NO.76），从大模型全量微调、PEFT，到LoRA及相关变体，重点讲解顶会方法VB-LoRA架构、实验，并介绍相关方法AM-LoRA，最后代码演示微调过程，1节课速通LoRA参数微调技术，get论文改进和实战知识点！

👇🏻扫描二维码找助教0元预约直播课！

凡预约即可领取130篇精选论文（30篇LoRA最新论文&代码&顶会方法+100篇大模型必读）

10.23直播课内容概览

01 研究背景

关注问题

大模型全量微调
参数高效微调（PEFT）
LoRA变体VB-LoRA（NeurIPS’24）

主要贡献

分而共享机制（divide-and-share）
通过向量库进行全局参数共享
既减少参数量也保证了模型效果

02 知识准备

LoRA方法原理
LoRA相关变体

03 VB-LoRA方法（重点）

模型架构
Divide分解原理
Share共享原理
参数量分析

全量微调 vs LoRA微调 vs VB-LoRA

04 实验分析

实验设置
结果分析

👇🏻扫描二维码找助教0元预约直播课！

凡预约即可领取130篇精选论文（30篇LoRA最新论文&代码&顶会方法+100篇大模型必读）

05 相关工作

南开大学最新论文（2024.9）

AM-LoRA：通过注意力机制自适应混合LoRA以实现语言模型的持续学习

关注问题

大模型灾难性遗忘问题
开源工作O-LoRA

主要贡献

创新提出AM-LoRA
持续学习方法、稀疏学习策略

持续学习方法
AM-LoRA介绍
实验相关

06 代码实现（重点）

LoRA基础微调演示
VB-LoRA微调演示

直播课导师介绍

王导师

【学术背景】985硕出身，拥有丰富的深度学习研究、论文发表经验，多篇SCI论文、EI会议论文（一作）

【研究方向】大语言模型、视觉语言模型、多模态学习，以及自然语言处理、进化算法等

👇🏻扫描二维码找助教0元预约直播课！

凡预约即可领取130篇精选论文（30篇LoRA最新论文&代码&顶会方法+100篇大模型必读）

研梦非凡科研论文指导

idea并不是直接拍脑门拍出来的，是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。研梦非凡1V1定制化论文指导，和研梦导师一起找idea，研梦导师指导实验，共同解决数据问题。授之以渔——搭建论文写作框架，增删改查，针对性实验指导！哪里薄弱补哪里！

<<< 左右滑动见更多 >>>

👇🏻全程1v1论文辅导扫码咨询助教

研梦非凡部分导师介绍

研梦非凡导师团队，来自海外QStop50、国内华五、C9、985高校的教授/博士导师/博士后，以及世界500强公司算法工程师、国内外知名人工智能实验室研究员等。

这是一支实力强大的高学历导师团队，在计算机科学、机器学习、深度学习等领域，积累了丰富的科研经历，研究成果也发表在国际各大顶级会议和期刊上，在指导学员的过程中，全程秉持初心，坚持手把手个性化带教。包括但不限于以下导师～

<<< 左右滑动见更多 >>>

👇🏻扫码加助教为你匹配合适课题的大牛导师

我们不是小作坊哦～我们背靠研途考研（就是张雪峰老师和徐涛老师在的那个研途考研），做教育十余年，重交付，重口碑，是我们一贯的公司理念！

http://mp.weixin.qq.com/s?__biz=MzU0NTAyNTQ1OQ==&mid=2247538920&idx=2&sn=b30fe287f2015e9cc8b9240b51f34d5d

计算机视觉研究院

计算机视觉研究院主要涉及AI研究和落地实践，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。研究院主要着重”技术研究“和“实践落地”！

最新文章

今年顶会这情况。。。大家提前做准备吧！

取代Mamba，超越Transformer！扩展LSTM到数十亿参数

Drone-YOLO：一种有效的无人机图像目标检测

“计算机视觉研究院”商务合作

再见阿里，你好字节！

纯干货：Box Size置信度偏差会损害目标检测器（附源代码）

PE-YOLO：解决黑夜中的目标检测难点

245个目标检测开源项目合集，建议收藏！

YoloV：视频中目标实时检测依然很棒（附源代码下载）

利用先进技术保家卫国：深度学习进行小目标检测（适合初学者入门）

大型视觉语言模型OMG-LLaVA：图像级、目标级和像素级的推理和理解任务统一

PE-YOLO：解决黑夜中的目标检测难点

NeurIPS 2024 | 真实世界复杂任务，全新基准GTA助力大模型工具调用能力评测

人脸识别精度提升 | 基于Transformer的人脸识别（附源码）

YOLO-S：小目标检测的轻量级、精确的类YOLO网络

FP-DETR：通过完全预训练提升transformer目标检测器

3D大模型助力，15分钟即可训练高质量、个性化的数字人模型，代码已开放

顶会新方向！全新多模态大模型统一分割框架

微软新出框架：Transformer扩展到10亿token（附代码下载）

Drone-YOLO：一种有效的无人机图像目标检测

26申博时间规划！别再按老套路来了，没用

“计算机视觉研究院”商务合作

一文读懂模型的可解释性（附代码）

首个快速知识蒸馏的视觉框架：ResNet50 80.1%精度，训练加速30%

劲爆！YOLOv6又快又准的目标检测框架开源啦（附源代码下载）

今天面试了一个字节女生，当场想给她offer

三区idea最后发了顶会！

特别小的目标检测识别（附论文下载）

基于Transformer的跨模态3D点云目标检测SOTA！易复现！

NeurIPS 2024 | 消除多对多问题，清华提出大规模细粒度视频片段标注新范式VERIFIED

“计算机视觉研究院”商务合作

机场项目：解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题

不需要标注了？看自监督学习框架如何助力目标检测

RestoreDet：低分辨率图像中目标检测

目标检测创新：一种基于区域的半监督方法，部分标签即可（附原论文下载）

又快又准，即插即用！清华8比特量化Attention，两倍加速于FlashAttention2，各端到端任务均不掉点！

MIT韩松团队长上下文LLM推理高效框架DuoAttention：单GPU实现330万Token上下文推理

50K*16薪，进字节了！

YOLO-S：小目标检测的轻量级、精确的类YOLO网络

“计算机视觉研究院”商务合作

RestoreDet：低分辨率图像中目标检测

CVPR’24｜PanoOcc基于相机的3D全景分割最强SOTA！

利用先进技术保家卫国：深度学习进行小目标检测（适合初学者入门）

245个目标检测开源项目合集，建议收藏！

“计算机视觉研究院”商务合作

完爆YOLO家族？新一代目标检测器又有新突破！

NeurIPS 2024 Oral | 小参数，大作为！揭秘非对称 LoRA 架构的高效性能

YOLO-SLD：一种改进的注意机制YOLO车牌检测

“计算机视觉研究院”商务合作

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉