大模型微调搞不定？看这期直播就够了

科技 2024-08-16 18:30 上海

在之前的 AI 进阶指南（上）的课程中，我们已经学习了很多与大模型相关的知识点，对于备受关注的大模型微调怎么能不分享一波呢？道客船长这就给大家奉上大模型微调的知识大餐啦！

大模型微调是一种通过特定领域的数据集对已经完成预训练的大模型进行进一步训练的过程，目的是优化模型在特定任务上的性能。

在实际业务场景中，大模型微调可以应用于多个领域，例如情感分析、实体识别、文本分类、对话生成等 。随着大型语言模型（LLM）参数规模的扩大，微调这些模型相比从头开始训练新模型更具成本效益。微调技术多样，包括全量微调和参数高效微调等。鉴于全量微调在资源消耗上的高成本，参数高效微调因其较低的计算和存储成本而受到青睐，这种方法通过仅调整模型的一小部分参数，既能降低资源需求，又能保持或接近全参数微调的性能水平。

参数高效微调（PEFT）包括多种策略，如增量式（Addition-based）、选取部分参数更新（Selective-based）和重参数化（Reparameterization-based）等方法，其中包含有 Prefix Tuning、Prompt Tuning、Adapter Tuning、LoRA 等多种技术，通过最小化参数更新，实现了在资源有效利用和快速适应新任务之间的平衡。

为了更好地支持资源拓展，提升容错率，支持并行模型训练、减少训练时间等需求，我们会更推荐利用容器和分布式能力进行大模型的微调，在课上我们也会介绍几款云原生的开源项目及其用法，例如 KubeRay, deepspeed 等技术是如何帮助大家更好的利用云原生技术能力来优化大模型的微调，达到更高效、更灵活地微调大模型的同时，降低训练成本。

如果你对于大模型微调的策略感兴趣、想深入了解、学习或者跟讲师互动沟通，这节直播课不容错过，「DaoCloud 道客」的高级研发工程师 - 黄敏杰老师将现身说法，除了概念描述、案例分享、视频教学，还有实操演示，帮助大家快速入门大模型微调。

就在 8 月 20 日晚上 19：00 - 20：00，点击下方链接预约直播课

热门推荐

访问以下网址，或点击文末【阅读原文】立即体验

d.run，让算力更自由：

https://d.run/

DaoCloud 公司简介

「DaoCloud 道客」，云原生领域的创新领导者，成立于 2014 年底，凭借其自主知识产权的核心技术，成功打造了新一代云原生操作系统 DaoCloud Enterprise 5.0，致力于推动企业数字化、智能化转型。依托在云原生领域的技术积淀与持续创新，「DaoCloud 道客」推出 d.run 算力一体化解决方案，作为专业的技术提供商参与并推动多个区域算力枢纽中心的建设，为各行各业提供稳定、高效的算力支持。成立迄今，公司已在金融科技、先进制造、智能汽车、零售网点、城市大脑等多个领域深耕，标杆客户包括交通银行、浦发银行、上汽集团、格力集团、京东方、屈臣氏集团等。公司总部位于上海，并在新加坡、北京、深圳、成都、南京、武汉等地设立多家分公司及合资公司，总员工人数超过 300 人，是国家级“专精特新”小巨人企业、上海市高新技术企业，并入选了科创板培育企业名单。

网址：www.daocloud.io

邮件：info@daocloud.io

电话：400 002 6898

http://mp.weixin.qq.com/s?__biz=MzA5NTUxNzE4MQ==&mid=2659287699&idx=1&sn=69d9781bad23262a91b4167a85951960

道客船长

分享云原生技术相关信息，助力开发者和企业云海扬帆！本公众号由 DaoCloud 负责运营

最新文章

掌握 AI 网络的密码，快不止一点

北美 KubeCon 前夕：containerd 相关项目集中发布全新大版本

标准化与多样性齐头并进的 KubeCon 见闻

一节课了解 AI 训练的幕后英雄—存储系统

KubeEdge 如何构建适应边缘网络的安全可信隧道

联想凌拓技术大会丨解锁数据潜能，携手共赴 AI 未来

KubeCon 北美倒计时｜在“养老圣地”畅谈云原生的开源未来

想学习海量数据的管理方法？听这节课就够了

AI中台如何成为金融业务增长的催化剂？

奔赴一场开源的旅程 | 道客船长邀你参与第九届中国开源年会

异构算力，轻松拿捏

南瓜灯下丨开启万圣夜奇幻魔法之旅

猿力觉醒丨黑客马拉松燃爆智慧火花

GPU 利用率不提升，买再多卡也徒劳

邀您共赴 DigitAI Visionaries Symposium 2024丨共筑企业 AI 与数字金融未来

不知道怎么给 GPU 加速？还不赶紧来听课

通过弹性配额突破静态 GPU 分配限制

云边协同新征程：KubeEdge 走向毕业

AI 和 ML 工作负载的 GPU 调度挑战

HAMi 发布 v2.4.0 版本：异构计算虚拟化迈向新高度

开源 vGPU 方案：HAMi，实现细粒度 GPU 切分

Kubernetes 宣布 2024 年指导委员会选举结果

把钱花在刀刃上，精打细算的 GPU 成本控制策略

KubeCon 上那些关于服务网格的新思路

七十五载华诞｜走过风雨路，盛世续华章

一位 Kubernetes 女性开发者的香港随笔

如何实现系统稳定和性能提升｜社区内关于可观测性的新尝试

故障模拟和稳定性的探索｜ DaoCloud Enterprise 5.0 的混沌工程实践

GPU 软件故障，求人不如自己搞定

人工智能影响下，那些多集群赛道上的新课题

皓月当空，你吃月饼了吗？

NVIDIA & DaoCloud ｜使用 KWOK 轻松模拟和测试大规模集群的调度策略

使用 Keycloak 为云原生应用构建身份认证系统

教师节｜致敬三尺讲台上的你

GPU 集群管理搞不定了？听这节直播课就够了

想成为未来的 Kubernetes 发布团队负责人吗？最后一天，1.32 Release Team Shadow 申请即将关闭！

那些不能错过的 KubeCon 精彩圆桌，聆听社区贡献者心声

为什么选择 d.run ｜提升 AI 算力资源的使用效率

新学期，带着 AI 进阶指南（下）来了！

KubeCon China 回顾｜开源技术的未来——做踏实的工程师，爱自己的孩子

化解异构之上的 AI 计算难题｜ HAMi 进入 CNCF Sandbox

东京首秀｜ DaoCloud 即将亮相 KubeDay Japan 2024

KubeCon Hong Kong｜和 Linus 一起共赴云原生技术盛会

大模型微调搞不定？看这期直播就够了

深度学习时代的资源博弈：Kubernetes 调度的创新实践

GOGC 2024 ｜集结号已吹响，邀您共赴开源嘉年华

Kubernetes 1.31 圆梦之路: 十年了, OCI 镜像借着 AI 的风终于加入 Volume 的大家庭 ~

KubeCon 预告｜AI 与云原生的交响，共赴香港技术盛会！

七夕 | 宇宙级的浪漫——卧看牵牛织女星

模型推理如何优化？AI 进阶指南第四节课来教你

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉