一文彻底搞懂大模型 - LLaMA-Factory

文摘科技 2024-10-06 21:08 湖北

LLaMA-Factory

如何高效地微调和部署大型语言模型（LLM）？LLaMA-Factory作为一个开源的微调框架，应运而生，为开发者提供了一个简便、高效的工具，以便在现有的预训练模型基础上，快速适应特定任务需求，提升模型表现。LLaMA-Factory作为一个功能强大且高效的大模型微调框架，通过其用户友好的界面和丰富的功能特性，为开发者提供了极大的便利。

LLaMA-Factory

一、LLaMA-Factory

什么是LLaMA-Factory？LLaMA-Factory，全称Large Language Model Factory，即大型语言模型工厂。它支持多种预训练模型和微调算法，提供了一套完整的工具和接口，使得用户能够轻松地对预训练的模型进行定制化的训练和调整，以适应特定的应用场景，如智能客服、语音识别、机器翻译等。

LLaMA-Factory

支持的模型：LLaMA-Factory支持多种大型语言模型，包括但不限于LLaMA、BLOOM、Mistral、Baichuan、Qwen、ChatGLM等。
集成方法：包括（增量）预训练、指令监督微调、奖励模型训练、PPO训练、DPO训练和ORPO训练等多种方法。
运算精度与优化算法：提供32比特全参数微调、16比特冻结微调、16比特LoRA微调和基于AQLM/AWQ/GPTQ/LLM.int8的2/4/8比特QLoRA微调等多种精度选择，以及GaLore、DoRA、LongLoRA、LLaMA Pro、LoRA+、LoftQ和Agent微调等先进算法。

LLaMA-Factory

LLaMA-Factory提供了简洁明了的操作界面和丰富的文档支持，使得用户能够轻松上手并快速实现模型的微调与优化。用户可以根据自己的需求选择不同的模型、算法和精度进行微调，以获得最佳的训练效果。

LLaMA-Factory

二、模型微调（Fine-Tuning）

如何使用LLaMA-Factory进行模型微调？使用LLaMA-Factory进行模型微调是一个涵盖从选择模型、数据加载、参数配置到训练、评估优化直至部署应用的全面且高效的流程。

1. 选择模型：根据应用场景和需求选择合适的预训练模型。

设置语言：进入WebUI后，可以切换到中文（zh）。
配置模型：选择LLaMA3-8B-Chat模型。
配置微调方法：微调方法则保持默认值lora，使用LoRA轻量化微调方法能极大程度地节约显存。

2. 加载数据：将准备好的数据集加载到LLaMA-Factory中。

LLaMA-Factory项目内置了丰富的数据集，放在了data目录下。同时也可以自己准备自定义数据集，将数据处理为框架特定的格式，放到指定的data目录下。

3. 配置参数：根据实际情况调整学习率、批次大小等训练参数。

学习率+梯度累积：设置学习率为1e-4，梯度累积为2，有利于模型拟合。
计算类型：如果是NVIDIA V100显卡，计算类型保持为fp16；如果使用了AMD A10系列显卡，可以更改计算类型为bf16。

LoRA参数设置：设置LoRA+学习率比例为16，LoRA+被证明是比LoRA学习效果更好的算法。在LoRA作用模块中填写all，即将LoRA层挂载到模型的所有线性层上，提高拟合效果。

4. 开始训练：启动训练过程，并监控模型的训练进度和性能表现。

输出目录：将输出目录修改为train_llama3，训练后的LoRA权重将会保存在此目录中。
预览命令：点击「预览命令」可展示所有已配置的参数，如果想通过代码运行微调，可以复制这段命令，在命令行运行。
开始：点击「开始」启动模型微调。

训练完毕：启动微调后需要等待一段时间，待模型下载完毕后可在界面观察到训练进度和损失曲线。模型微调大约需要20分钟，显示“训练完毕”代表微调成功。

5. 评估与优化：使用LLaMA-Factory提供的评估工具对模型性能进行评估，并根据评估结果进行针对性的优化。

刷新适配器：微调完成后，点击页面顶部的「刷新适配器」
适配器路径：点击适配器路径，即可弹出刚刚训练完成的LoRA权重，点击选择下拉列表中的train_llama3选项，在模型启动时即可加载微调结果。

评估模型：选择「Evaluate&Predict」栏，在数据集下拉列表中选择「eval」（验证集）评估模型。
输出目录：更改输出目录为eval_llama3，模型评估结果将会保存在该目录中。
开始评估：最后点击开始按钮启动模型评估。

评估分数：模型评估大约需要5分钟左右，评估完成后会在界面上显示验证集的分数。
ROUGE分数：其中ROUGE分数衡量了模型输出答案（predict）和验证集中标准答案（label）的相似度，ROUGE分数越高代表模型学习得更好。

6. 部署应用：将训练好的模型部署到实际应用场景中，实现其功能和价值。

加载模型：选择「Chat」栏，确保适配器路径是train_llama3，点击「加载模型」即可在Web UI中和微调模型进行对话。

卸载模型：点击「卸载模型」，点击“×”号取消适配器路径，再次点击「加载模型」，即可与微调前的原始模型聊天。

http://mp.weixin.qq.com/s?__biz=MzkzMTEzMzI5Ng==&mid=2247492018&idx=1&sn=f6caeed656a45a11ba1dc1d858a00a55

架构师带你玩转AI

分享人工智能，让所有人玩转AI

最新文章

一文彻底搞懂深度学习 - 优化器（Optimizer）

一文彻底搞懂深度学习 - 模型评估（Evaluation）

一文彻底搞懂自然语言处理 - 贝叶斯统计（Bayesian Statistics）

大模型实战 - 如何使用Prompt快速构建应用？

一文彻底搞懂自然语言处理 - 词嵌入（Word Embedding）

好书推荐 -《大模型推荐系统：算法原理、代码实战与案例分析》

一文彻底搞懂自然语言处理 - 总体介绍（Introduction）

大模型面试 - T5（Text-to-Text Transfer Transformer）

一文彻底搞懂深度学习 - 过拟合和欠拟合

一文彻底搞懂深度学习 - 梯度消失和梯度爆炸

大模型实战 - 训练不了模型，就训练自己

好书推荐 - 《一本书读懂AI Agent：技术、应用与商业》

好书推荐 - 《架构思维：从程序员到CTO》

一文彻底搞懂深度学习 - Transformer

一文彻底搞懂深度学习 - 注意力机制（Attention Mechanism）

一文彻底搞懂深度学习 - 序列模型（Sequence Model）

一文彻底搞懂深度学习 - 卷积和池化（Convolution And Pooling）

大模型实战 - 如何学习和拥抱AI？

好书推荐 - 《这就是ChatGPT》

一文彻底搞懂深度学习 - 训练和推理（Training vs Inference）

一文彻底搞懂深度学习 - 超参数（Hyperparameter）

它来了，它来了，它终于来了

一文彻底搞懂深度学习 - 梯度下降（Gradient Descent）

一文彻底搞懂深度学习 - 反向传播（Back Propagation）

好书推荐 - 《大模型应用开发极简入门：基于GPT-4和ChatGPT》

大模型面试 - GPT（Generative Pre-trained Transformer）

一文彻底搞懂深度学习 - 损失函数（Loss Function）

一文彻底搞懂深度学习 -激活函数（Activation Function）

一文彻底搞懂深度学习 - 神经网络（Neural network）

一文彻底搞懂深度学习 - 感知机（perceptron）

好书推荐 - 《深度学习入门：基于Python的理论和实现》

大模型实战 - 如何构建AI底层架构？

一文彻底搞懂GPT - GPT-3

一文彻底搞懂GPT - GPT-2

一文彻底搞懂论文 - GPT-1

一文彻底搞懂大模型实战 - 角色扮演（Role Play）

一文彻底搞懂大模型实战 - 文本到SQL（Text2SQL）

好书推荐 - 《地理计算与R语言》

大模型实战 - 多模态

一文彻底搞懂多模态 - 大语言模型推理

一文彻底搞懂多模态 - 多模态推理

大模型面试 - BERT（基于Transformer的双向编码器）

一文彻底搞懂大模型 - Hugging Face Transformers

一文彻底搞懂大模型 - 基于人类反馈的强化学习（RLHF）

一文彻底搞懂大模型 - LLaMA-Factory

大模型面试 - 大模型第一部分课程简介

好书推荐 - 《深度神经网络高效计算：大模型轻量化原理与关键技术》

好书推荐 - 《多模态大模型：技术原理和实战》

一文彻底搞懂多模态 - 多模态检索

大模型面试 - 计算机视觉（Computer Vision）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉