AI训练软件3.0来啦，Lora、DreamBooth、抠图、打标签都支持

科技科技 2023-05-04 21:34 山东

「本期内容标签」

安卓 iOS 电脑 小程序 网站 游戏教程

最近AI作画很火，也有各种模型不断推出，这些模型基本上都是网友训练的，而背后的技术其实也是公开的，如下各种风格的模型层出不穷：

▼

而本着让这些看着高大上的技术成为傻瓜式操作的目标，我就做了这款训练工具，目标是集成各种与AI训练相关的功能，解压即用，无需各种环境配置。

V3.0版本：2023-5-2

1、DB、LORA训练参数设置分类设置，可设置参数更加详细；

2、支持抠图、BLIP打图片描述；

3、支持lora合并和提取；

4、基于torch2.0，较旧版提速1倍以上；

5、英伟达6G显卡即可训练lora模型；

6、支持加载上次的参数设置、记住上次窗口大小等功能。

软件概览

软件名字叫作：AI训练工具离线版V3.0，基于GitHub上的开源项目sd scripts。

如下，软件主界面，还是以操作简单为主：

▼

软件安装

安装很简单，下载解压即可。

第一步：下载压缩包解压。

第二步：解压的路径中找到AI训练工具离线版V3.0.exe，双击打开，注意第一次加载比较慢，几秒到几十秒后会弹出如下主界面，注意背后的黑窗不能关，黑窗显示一些重要信息。

▼

软件功能介绍

功能一：LORA训练

1、SD模型选择，lora训练其实是特殊的模型微调策略，所以要选择SD模型，SD模型通用的一般是SD 1.5，二次元一般是novelAI、revAnimated_v11这种大模型，我演示的SD 1.5。

▼

2、训练图片参数选择

（1）准备训练图及目录：这是重点，主要是训练图片目录选择，以及文件夹建立方式，如下，我准备的训练图片：

▼

可以看到，图片放到10_mingren文件夹里，10代表让AI重复训练次数，mingren代表模型标识词，后续训练出的模型，描述里带着mingren就会画和训练图风格类似的图片。切记严格这样建立目录，格式就是：重复次数_标识词，下划线隔开。

（2）选择训练图片目录，如下，训练图片目录只选择到10_mingren的上层目录训练图文件夹，这一步也切记严格执行。

▼

（3）正则图片目录：这个主要防止过拟合，可以不选择，正则图片目录和训练图片目录建立策略一致，不过重复次数1就行，目录名字格式重复次数_标类别词，比如1_man。

正则图片目录这个基本不用选，空着就行。

▼

（4）图片宽高：这个和训练图片尺寸有关，比如训练图片尺寸都是512×704，自然就是设置成宽512，高704。我的训练图都是512×512的，所以我设置都是512。

▼

（5）最小最大分辨率：默认最小256，最大1024，代表你训练图的尺寸最小边不能小于256，最大边不能超过1024，比如你训练图某一张分辨率为512×1280，最大边1280是大于1024的，这种会报错。

▼

3、LORA模型参数

（1）模型框架：这个默认就行，其他框架还在丰富扩充中，后续会加入更多，目前测试默认的效果就不错。

▼

（2）LORA断点模型选择：这个就是如果发现训练出的模型没训练够，可选择上次的lora模型继续训练，如果没有这个需求，这个自然就不用选择了。

▼

（3）网络维度参数：network_dim参数越大，拟合效果越好，这个自己测试，可以鼠标悬停到旁边的问号有解释。

▼

4、训练基本参数

（1）batch size：默认为1，显存大的可以设置大一些，训练速度会快很多。

▼

（2）clip skip：默认为2，这个默认就行，基本都用2。

▼

（3）epoch和保存频率：默认10个epoch，每两个epoch保存一次模型（保存中途模型的好处是有时候最终模型可能过拟合，可能中途的模型效果要好一些），epoch代表模型训练轮数，一般设置大一些拟合效果好，但太大也没啥必要，还有个参数叫步数step，比如10张训练图，重复次数10，batch size为1，训练10个epoch，那么step=10*10*10=1000步。

▼

5、学习率

学习率是一个比较玄学或者说进阶的参数，一般默认就行了。

▼

6、优化器

优化器的作用是让AI沿着不同方向去拟合模型，有些优化器带着学习率自适应调整的策略，默认的Adam8bit就不错，当然有说Lion也不错的，各位自行测试。

▼

7、其他参数

这几个参数还是默认就好。

▼

8、模型保存

模型目录名可以修改一下，这样会保存到软件目录/生成的模型目录中，保存精度默认float32，20、30系列显卡可以设置保存fp16，这样保存的模型体积小一倍，效果没区别。

▼

设置完之后，可以点击训练了，训练完之后的模型保存在软件目录/生成的模型目录中。

一份极简的lora设置是：默认设置下，选择SD模型，选择训练图片目录，点击训练，就三步，其他参数不用修改。

功能二：DreamBooth训练

DreamBooth训练参数包含于Lora训练参数设置，训练机理也和Lora一致，所以这里不再赘述。

这里特别说的是DreamBooth训练出的模型是大模型，也就是好几个GB大小的，而Lora一般几十MB到上百MB大小。

▼

功能三：图片批量描述打标签

不管是Lora训练还是DreamBooth训练，对图片打标签也挺重要，如下点击点击绿色按钮，选择图片所在文件夹，即可自动生成图片同名的txt文件与图片同级目录保存，支持文件夹下的子文件夹图片打标签。

▼

功能四：批量抠图

对于训练诸如人像，扣除背景也挺有必要，如下点击绿色按钮，批量选择要扣除的图片，即可自动抠图，保存到软件目录\images_out\Koutu_Out文件夹里，当然毕竟AI自动抠图，有些图扣的效果有一些问题。

▼

功能五：LORA融合

lora模型和SD模型一样，都支持按比例融合，比如一个二次元和一个三次元模型一比一融合，融合出来的模型可能是2.5次元风格的。

如下界面，选择要融合的lora模型，至少选择两个，设置比例，点击融合即可。

▼

功能六：LORA提取

这个功能有点意思，就是从网上的SD模型里提取出Lora模型，基底模型就是这个大模型基于哪个模型训练的，一般是SD 1.5，最终模型就是网上下的SD模型，然后选择保存目录和lora dim，点击开始提取即可。

这个很玄学，因为你不知道网上下载模型基底模型到底用的哪个，各位可以测测，不同的基底模型提取的Lora没准有奇效。

▼

配置要求

需要英伟达显卡，6G显存显卡，Windows 10、11系统电脑，像1060、980ti、1660、2060等6G显卡都可以，丽台、tesla计算卡等都支持，基本上就是英伟达6G显存显卡就行了。

小结

我软件名字叫做AI训练软件，就代表后续加入的训练功能不局限于作画模型的训练，诸如小说、音视频相关的训练功能后续都会加入，这个项目确实很有意思，感兴趣的可以体验一下3.0版本了，更详细的教程多刷刷B站相关视频即可。

本期内容获取

👇👇Windows 10、Windows11版👇👇

方式一：百度网盘

https://pan.baidu.com/s/1nJD2wDWyAcNBkbD7ThQlMQ?pwd=vjc8

方式二：天翼网盘

https://cloud.189.cn/t/iEB7nqyq2a6z

（访问码：ca02）

http://mp.weixin.qq.com/s?__biz=MjM5NDE1NzEwMg==&mid=2247510282&idx=1&sn=a4f137b49724fb83373552ce22b46762

万能君的软件库

一个每天分享安卓、iOS、电脑、网站、编程等相关干货资源的公众号，奉行“为人民服务，用心原创，授人以鱼不如授人以渔”的政策，希望大家在嘈杂的互联网环境下获得一些有用的知识。

AI文字|图片生成视频（Pyramid Flow）V1.0，可能是最快的开源视频生成项目，10S长视频生成，解压即用！

AI换脸V6.1，ROPE-NEXT未来版，rope换脸直播更加流畅、人脸编辑、背景修复、更详细的参数，不用搭建环境，解压即用

AI音频克隆与推理（GPT-SoVITS-V2）工具V1.0，V2版本效果确实更好，极速克隆TTS音频，不用搭建环境，解压即用

AI作画离线版V8.0，支持FLUX-dev，目前开源最强作画模型，更好的效果，更强的语义理解作画能力！

AI文字生成视频CogVideoX-5B工具V1.0，5G显存可用、6S长视频生成，不用搭建环境，解压即用！

AI一键制作证件照工具 V1.0，任意人像图片，自动更换背景色、批量生成、不同尺寸，不用搭建环境，解压即用！

AI写小说工具 V1.0来啦，网文写作、支持修改、多轮续写，不用搭建环境，解压即用！

AI模仿视频表情（LivePortrait）工具V1.3，解压即用

AI图片换装CAT-VTON工具V1.0，效果更好，速度更快，批量任意人物换任意衣服，不用搭建环境，解压即用！

阿里开源巨作CosyVoice：3s极速克隆音频TTS工具 V1.0，效果确实很好，不用搭建环境，解压即用！

AI图片模仿视频表情（LivePortrait）工具V1.1，解压即用

一张图片实现跳舞视频生成工具来啦

AI作画离线版V7.3，支持Stable Diffusion 3，更强的语义理解作画能力！

文字生成音乐工具V1.0来啦，基于stable-audio-open-1.0，批量文字描述生成音乐，不用搭建环境，解压即用！

ChatTTS离线工具V1.1来啦，固定音色，不限制字数生成音频，不用搭建环境，解压即用！

ChatTTS离线工具V1.0，非常好的文字转音频工具，支持多种音色保存调用，不用搭建环境，解压即用！

AI漫画上色（manga-colorization-v2）小工具V1.0，效果很好很快的漫画上色工具，不用搭建环境，解压即用！

AI换脸V5.7来啦，更新到FaceFusion 2.6.0，修复预批量数字人，修复众多bug，解压即用的免费换脸工具

更优质的软件大全、编程学习就看本文吧，是时候开启新的征程了

AI数字人音频驱动对口型MuseTalk工具V1.0，解压即用

AI图片换装IDM-VTON工具V1.1，任意图片一键换装，解压即用

AI作画离线版V7.2，批量高效节省显存，重绘支持自动分割、XL大模型图生图、更多LORA支持！

AI换脸V5.5来啦，更新到FaceFusion 2.5.2，修复一堆bug，不用搭建环境，解压即用的免费换脸工具

AI文字搜图、搜视频工具离线版V1.0，用文字描述的形式来搜索本地图片和视频，很有创意的工具，不用搭建环境，解压即用！

AI音频克隆&TTS训练推理工具，克隆、唱歌、文字转音频、伴奏去除多合一，解压即用的免费工具

AI换脸V5.2，黑白上色，roop、rope、FaceFusion三合一，解压即用的免费换脸工具

AI自动换装OOTDiffusion小工具V1.1，解压即用

公式识别离线小工具V1.1

批量抠图小工具V1.2，解压即用

AI换脸V5.1，roop、rope、FaceFusion三合一，解压即用的免费换脸工具

AI作画离线版V7.1，不用训练即可生成不同人物风格图、XL turbo一步成图、SVD 1.1来啦！

AI作画离线版V7.0，SVD图片生成视频、LCM秒速出图、极速视频无抖动重绘来啦！

AI作画离线版V6.0，SD XL、文字生成视频、视频无抖动重绘来啦！

AI文案撰写、短视频去水印，这个小程序统统搞定

AI作画离线版V5.2，升级torch 2.0速度更快、清华ChatGLM2、看图聊天、AI文字生成音乐、AI动画来啦！

AI作画离线版V5.1，ControlNet、清华类ChatGPT、抠图、补帧、数字人，一堆功能来啦！

比ChatGPT还早，强推这款国产AI写作神器！

AI训练软件3.0来啦，Lora、DreamBooth、抠图、打标签都支持

AI作画离线版V5.0，苹果电脑也支持啦！

AI作画离线版V5.0，加速几倍作画速度、图片说话功能来啦！

免费伴奏人声分离，就是这个软件了！

YYDS！B站疯传！限时删！！

老照片修复＋上色，就是这个软件了！

AI作画离线版V4.2，自动写描述、二次元TAG解析、图片视频上色功能来啦！

AI作画离线版V4.1，Stable Diffusion动画、Dream Booth训练、音视频识别转字幕功能来啦！

Disco Diffusion AI作画离线版V4.0，Stable Diffusion作画、人声伴奏分离功能，来了！

（待会删）yyds，请低调使用！

Disco Diffusion AI作画离线版V3.11，AI图片逆向解析描述、高清老照片修复功能，来了！

Disco Diffusion AI作画离线版V3.10，小说训练、图片配置导入功能，都来了！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉