AI训练软件3.0来啦,Lora、DreamBooth、抠图、打标签都支持
科技
科技
2023-05-04 21:34
山东
最近AI作画很火,也有各种模型不断推出,这些模型基本上都是网友训练的,而背后的技术其实也是公开的,如下各种风格的模型层出不穷:而本着让这些看着高大上的技术成为傻瓜式操作的目标,我就做了这款训练工具,目标是集成各种与AI训练相关的功能,解压即用,无需各种环境配置。1、DB、LORA训练参数设置分类设置,可设置参数更加详细;6、支持加载上次的参数设置、记住上次窗口大小等功能。软件名字叫作:AI训练工具离线版V3.0,基于GitHub上的开源项目sd scripts。 第二步:解压的路径中找到AI训练工具离线版V3.0.exe,双击打开,注意第一次加载比较慢,几秒到几十秒后会弹出如下主界面,注意背后的黑窗不能关,黑窗显示一些重要信息。1、SD模型选择,lora训练其实是特殊的模型微调策略,所以要选择SD模型,SD模型通用的一般是SD 1.5,二次元一般是novelAI、revAnimated_v11这种大模型,我演示的SD 1.5。(1)准备训练图及目录:这是重点,主要是训练图片目录选择,以及文件夹建立方式,如下,我准备的训练图片:可以看到,图片放到10_mingren文件夹里,10代表让AI重复训练次数,mingren代表模型标识词,后续训练出的模型,描述里带着mingren就会画和训练图风格类似的图片。切记严格这样建立目录,格式就是:重复次数_标识词,下划线隔开。(2)选择训练图片目录,如下,训练图片目录只选择到10_mingren的上层目录训练图文件夹,这一步也切记严格执行。
(3)正则图片目录:这个主要防止过拟合,可以不选择,正则图片目录和训练图片目录建立策略一致,不过重复次数1就行,目录名字格式重复次数_标类别词,比如1_man。(4)图片宽高:这个和训练图片尺寸有关,比如训练图片尺寸都是512×704,自然就是设置成宽512,高704。我的训练图都是512×512的,所以我设置都是512。(5)最小最大分辨率:默认最小256,最大1024,代表你训练图的尺寸最小边不能小于256,最大边不能超过1024,比如你训练图某一张分辨率为512×1280,最大边1280是大于1024的,这种会报错。(1)模型框架:这个默认就行,其他框架还在丰富扩充中,后续会加入更多,目前测试默认的效果就不错。(2)LORA断点模型选择:这个就是如果发现训练出的模型没训练够,可选择上次的lora模型继续训练,如果没有这个需求,这个自然就不用选择了。(3)网络维度参数:network_dim参数越大,拟合效果越好,这个自己测试,可以鼠标悬停到旁边的问号有解释。(1)batch size:默认为1,显存大的可以设置大一些,训练速度会快很多。(2)clip skip:默认为2,这个默认就行,基本都用2。(3)epoch和保存频率:默认10个epoch,每两个epoch保存一次模型(保存中途模型的好处是有时候最终模型可能过拟合,可能中途的模型效果要好一些),epoch代表模型训练轮数,一般设置大一些拟合效果好,但太大也没啥必要,还有个参数叫步数step,比如10张训练图,重复次数10,batch size为1,训练10个epoch,那么step=10*10*10=1000步。学习率是一个比较玄学或者说进阶的参数,一般默认就行了。优化器的作用是让AI沿着不同方向去拟合模型,有些优化器带着学习率自适应调整的策略,默认的Adam8bit就不错,当然有说Lion也不错的,各位自行测试。模型目录名可以修改一下,这样会保存到软件目录/生成的模型目录中,保存精度默认float32,20、30系列显卡可以设置保存fp16,这样保存的模型体积小一倍,效果没区别。设置完之后,可以点击训练了,训练完之后的模型保存在软件目录/生成的模型目录中。一份极简的lora设置是:默认设置下,选择SD模型,选择训练图片目录,点击训练,就三步,其他参数不用修改。DreamBooth训练参数包含于Lora训练参数设置,训练机理也和Lora一致,所以这里不再赘述。这里特别说的是DreamBooth训练出的模型是大模型,也就是好几个GB大小的,而Lora一般几十MB到上百MB大小。不管是Lora训练还是DreamBooth训练,对图片打标签也挺重要,如下点击点击绿色按钮,选择图片所在文件夹,即可自动生成图片同名的txt文件与图片同级目录保存,支持文件夹下的子文件夹图片打标签。对于训练诸如人像,扣除背景也挺有必要,如下点击绿色按钮,批量选择要扣除的图片,即可自动抠图,保存到软件目录\images_out\Koutu_Out文件夹里,当然毕竟AI自动抠图,有些图扣的效果有一些问题。lora模型和SD模型一样,都支持按比例融合,比如一个二次元和一个三次元模型一比一融合,融合出来的模型可能是2.5次元风格的。如下界面,选择要融合的lora模型,至少选择两个,设置比例,点击融合即可。这个功能有点意思,就是从网上的SD模型里提取出Lora模型,基底模型就是这个大模型基于哪个模型训练的,一般是SD 1.5,最终模型就是网上下的SD模型,然后选择保存目录和lora dim,点击开始提取即可。这个很玄学,因为你不知道网上下载模型基底模型到底用的哪个,各位可以测测,不同的基底模型提取的Lora没准有奇效。需要英伟达显卡,6G显存显卡,Windows 10、11系统电脑,像1060、980ti、1660、2060等6G显卡都可以,丽台、tesla计算卡等都支持,基本上就是英伟达6G显存显卡就行了。我软件名字叫做AI训练软件,就代表后续加入的训练功能不局限于作画模型的训练,诸如小说、音视频相关的训练功能后续都会加入,这个项目确实很有意思,感兴趣的可以体验一下3.0版本了,更详细的教程多刷刷B站相关视频即可。👇👇Windows 10、Windows11版👇👇https://pan.baidu.com/s/1nJD2wDWyAcNBkbD7ThQlMQ?pwd=vjc8https://cloud.189.cn/t/iEB7nqyq2a6z