「本期内容标签」
安卓 iOS 电脑 小程序 网站 游戏 教程
最近一直在做我软件的移植工作,主要是将Windows平台移动到mac平台上,基本上把软件的SD作画、高清放大等核心功能移植过来,软件依然是解压即用,无需环境配置。
V5.0版本:2023-4-8
1、 苹果版仅限于M系列芯片,目前功能完成SD作画(支持sd模型导入、VAE模型、LORA模型),文生图,图生图;
2、 支持高清放大图片功能;
3、 支持音视频转文字功能;
4、 支持三次元生成功能;
5、 支持AI写小说功能;
6、 其他windows端功能正在补充中。
01
软件概览
软件名字叫作:AI作画离线版V5.0(Stable Diffusion),基于GitHub上的开源项目Stable Diffusion。
如下,软件主界面,还是以操作简单为主:
▼
02
软件安装
安装很简单,按照如下步骤来就行:
第一步:搜索找到终端,如下
▼
打开终端,然后输入sudo spctl --master-disable,回车,输入密码即可。
▼
第二步:下载网盘的AI作画离线版压缩包,解压;
第三步:解压的路径中找到DD5_V5,双击打开,注意第一次加载比较慢,几十秒后会弹出如下主界面:
▼
03
软件功能介绍
功能一:SD(Stable Diffusion)作画
1、描述词设定:描述词句式基本和DD一样,但SD作画多了个负描述,负描述默认可以不写,负描述如果写,就代表不想让绘画结果出现的元素。
▼
支持写个开头,然后如下点击AI生成描述进行续写描述,目前有两种自动写描述引擎了:
▼
2、绘图参数:图片尺寸需要64的倍数,当然随便填写尺寸也行,软件会自动转换;绘图步数SD步数20就够了,多了没啥意义;绘制图片轮数代表每次画几张图;描述相关度默认数值就可以,当然可以尝试10以上数值;随机种子默认0,代表每次种子随机,设置大于零的固定值,如果其他参数一样,则SD出图完全一样。
▼
3、参考图:支持参考图,不过参数比较简单,基本上就是导入原图,修改描述,设置图片差异度参数即可,注意差异度参数范围0-1,1代表与参考图差异最大哈。另外,自适应尺寸比较人性化,比如参考图尺寸宽高为1024x512,绘图参数尺寸设置512×512,默认无,代表不自适应,最终出的图尺寸为512×512,固定宽代表,以绘图参数尺寸设置的宽512为准,参考图宽高比2比1,高自动修改为256,最终输出512x256的图。
▼
如下,试试SD参考图,实现真人参考图用二次元描述实现真人二次元效果:
4、自定义SD模型选择:支持选择第三方ckpt、safetensors格式的SD模型以及VAE模型,如下所示,选择模型所在路径即可实现利用第三方SD模型作画。注意的是导入的模型要区分是SD一代还是二代,在下拉列表里自行选择,否则报错。
支持lora、SD、VAE模型导入。
▼
如下演示,三大模型相互结合画的一些图:
5、DeepDanbooru二次元TAG解析:如下点击按钮,支持二次元图片的TAG解析,诸如NovelAI等模型比较有需求:
▼
6、帮助相关:对于大多数参数,都加入了帮助按钮,鼠标划到对应帮助图标,驻留即可显示参数含义,当然大多数都是翻译的官方文档,加入自己的一点注解。
7、导入配置:支持导入图片输出目录images_out文件下的DD作画json配置文件或者生成的图片,如下点击导入配置按钮即可:
▼
8、AI图片描述解析:如下按钮点击,选择图片,稍等片刻即可显示出描述,当然这个描述有所出入,但当作描述来用画出的图也确实不错。
▼
下面演示几张图,解析出来的描述:
a couple of people riding bikes down a road, a matte painting by Makoto Shinkai, featured on pixiv, rayonism, official art, anamorphic lens flare, matte painting
a group of iron man standing next to each other in the ocean, a comic book panel by Paul Pelletier, featured on deviantart, antipodeans, marvel comics, reimagined by industrial light and magic, imax
a painting of a landscape with mountains and trees, a detailed matte painting by Katsukawa Shunsen, pixiv, shin hanga, ukiyo-e, matte painting, detailed painting
功能二:图片AI高清放大
设置不同的放大模型和图片放大倍数,高清放大图片输出目录为软件目录\images_out\AI_ultra_HD,支持2-10倍放大。
▼
AI高清放大是一个独立功能,软件主界面点击高清放大按钮,选择图片(支持批量),即可高清放大图片。
如下,小图经过高清放大的对比效果,二次元和三次元都能胜任。
功能三:三次元生成
点击三次元生成按钮,即可绘制多张三次元全身图:
如下可在参数设置里,设置各种参数以生成不同类型的三次元图片:
▼
功能四:AI写小说
点击AI写小说按钮,设置开头,即可续写不同轮数的文字:
▼
功能五:音视频转文字
点击音视频转文字按钮,选择音频或者视频,即可进行语音识别,输出字幕和文字版txt文件。
音视频转文字功能,支持100多个国家语言,若选择汉语,则不过什么语言的音视频,最终都会自动翻译成中文字幕和txt文件,方便快捷,不过翻译效果有限,最好还是选择原视频语言进行识别。
▼
如下,选取的日文视频演讲识别字幕效果,红框为软件识别自动翻译的字幕:
▼
04
配置要求
需要苹果M系列芯片,且mac os 12或者13版本。
05
小结
这个项目确实很有意思,感兴趣的可以体验一下5.0版本了,更详细的作图参数、教程多刷刷B站相关视频即可。
06
本期内容获取
👇👇👇👇👇👇苹果版👇👇👇👇👇👇
(1)百度网盘链接:https://pan.baidu.com/s/1OYH76LBJHk72wAkEVAyT3w
提取码:ylfd
(2)天翼网盘链接:https://cloud.189.cn/t/Vju6jmuaeaqm (访问码:2zun)
👇👇👇👇👇👇Windows版👇👇👇👇👇👇
方式一:百度网盘https://pan.baidu.com/s/1B0g4MPFe_drP_hRjgEnKGg 提取码:95kh
方式二:天翼网盘
https://cloud.189.cn/t/ZZ7vuyZrMvmm (访问码:7dn8)