[ComfyUI]MagicQuill:一个智能交互式图像编辑系统
MagicQuill简介
今天文章介绍一款AI智能交互图像编辑开源框架:MagicQuill。这是一个在图像编辑任务重实用的应用工具。MagicQuill是一个集成的图像编辑系统,目的为了支持用户迅速实现个人创意。系统从一个简洁但功能强大的界面开始,使用户能够通过几笔简单的笔画表达到想法(例如,插入元素、擦除对象、改变颜色等)。这些交互随后由一个多模态大型语言模型(MLLM)监控,以实时预测用户意图,绕过提示输入的需要。MagicQuill应用了强大的diffusion扩散模型经验,通过精心学习的双分支插件模块增强,以精确控制处理编辑请求。
另外,MagicQuill包含多类图像编辑任务:通过三种类型的画笔(添加、减法和颜色)让用户能够轻松表达创意,智能猜测用户意图并自动填充提示,提供实用的画布工具以实现直观的图像编辑,并通过参数调整实现精确的控制,从而为用户提供一个简洁、功能强大且易于使用的图像编辑体验。
• 项目主页:https://magicquill.art/demo/
• github:https://github.com/magic-quill/magicquill?tab=readme-ov-file
• 在线体验:https://huggingface.co/spaces/AI4Editing/MagicQuill
MagicQuill ComfyUI体验
• ComfyUI_MagicQuill插件:https://github.com/magic-quill/ComfyUI_MagicQuill 。可以使用git插件管理器安装,或者下面CMD命令行安装。另外,需要确保pip install transformers==4.37.2
git clone https://github.com/magic-quill/ComfyUI_MagicQuill.git
cd ComfyUI_MagicQuill
python install.py
pip install -r requirements.txt
这里会自动安装BrushNet插件
• 模型文件下载:插件作者提供了ComfyUI模型放置zip包(共25G),需要将其与 /ComfyUI/models 目录合并。下载如下:
## 1: zip下载
wget -O models.zip "https://hkustconnect-my.sharepoint.com/:u:/g/personal/zliucz_connect_ust_hk/EWlGF0WfawJIrJ1Hn85_-3gB0MtwImAnYeWXuleVQcukMg?e=Gcjugg&download=1"
unzip models.zip
## 2: Git下载git lfs clone https://huggingface.co/LiuZichen/MagicQuill-models
问题描述:https://github.com/nullquant/ComfyUI-BrushNet/issues/154
安裝细节:
Flux文生图工作流
• F.1-绮梦流光-水湄凝香:
https://www.liblib.art/modelinfo/134c6dd95aef48e98a22b24e003e026b
• 工作流-Flux文|图生图+LORA+提示反推一键切换工作流:
https://www.liblib.art/modelinfo/782aacd70f604da39e83368c696a02a8
MagicQuill工作流
• 插件作者测试确认运行MagicQuill 模型 可在8GB VRAM的GPU上运行(例如:RTX4070)。
• 使用SD1.5基础模型。在高级参数中可选择模型以适应不同的编辑图像风格:1:realisticVisionV60B1_v51VAE.safetensors:此选项生成现实风格的图像!推荐默认模型。2: DreamShaper.safetensors:用于生成幻想风格的图像。3:majicMIX_realistic:擅长生成肖像,特别亚洲人物。4: MeinaMix.safetensors:擅长生成动漫图像。5:ghostmix_v20Bakedvae.safetensors:另一个动漫图像生成模型。
• 也可以在线体验:https://huggingface.co/spaces/AI4Editing/MagicQuill
• 另外,还有SD1.5基础参数:负面提示(不希望的内容)、精细边缘可以启用激活精细边缘控制、增加大小调整参数以设置编辑图像时受笔画影响的像素范围,以扩大/减少笔画影响区域、边缘强度用于调整添加/减法画笔控制强度、颜色强度用于调整颜色画笔控制强度,可以调整图像的着色效果、以及CFG、seed等基础扩散模型参数。
• 缺点:插件设计使用的llava模型是在ComfyUI软件启动时加载,这样严重影响了ComfyUI日常启动速率耗时319.1秒(如为改进则只能用完禁用插件,需要时再开启)
01. 染发
hair
线稿图 | 色块图 |
02.金项链
Gold necklace
03.纹身
Red tattoo
04.移除物体
empty
05.替换物体
Beer bottle
更多推荐文章: