FLUX.1-Tools:F1官方黑森林重磅出手构建F1完善生态,加速生态里程碑进程
🌹大家好!欢迎来到破狼公众号。感谢大家的支持与鼓励。在AIGC探索道路上,我将与你一路同行。喜欢就星标关注破狼公众号或文末扫码加入交流群 !本人仅运营公众号平台,未经授权严禁CSDN等其他平台抄袭和转载!
前言
就在今天Flux官方团队黑森林团队扔出了重磅炸弹:FLUX.1-Tools。这将是改变Flux生态的重大里程碑事件,。在本次发布中包含了FLUX.1 Fill(图像重绘和扩图模型)、FLUX.1 Depth (可控性ControlNet深度模型)、FLUX.1 Canny(可控性ControlNet Canny线稿模型)、FLUX.1 Redux(图像转换风格化模型,类似IPAdapter模型) 共4款常用的图像编辑和ControlNet可控性模型。这将是改变Flux生态的核心里程碑事件,一改Flux在可控性上不如SD1.5/SDXL 模型生态的局面。
本文为翻译官方原文博客。相关模型的使用将在后续文章中陆续展示,敬请期待和支持!感谢大家一直以来的鼓励和支持!核心重要资料如下(每个核心模型都是23.8G对于磁盘和显存将是重大的挑战):
• 官方博客:https://blackforestlabs.ai/flux-1-tools/
• 深度模型:https://huggingface.co/black-forest-labs/FLUX.1-Depth-dev/tree/main
• 线稿模型:https://huggingface.co/black-forest-labs/FLUX.1-Canny-dev/tree/main
• 重绘和扩图模型:https://huggingface.co/black-forest-labs/FLUX.1-Fill-dev/tree/main
• 图像风格化模型:https://huggingface.co/black-forest-labs/FLUX.1-Redux-dev/tree/main
• 线稿LORA模型:https://huggingface.co/black-forest-labs/FLUX.1-Canny-dev-lora/tree/main
• 深度LORA模型:https://huggingface.co/black-forest-labs/FLUX.1-Depth-dev-lora/tree/main
FLUX.1-Tools简介
就在今天Flux研发官方团队重磅发布了最新的Flux生态工具:FLUX.1工具。官方称:这是一套为FLUX.1文生图模型进一步增强可控制和可操作性的模型,这将使得对生产图像的修改和再次延伸创作成为可能。在本次发布中FLUX.1工具一共包括四个不同的特性模型,将作为FLUX.1 [dev]模型系列中的开放可访问模型发布,并且可在BFL API中作为FLUX.1 [pro]的补充使用:
• FLUX.1 Fill:先进的修复和扩展模型,允许根据文本描述或二进制掩码实现图像编辑和扩展生成新的图像创作。
• FLUX.1 Depth:一款训练有素的深度ControlNet模型,能够根据从输入图像中提取的深度图和文本提示进行结构引导。
• FLUX.1 Canny:一款训练有素的线稿ControlNet模型,能够根据从输入图像中提取的Canny边缘和文本提示进行结构引导。
• FLUX.1 Redux:一个Flux基础模型适配器,允许根据用户输入混合和风格化再生成芯图像。
本次的发布是黑森林官方团队对Flux社区的双重承诺:为研究社区提供尖端的开放权重模型,同时也会通过官方API提供一流的服务能力。在BFL API中以FLUX.1 [pro] 变体的形式发布了上述每个工具,并提供推理代码和权重模型作为指导蒸馏FLUX.1 [dev] 模型的变体。此外,本次发布工具还会通过fal.ai、Replicate、Together.ai、Freepik和krea.ai等众多平台提供服务能力。
FLUX.1 Fill的修复和扩展
FLUX.1 Fill模型 引入了先进的修复重绘能力,超越了现有的重绘和扩展工具,如Ideogram 2.0 和流行的开源变体,如AlibabaCreative的FLUX-Controlnet-Inpainting。它允许无缝编辑,与现有图像自然融合。
此外,FLUX.1 Fill还支持扩展图像能力,使用户能够轻松的实现扩展图像功能。
在官方的基准测试结果显示,Flux.1 Fill [pro] 超越了现有的所有其他竞争方法,使其成为迄今为止最先进的修复模型 。其次是Flux.1 Fill [dev] ,在推理效率更高的情况下超越了现有的专有解决方案。
FLUX.1 Canny和Depth可控性ControlNet模型
在ControlNet结构可控性中可以使用 Canny线稿边缘或Depth深度检测模型。它们能够在图像转换过程中保持精确控制。并通过保留原始图像的结构,用户可以在保持核心构图的同时进行文本提示引导实现图像编辑。
在官方的基准评估测试展示:FLUX.1 Depth 超越了像 Midjourney ReTexture 这类专有模型。特别是,FLUX.1 Depth [pro] 提供的更高的图像输出多样性。而 FLUX.1 Depth [dev] 在深度图像任务中提供了更强的一致结果。对于Canny边缘模型基准测试展示:FLUX.1 Canny [pro] 是同类中最好的线稿模型,其次是 FLUX.1 Canny [dev] 。
FLUX.1 Redux图像风格化
本次发布的FLUX.1 Redux 是所有 FLUX.1基础模型的适配器,可被用于图像变化和重新生成。在给定一个输入图像,FLUX.1 Redux 可以复制输入图像并进行轻微变化,允许对给定图像进行进一步优化和完善图像。
FLUX.1 Redux 可以自然便捷的融入更复杂的工作流程,通过提示解锁图像重新风格化。通过提供图像和文本提示实现图像的重新风格化。在最新的模型 FLUX1.1 [pro] Ultra 中得到更好的支持,允许结合输入图像和文本提示,创建高质量的4百万像素输出,具有灵活的宽高比。
在官方的基准测试表明 FLUX.1 Redux在图像变化和风格化方面实现了现有最先进的性能方法。
关于Flux模型的使用请参考本公众号更多详情资料。Flux基础文生图可通过LIBLIB在线或客户端快速体验。
Flux文生图工作流
Flux文生图感兴趣的同学可参考LIBLIB在线运行工作流:FLUX[续篇]:12B参数23G最大开源文生图模型,Dev版直出惊艳美图欣赏
本文涉及ComfyUI工作流和模型均可在LIBLIBAI上下载或在线运行体验:
• FLUX.1哩布在线可运行-黑暗森林工作室:
https://www.liblib.art/modelinfo/488cd9d58cd4421b9e8000373d7da123
• F.1-绮梦流光-水湄凝香:
https://www.liblib.art/modelinfo/134c6dd95aef48e98a22b24e003e026b
• 工作流-Flux文|图生图+LORA+提示反推一键切换工作流:
https://www.liblib.art/modelinfo/782aacd70f604da39e83368c696a02a8
另外LIBLIBAI已支持本地客户端使用可首页(https://www.liblib.art)下载体验。
更多推荐文章:
• 智谱CogVideoX1.5:重大升级,可商用开源模型!10秒&增强质量&任意分辨率,ComfyUI无缝体验
• [ComfyUI]Flux:Lovely网红写真,极致细节写实,小红书网红人物写真风格
• 太酷啦!实时人物表情编辑神器,ComfyUI玩转视频表情无限创意
• PixelWave:更真实细节|动漫|摄影多种艺术风格显著提升,基于黑森林F.1D超5周精调模型
• OmniGen:统一图像生成和多任务集成模型,任意人物自由合影,8位量化体验
• 15秒F.1D直出,极限无损加速方案,环境大升级敢不敢来试?
• CogVideo:重磅升级!图生视频完美镜头控制和3D环绕,商用级开源AI视频曙光
• 阿里InContextLoRA:更强ID一致性!基于黑森林F1身份一致性连贯视频分镜图集,10组风格无限创意
• [ComfyUI]InstantIR:来自小红书团队模糊图像修复技术,效果是否惊艳?