ControlNet作者新作:AI打光玩得更溜了!细节保留能力远高于SD1.5

科技   2024-11-05 12:40   北京  
金磊 发自 凹非寺
量子位 | 公众号 QbitAI

ControlNet作者“敏神”(张吕敏),刚刚上新了一个新项目——

名叫IC-Light V2,可以说是把AI打光这事儿玩得溜溜的。

IC-Light是此前张吕敏开发的图像处理工具,可以通过AI技术精确控制图像中的光照效果。

而此次的V2版本则是一系列基于FLUX的IC-Light型号,具有16通道VAE和原生高分辨率。

话不多说,直接来看效果。

例如随意输入一张照片,附上一句Prompt:

flicker 2008 photo of a woman, neon light, city, cars and people in the background.
闪烁2008年的照片,一个女人,霓虹灯,城市,汽车和人的背景。

最终生成的效果可以称得上毫无违和感。

我们再来放大来看下前后的对比,人物细节保留程度就更明显了:

再来看一个例子:

据敏神自己介绍:

IC-Light V2得益于更好的训练方法,细节保留能力远高于SD1.5。

而网友们在看完新工具的效果之后也直呼“世界上最好的重光照(relighting)工具”。

风格化图片也能处理

在之前基于SD1.5的IC-Light,有个问题就是处理带风格的图片的效果并不是非常理想。

例如这样:

可以明显看出,原图是一张美漫风格的图片,而输出的结果却是真人风了。

而且即使在Prompt中给到了关键词“surrealist painting of(超现实主义绘画)”,得到的风格依旧还是带点漫画风。

嗯,AI直接把这个关键词给忽略掉了。

而现在,基于FLUX的IC-Light V2,已经弥补了此前的缺陷。



除了人物之外,敏神也展示了其它主体的效果。


在线可玩

目前,IC-Light V2已经上线HuggingFace,可以在线体验。

下面是我们实测马斯克照片的例子:

除此之外,敏神此次推出的IC-Light V2其实是一个系列的模型。

目前可以体验的版本是一个foreground conditioned model(前景条件模型),强调的是保留输入图像细节。

还有三个模型在陆续发布:

  • 还是一个前景条件模型,但强调支持较大的修改,例如处理低光图像和更改硬阴影。

  • 一个前景和背景条件模型

  • 与环境HDRI集成的模型

最后,敏神对于这次的模型还补充道:

目前的模型只能在HuggingFace上体验,稍后会发布更多的推理代码和权重。

然而,与V1不同的是,该许可证将仅用于非商业用途。

体验链接放下面了,感兴趣的小伙伴可以尝鲜一波哦~

体验地址:
https://huggingface.co/spaces/lllyasviel/iclight-v2

参考链接:
[1]
https://github.com/lllyasviel/IC-Light/discussions/98
[2]https://x.com/multimodalart/status/1850521222213218380?s=46&t=6eepxw1G6XRQ7VO0ANjJWg

评选征集中

「2024人工智能年度评选」

量子位2024人工智能年度评选已开启报名通道,评选从企业人物产品三大维度设立了5类奖项。

欢迎扫码报名评选!评选结果将于12月MEET2025智能未来大会公布,期待与数百万从业者共同见证荣誉时刻。

点这里👇关注我,记得标星哦~

一键三连「点赞」、「分享」和「在看」

科技前沿进展日日相见 ~ 

量子位
追踪人工智能新趋势,关注科技行业新突破
 最新文章