ControlNet作者新作:AI打光玩得更溜了!细节保留能力远高于SD1.5

科技   2024-11-06 13:05   上海  

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【Mamba/多模态/扩散】交流群

添加微信号:CVer2233,小助手会拉你进群!

扫描下方二维码,加入CVer学术星球可以获得最新顶会/顶刊上的论文ideaCV从入门到精通资料,及最前沿应用!发论文/搞科研/涨薪,强烈推荐!

金磊 发自 凹非寺
转载自:量子位(QbitAI)

ControlNet作者“敏神”(张吕敏),刚刚上新了一个新项目——

名叫IC-Light V2,可以说是把AI打光这事儿玩得溜溜的。

IC-Light是此前张吕敏开发的图像处理工具,可以通过AI技术精确控制图像中的光照效果。

而此次的V2版本则是一系列基于FLUX的IC-Light型号,具有16通道VAE和原生高分辨率。

话不多说,直接来看效果。

例如随意输入一张照片,附上一句Prompt:

flicker 2008 photo of a woman, neon light, city, cars and people in the background.
闪烁2008年的照片,一个女人,霓虹灯,城市,汽车和人的背景。

最终生成的效果可以称得上毫无违和感。

我们再来放大来看下前后的对比,人物细节保留程度就更明显了:

再来看一个例子:

据敏神自己介绍:

IC-Light V2得益于更好的训练方法,细节保留能力远高于SD1.5。

而网友们在看完新工具的效果之后也直呼“世界上最好的重光照(relighting)工具”。

风格化图片也能处理

在之前基于SD1.5的IC-Light,有个问题就是处理带风格的图片的效果并不是非常理想。

例如这样:

可以明显看出,原图是一张美漫风格的图片,而输出的结果却是真人风了。

而且即使在Prompt中给到了关键词“surrealist painting of(超现实主义绘画)”,得到的风格依旧还是带点漫画风。

嗯,AI直接把这个关键词给忽略掉了。

而现在,基于FLUX的IC-Light V2,已经弥补了此前的缺陷。



除了人物之外,敏神也展示了其它主体的效果。


在线可玩

目前,IC-Light V2已经上线HuggingFace,可以在线体验。

下面是我们实测马斯克照片的例子:

除此之外,敏神此次推出的IC-Light V2其实是一个系列的模型。

目前可以体验的版本是一个foreground conditioned model(前景条件模型),强调的是保留输入图像细节。

还有三个模型在陆续发布:

  • 还是一个前景条件模型,但强调支持较大的修改,例如处理低光图像和更改硬阴影。

  • 一个前景和背景条件模型

  • 与环境HDRI集成的模型

最后,敏神对于这次的模型还补充道:

目前的模型只能在HuggingFace上体验,稍后会发布更多的推理代码和权重。

然而,与V1不同的是,该许可证将仅用于非商业用途。

体验链接放下面了,感兴趣的小伙伴可以尝鲜一波哦~

体验地址:
https://huggingface.co/spaces/lllyasviel/iclight-v2

参考链接:
[1]
https://github.com/lllyasviel/IC-Light/discussions/98
[2]https://x.com/multimodalart/status/1850521222213218380?s=46&t=6eepxw1G6XRQ7VO0ANjJWg

何恺明在MIT授课的课件PPT下载

在CVer公众号后台回复:何恺明,即可下载本课程的所有566页课件PPT!赶紧学起来!

ECCV 2024 论文和代码下载

在CVer公众号后台回复:ECCV2024,即可下载ECCV 2024论文和代码开源的论文合集

CVPR 2024 论文和代码下载

在CVer公众号后台回复:CVPR2024,即可下载CVPR 2024论文和代码开源的论文合集


Mamba、多模态和扩散模型交流群成立

扫描下方二维码,或者添加微信号:CVer2233,即可添加CVer小助手微信,便可申请加入CVer-Mamba、多模态学习或者扩散模型微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。


一定要备注:研究方向+地点+学校/公司+昵称(如Mamba、多模态学习或者扩散模型+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer2233,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集上万人!


扫码加入星球学习

▲点击上方卡片,关注CVer公众号

整理不易,请赞和在看

CVer
一个专注于计算机视觉方向的公众号。分享计算机视觉、深度学习、人工智能、自动驾驶和高校等高质量内容。
 最新文章