哈~ 标题竟然还单押上了~
前几天才刚和大家聊完快手推出的快影,在短视频圈激起了一波“老照片”复活潮~
就在前日,快手旗下Kolors团队正式开源了用团队命名的图像生成模型Kolors(可图)(一般敢用团队名来命名,说明该产品不简单)
据官方消息,该模型经过数十亿文本&图像对训练,在理解复杂语义上
有着出色的表现!支持直接输入中文生图,且支持图片中显示中文字符。
官方邀请了50位图像专家进行了一场对比评估,得出了以下成绩:
从我个人的实测感受来看,上面的得分还是略微浮夸哈~1. 可以直接输入中文提示词,且对中文语义的理解秒杀其他所有。那就来一句我偶像勃哥的词吧:落霞与孤鹜齐飞,秋水共长天一色!
陶醉了~ 我抽了几张,都是写实风格,且都很好看!关键我输入的是中文.zip啊! 2. 综合了DALL-E3的复杂语义理解,同时又保留了MJ的画面效果。因此哪怕输入的提示词很多,AI也不会注意力丢失以及内容混乱。那么,作为ikun一员,我第一个想到的就是给我家哥哥出一张写真:输入中文提示词:一只公鸡穿着黑色毛衣,灰色背带裤,踩在一个篮球上。
就问你city不city! 不仅生出来了,而且生的还那么帅气~ 双手插兜,没有对手,不愧是我家哥哥!就是棒哈~这次我们加大难度,让川普老乡给我们打打气。输入:特朗普站在白宫门前,双手举着一个巨大的牌子,上面写着“杰视帮天府三街五百强”。看来字多了还是容易崩,不过能写出来已经很不错了
以上就是我个人实测Kolors的心得。总的来说最让我惊艳的还是语义理解以及对中文的支持。
比如拿我之前跑的钢铁侠大战哥斯拉来对比一下,可以看到差距还是蛮大的:
当然这可能是训练语料的问题,一张图不能代表全部哈~我们再来输入些其他提示词试试:
Kolors对中文语义的理解确实可以,但不能过分刁难:
随着AI电商海报的增多,这方面的图生成起来也更轻松了:
但在人像生成方面,油腻感会比较重。哪怕调低CFG也存在较强的涂抹感。这块官方自己出图也是有同类问题:
以上就是Kolors的出图效果,总的来说还是很好玩哒~1. 首先安装Kolors节点,和常规的节点安装方式一样:https://github.com/kijai/ComfyUI-KwaiKolorsWrapper
2. 下载以下所有模型文件,放到此路径里:ComfyUI\models\diffusers模型下载地址:https://huggingface.co/Kwai-Kolors/Kolors/tree/main
3. 新建一个Kolors文件夹,按上图所示创建好文件结构,放到diffusers文件夹里:
这里模型文件一共有16G,比较大,但别慌,我已经打包好了。还未加入的小伙伴,可以加我的微信领取哈:
真人微信号已满,只能开数字人分身了
这个插件还是很乖的,安装好ComfyUI-KwaiKolorsWrapper这个插件,然后把上面我给你准备好的模型文件夹放到对应位置即可。接着打开ComfyUI,节点就这几个,按图示连接即可。也可以把空latent节点换成图片进行重绘,流程非常简单:
感兴趣的小伙伴快去试试吧~目前国内AI的发展越来越越给力,前有腾讯混元-DiT,现有快手Kolors,后来者一路在奔跑,留给Midjourney的时间不多啦~
希望国内的各大厂商们能多多努力,也希望大家能多支持国内的AI发展,毕竟MJ它不便宜啊~ 感谢大家看到这里
最后容我打个小小的广告
下面是广告,不想看的同学可以划走哈~
想系统学习视觉创意+商业策划+AI应用+商业落地的同学们可以上车啦!因为还有课前预习班,晚了可能就学不过来咯~
来不了线下班的同学,或者只对AI有需求的同学,也可以直接参与线上AI磁力圈。首发直降500活动,还有3天就要结束咯,犹豫的同学们抓紧啦~以及各种实用有趣的AIGC知识!
来不及解释了,快上车!