可图大模型的AI试衣技术在上海2024年人工智能大会(WAIC)上首次公开展示。
该技术基于可图大模型,允许用户通过上传个人照片和选定服装,生成穿着选定衣物的真实感图像。
这一功能结合了可灵图生视频技术,能够创建连贯的AI试衣短视频,从而为用户提供更为直观的试穿体验。
AI试衣技术,又称为虚拟试穿,是一种利用图像生成技术使用户能够在屏幕上“试穿”衣物的应用。
这项技术的发展得益于以生成对抗网络(GAN)和扩散模型(Diffusion Model)为代表的视觉生成模型的进步。
特别是到了2024年,随着大模型技术的成熟,AI试衣技术逐渐实现了从实验研究到实际应用的转变,为电子商务带来了新的可能性。
可图AI试衣技术构建在其基础模型之上,并集成了SKU保持网络,能够捕捉和表达服装的细节特征。
通过引入人物姿态(Pose)和遮罩(Mask)图像作为条件输入,该系统可以保持人物姿势的一致性,实现换装效果。
此外,它还利用了背景修复技术,并通过大量的高质量人物服装配对数据训练,提升了在不同服装样式、人物姿势以及复杂背景条件下的试穿效果。
对于消费者而言,AI试衣技术使得他们可以通过上传一张自己的照片,在数秒之内看到自己穿上特定服装的样子,这有助于提高购物决策效率,并减少因不合适而导致的商品退换货情况。
而对于电商平台上的卖家,尤其是中小企业来说,更新产品展示图片和视频素材是维护店铺吸引力的关键因素之一。
然而,传统的拍摄过程包括寻找模特、租赁场地、拍摄和后期制作等多个步骤,不仅耗费成本,而且耗时较长,导致新产品上线周期延长。
借助AI试衣技术,卖家能够快速生成高质量的模特图像和视频,将原本需要几天甚至更长时间的工作缩短至几分钟内完成,极大地提高了工作效率。
此外,AI试衣技术还可以应用于短视频内容创作领域。
例如,创作者可以通过“变装”特效制作出新颖有趣的短视频内容,包括但不限于模仿名人穿搭风格、定时变换服装等创意视频,为观众带来更加丰富多元的内容体验。
随着快手可灵AI平台从内测向全球用户的开放使用,预计将会涌现出更多高品质、高控制度且深度嵌入行业的AIGC(AI Generated Content)功能。
特别是在电商和短视频内容创作方面,像AI试衣这样的可控图像生成技术,将朝着更高的可控性、美学质量和更符合物理规律的方向发展,力求尽快达到AI试衣领域的“ChatGPT时刻”,并在电商及泛娱乐产业中发挥更大的商业价值。
为了让更多人体验到AI试衣技术的魅力,可图团队已经在HuggingFace Space上提供了免费体验链接,并且相关开源项目可在GitHub上找到,此外,HuggingFace平台上也有可图模型可供访问。
直达链接:https://huggingface.co/spaces/Kwai-Kolors/Kolors-Virtual-Try-On
关注我们:即可加入【AI交流群】,免费领取【AI大礼包】