首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
谷歌AI虚拟试穿,数千件连衣裙任意穿
科技
2024-09-09 21:53
广东
9月5日,谷歌宣布其虚拟试穿功能扩展至连衣裙类别,这一举措旨在帮助消费者更直观地了解服装上身效果,减少因不合适而退货的情况,从而提升购物体验。
该功能基于先进的生成式人工智能技术,允许用户在搜索连衣裙时,通过点击带有“试穿”标签的商品来查看该衣物在不同体型模特身上的展示效果。
| 功能实现方式
在美国地区的用户,只需在谷歌搜索框内输入想要查找的连衣裙款式,并选择带有“试穿”标志的产品。
随后,用户可以看到这件衣服在多种尺寸(从XXS到XXXL)的真实模特身上的样子。
通过选择与自己身材相似的模特,用户可以更好地预估出这件连衣裙的实际穿着效果。当找到心仪的款式后,可以直接点击链接前往零售商网站完成购买流程。
| 技术背景
为了使这项功能成为现实,谷歌开发了一套专门用于虚拟试穿(Virtual Try-On, VTO)的生成式人工智能技术。
该技术的核心在于一种基于扩散模型的方法,能够从零开始生成每一个像素,以创造出高质量且逼真的图像。
然而,在测试过程中发现,连衣裙相较于简单的上衣而言更加复杂多变,这给现有技术带来了新的挑战。
| 技术难点及解决方案
首先,连衣裙的设计往往更为精细,从半身长的吊带裙到迷你直筒裙再到长款下摆裙,各种不同的剪裁、长度和形状使得每一件连衣裙都独具特色。
例如,要在小尺寸的图像上描绘出花卉图案或是褶边领口等细节是非常困难的。
简单地放大图像并不能解决问题,因为这些细节在原始图像中并不存在。
因此,研究团队提出了一种称为“渐进式训练策略”的方法,即从较低分辨率的图像开始,逐渐过渡到更高分辨率的训练过程中。
这种方法确保了即使是微小的细节也能清晰可见。
其次,由于连衣裙覆盖的身体面积比普通上衣更大,因此在“擦除”旧衣物并“替换”为新连衣裙的过程中,可能会导致模特特征模糊不清。
为了解决这一问题,研发人员设计出了一个名为VTO-UNet Diffusion Transformer(简称VTO-UDiT)的新技术,它可以隔离并保留模特的重要特征。
这样,即使在模型训练过程中存在“身份丢失”的风险,VTO-UDiT也能提供一个虚拟的“模板”,使得只对模特本身进行重新训练,从而保留下模特的脸部和身体特征。
这不仅使得连衣裙的呈现更加准确,同时也更真实地反映了穿着者的形象。
| 实际应用案例
以SIMKHAI品牌为例,其连衣裙款式在虚拟试穿工具中的展示效果十分逼真,用户可以清楚地看到每一道褶皱以及每一块印花图案。
这种高度还原的视觉体验使得消费者能够在购买前获得更加真实的商品感知,进而提高购买决策的质量。
谷歌表示,虚拟试穿功能不仅提升了消费者的购物体验,同时也为零售商带来了实际的利益。
数据显示,使用虚拟试穿功能的产品页面获得了更多高质量的浏览量,平均每位顾客会使用四个不同的模特来试穿同一件产品。
此外,经过虚拟试穿后,顾客访问品牌官方网站的可能性也有所增加。
随着秋季的到来,虚拟试穿功能的推出恰逢其时,它不仅丰富了消费者的在线购物体验,也为服装行业注入了新的活力。
关注我们:即可加入【AI交流群】,
免费领取【AI大礼包】
晓得智能
每日聚焦最新AI,让每个人都能享受到AI带来的乐趣!
最新文章
百度世界2024:发布文心iRAG和无代码工具秒哒
豆包发布国内首款通用图像编辑模型SeedEdit
AMD推出10亿参数开源模型OLMo,性能超越同类产品
字节公布X-Portrait 2,模仿出惟妙惟肖的人物表情
腾讯开源混元MoE和3D大模型,业界首个同时支持文字、图像生成的3D开源大模型
天工AI更新高级搜索功能,可搜索股票、科研信息
Suno推出AI音乐克隆,可复用任意音乐风格
知乎推出专业搜索功能,确保所提供的信息既专业又可靠
AI绘画能力超越FLUX,世界首个能生成长文本图像的模型
小米发布澎湃OS 2,小爱同学升级为超级小爱,体验更加智能
爱诗科技发布PixVerse V3,视频生成技术显著提升,中英文提示词均可理解
智谱推出AutoGLM,AI学会自动操作手机完成日常任务
Claude 3.5大更新,AI学会操作计算机,还能分析数据库
讯飞星火4.0 Turbo发布,多项能力实现领先
Stable Diffusion 3.5发布,消费级硬件开箱即可用
智源开源Emu3多模态大模型,视频理解和生成效果表现优异
百度联合多所高校发布Hallo2,可实现长时间高分辨率音频驱动肖像动画
ChatGPT Windows 桌面程序发布,目前仅特定用户可用
ColorOS 15 发布,以用户为中心的系统级AI升级
联想携手全球AI巨头,推进混合式AI发展
Adobe MAX 2024发布会,Creative Cloud 推出100多项新功能
苹果推出MM1.5大模型,提升AI图像视觉理解能力
Kimi探索版上线,能自主搜索并解决复杂问题
马斯克发布Robotaxi无人驾驶汽车,取消方向盘和踏板
字节扣子全面升级,可一键复制各类型AI模板
AI领域科学家,包揽了诺贝尔物理、化学奖
黑森林实验室发布FLUX 1.1 Pro,目前最先进、最高效的绘画模型
Notion AI发布“一站式”AI助手,可对多平台文件进行分析
猫眼发布“神笔马良”AI,让剧本一键成片
美图MOKI全面开放,三步生成AI创意短片
Llama 3.2发布最强端侧开源模型,手机即可运行
年轻人的第一个对象,东京政府提供AI配对平台
豆包发布AI视频生成模型,提供精准语义理解和高保真画质
基于阿里通义大模型,JetBrains AI编程助手国内发布
可灵1.5版本更新:引入运动笔刷功能,让视频精准运动
无使用次数限制,阿里上线通义万相AI视频平台
豆包推出一套AI音乐生成系统,可多方面控制音乐
元象开源中国最大MoE模型A36B,可无条件免费商用
OpenAI o1发布,理科推理能力超越人类专家博士
国内首家五官科医院,推出AI生成式病历
国家网络安全会发布《人工智能安全治理框架》
苹果发布iPhone 16系列AI手机,Apple Intelligence带来全新交互体验
谷歌AI虚拟试穿,数千件连衣裙任意穿
支付宝推出多个AI助手,理财、生活、健康统统帮你搞定
文心一言APP改名了,升级后覆盖五大生活场景
ComfyUI新版本发布,多项更新优化工作流程
快手发布电商AI换衣神器,想怎么换就怎么换
高性能低功耗,最强SOTA小模型Zamba登场
支持VR实时渲染,实景三维大模型书生3.0开源
Midjourney开放网页端,并宣布进军硬件领域
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉