华为8月2日最新消息,这也太牛了吧!

体娱   2024-08-02 07:00   北京  

8月2日消息,华为云技术创新部媒体创新Lab的论文《DisControlFace: Adding Disentangled Control to Diffusion Autoencoder for One-shot Explicit Facial Image Editing》被计算机多媒体领域顶会ACM Multimedia 2024公布投稿录用。华为云团队在人脸图像编辑技术领域实现重大突破,引发业界关注。根据目前透露出来的消息,Mate 70 系列将搭载新麒麟、新系统HarmonyOS NEXT正式版、新影像等等,预计11 月后才能量产发布

自1993年创办以来,ACM Multimedia作为计算机多媒体领域的顶级盛会,引领着行业发展的风向标。今年ACM-MM共吸引来自全球的4385篇投稿,经过严格评审,最终仅有1149篇论文脱颖而出,录用率仅为26.2%,竞争之激烈可见一斑。华为云媒体创新Lab论文能够在此高门槛下获得认可,可以看出是业界对华为科研实力与创新能力的高度肯定。

华为《DisControlFace》论文聚焦于解决人脸图像编辑领域中的一项长期挑战——如何在不依赖额外训练数据的前提下,实现对人脸图像的精细可控式生成,保持原始人脸的语义先验信息。传统方法往往难以在编辑精度和语义保持之间找到完美的平衡点,提出DisControlFace提供全新的解决方案。

华为《DisControlFace》论文引入解耦控制机制,通过预训练的扩散人脸重建模型提供确定性的语义先验信息,构建名为Exp-FaceNet的模型,专门学习基于3DMM参数的细粒度显式人脸控制能力。DisControlFace提出一种基于随机语义掩码策略的训练机制,使得Exp-FaceNet能够以解耦的方式学习显式人脸编辑能力,从而实现对人脸图像姿态、表情和光照的精确编辑,同时有效保留人物的原始ID信息。

实验结果表明,华为DisControlFace在编辑精度和语义先验保持方面优于现有方法,额外支持人脸图像语义属性修改(如年龄、发型等)和人脸图像修补等相关任务,展现其广泛的应用潜力。推动人脸图像编辑领域的发展,也为AIGC(AI生成内容)视频编辑领域带来新的可能性。

华为云媒体创新Lab团队已将DisControlFace技术应用于其开发的AI视频风格化生成服务中,重点解决AIGC视频编辑中的多场景风格迁移、视频动作迁移和视频时序一致性保持等难题。已成功为北京国际电影节AIGC影片竞赛获奖影片制作等重要商业POC提供核心技术支持,提高视频制作的效率和质量。

手机测评
手机测评——专业、有趣的科技新媒体。 每天为您推送科技数码产品资讯和大家交流科技圈的信息。随时了解手机测评的动向,第一时间观看我的测评视频。
 最新文章