北航于天舒,夏长群,李甲 | 面向不平衡运动：基于部件解耦的视频人像分割方法

文摘科技 2024-08-14 12:02 北京

研究团队

于天舒：北京航空航天大学计算机学院虚拟现实技术与系统全国重点实验室

夏长群：鹏城实验室

李甲：北京航空航天大学计算机学院虚拟现实技术与系统全国重点实验室、鹏城实验室

文章下载

Tianshu YU, Changqun XIA & Jia LI. Towards imbalanced motion: part-decoupling network for video portrait segmentation. Sci China Inf Sci, 2024, doi: 10.1007/s11432-023-4030-y

研究意义

视频人像分割（Video Portrait Segmentation, VPS）旨在从连续的视频帧序列中发现并分割出所有的显著前景人像。该技术在视频创作领域展现出了广泛的应用潜力，如背景替换、人像效果变换等场景。

然而，当前主流的包含人像的视频分割数据集，如DAVIS、PVSD2.5K、PP-HumanSeg14K在场景复杂性上尚显不足。例如，DAVIS 聚焦于户外人像视频；PVSD2.5K规模较小，仅包含 2530个标注帧，且每个视频片段仅包含单个人像；而PP-HumanSeg14K则局限于远程会议场景，背景的场景都很简单。这使得基于这些简单数据集训练出的模型在应对实际应用中复杂多变的场景时，鲁棒性明显不足。为了提升模型的实际应用能力，构建一个包含互联网常见的各种复杂场景的大规模视频人像分割数据集显得尤为重要。

值得注意的是，与车辆、飞机等整体运动状态一致的常见物体不同，人像的运动因其关节结构而呈现出复杂的不平衡性。如图所示，红框中手臂的运动独立于人像主体的整体运动，尽管现有的方法在常规视频上取得了先进的性能，但这些方法往往将显著目标作为一个整体去进行运动解析，忽略了与整体运动状态不同的部件细节运动，这就导致了这些方法在运动范围较大的手臂附近预测不准确。

由于这种部件关联的运动不平衡性，对不同部件的运动使用相同的注意力进行提取可能会导致人像的定位和分割不准确。因此，直观的想法是构建基于无监督部件解耦的视频人像分割方法，通过分别对具有不同运动状态的人像部件进行处理，以期提升人像定位和分割的准确性。

本文工作

为了解决数据集场景简单的问题，本工作首先构建了大规模多场景视频人像分割数据集MVPS。该数据集由包括常出现在互联网上的娱乐、室内手工、访谈、讲座、新闻、户外活动和网上购物的7大类不同场景的101个视频片段组成。视频中的人像具有不同的姿态和手势，同时背景场景也呈现出复杂多样的特点。这些复杂情形接近于互联网中的实际应用场景。我们从这些视频片段中共采样了53923帧，标注了10843帧。据我们所知，它是目前视频人像分割任务最复杂的数据集。

通过已有数据集的人像视频特性，并进一步结合数据集构建过程中对大量人像视频的观察，我们发现与其他大部分常见物体的运动不同，人像的运动具有部件关联的不平衡性。

为了实现对这种部件关联的人像不平衡运动的精确解析，本工作提出了基于部件解耦的视频人像分割网络（Part-Decoupling Network, PDNet），该网络对不同人像部件的运动关联分别进行提取。在孪生编码器中，我们使用ResNet-50作为主干来提取目标帧和参考帧的空间特征，然后利用FPN结构的优势从深到浅融合空间语义特征和细节特征。整个编码器在两帧之间共享权重，从而获得具有帧间语义一致性的外观特征。针对人像运动的不平衡性，我们提出了帧间部件判别注意力（Inter-frame Part-Discriminated Attention, IPDA）模块，该模块将不平衡的整体人像运动解耦为独立的部件运动。该模块对目标帧和参考帧的人像进行无监督的部件分割，利用不同帧中同一部件之间的交叉注意力运算来提取部件判别运动特征，最后根据这些部件的预测掩膜对部件判别运动特征进行组合，生成全局运动特征。最后通过时空特征融合模块综合外观和运动特征，预测得到最终的人像掩膜。

代码和数据集地址：https://github.com/iCVTEAM/PDNet/

实验结果

通过捕捉人像视频中部件运动的不平衡性这一创新策略，与多种国际先进方法的对比实验表明了我们方法在性能和效率上的优势。我们的方法在包含各种人像运动、姿态、手势，各种复杂背景以及单人/多人场景的视频中可以准确地分割出前景人像，尤其是在与人像主体运动不平衡的区域。

http://mp.weixin.qq.com/s?__biz=MzAxNjgwMjA5Ng==&mid=2651170515&idx=1&sn=f43e1841801acf9dbf7ac14d1cdab3ce

中国科学信息科学

《中国科学：信息科学》及其英文版《Science China Information Sciences》的宣传平台。

最新文章

曹文强,闫敬,关新平等 | 基于流速场预测的水下机器人编队包围算法（有视频）

杨烨峰,李博扬,温志涌等 | 复杂场景中机器人高效轨迹规划与避障方法

张志煌,许萌,李亮等 | BEV-Locator:基于多视角图像的端到端视觉语义定位网络

林相泽,黄景新,程佳妮,李世华 | 有输出约束的二阶切换系统固定时间输出反馈镇定

湖南大学与松山湖材料实验室合作团队 | 基于纯p-GaN结构制备增强型p沟道GaN场效应管

基于注意力的联想忆阻脉冲神经网络及其无监督图像分类应用

姬春婷,张正强,解学军 | 双曲偏微分方程的自适应事件触发输出反馈控制

祝贺！《中国科学: 信息科学》2023年度优秀审稿人

孔小兵,王文文,刘向杰 | 风电场分布式经济模型预测控制

基于显著性引导的元数据生成网络:一种小样本学习的新路径

武汉大学童亦雯, 冯琦, 罗敏, 何德彪 | 具有特权方的隐私保护决策树训练方案

SCIS会议 | 第51次《中国科学：信息科学》前沿学术沙龙

祝贺！12篇文章入选SCIS 2023年度优秀论文奖

征稿启事：量子信息专题（英文版）

征稿启事 | 大模型使能技术与前沿应用（英文版）

东南大学陆卫兵团队 | 适用于人体物联网应用的鲁棒性织物基人工等离子频率扫描天线

北京化工大学王友清团队 | 多障碍下视线追逃博弈的混合纳什均衡求解（MOOP）

李延超,肖甫,余水等 | 用于细粒度视觉识别的元标签关联损失

征稿启事 | 面向5GA/6G网络的分布式卫星系统专题（英文版）

北航郭雷院士团队 | 仿生智能导航：从方法论、系统论到行为论

杨德仁院士团队皮孝东研究组 | 基于4H-SiC的高温光电神经突触器件

重磅！基于深度学习的软件工程：进展、挑战和机遇

哈工大焦健, 张钦宇等 | 基于信息效用的分布式卫星语义感知协作传输

何德峰,罗捷,李永福 | 通信拓扑切换下车辆队列分布式多目标预测控制

重庆邮电大学曾宪华等 | 一种结构范数正则化的可微神经结构搜索算法

打破调度模型的“黑盒”—— 一种面向内容分发网络的可解释缓存策略

RISTA前沿大讲堂 | 面向低空经济的协作通感一体化关键技术-东南大学潘存华教授

郑文栋,刘华平,孙富春等 | 机器人大面积触觉传感的数据驱动电阻层析成像技术

北工大张永哲团队 | 一步法制备的MoS2突触晶体管

基于全局密度更新策略的两阶段多模态多目标进化算法

面向空间网络应用的LTP可靠传输交付时延和跨层包尺寸分析

《中国科学: 信息科学》2024年第8期目录

山东师范大学李海涛团队 | 故障攻击下Grain型级联反馈移位寄存器的非奇异性

燕山大学华长春团队 | 时变时延下非线性网络化遥操作系统的有限时间复合学习控制

南京信息工程大学孙乐, 王月缘, 任勇军等 | 基于路径签名的支持可解释人工智能的网络时间序列分类

虞文武,聂晓凯,崔铁军等 | 智能反射表面辅助的无线通信网络性能优化综述

西安邮电大学陈海峰等 | 具有无限大光暗电流比的β-氧化镓日盲紫外探测器

北航于天舒,夏长群,李甲 | 面向不平衡运动：基于部件解耦的视频人像分割方法

浙江大学李波, 程冠杰, 邓水光等 | 区块链在6G网络下的场景分析与性能评估

2024年第8期目录 | SCIENCE CHINA Information Sciences

哈工大周彬,段广仁等 | 基于非奇异周期滞后滑模的指定时间控制方法

吕欣宇,牛玉刚,James Lam | 线性重复过程的事件触发滑模控制及其金属轧制过程应用

魏猛猛,王磊,尤著宏等 | 生物知识图谱融合多源特征的circRNA与miRNA相互作用预测

张文祥,魏航,刘滨等 | 构建异构图神经网络识别和预测多类型RNA和疾病关联关系

SCIS会议 | 第50次《中国科学：信息科学》前沿学术沙龙

征稿启事 | 6G通感一体化技术专题（英文版）

征稿启事：新型存储材料与器件：铁电与氧化物半导体专题（英文版）

SCIS会议 | 第50次《中国科学：信息科学》前沿学术沙龙

谌煜,关永强,田野 | 符号网络下广义多智能体系统的能控性

上海技术物理研究所王旭东团队 | 二维铁电体α-In2Se3中的体光伏效应

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉