【通知】Visual Intelligence 第2卷第3期在线出版

学术 2024-10-08 17:35 北京

Visual Intelligence

第2卷第3期在线出版

Visual Intelligence是由中国图象图形学学会主办、Springer出版社出版的国际学术期刊，以开放获取（OA）的形式出版，不收取作者任何稿件处理费用。

期刊于2023年创刊，主编是王耀南院士。期刊致力于推动“视觉”与“智能”的有机结合与协同发展，主要发表视觉智能领域具有国际先进水平的新理论、新思想、新技术等的研究成果和技术进展，为促进视觉智能技术的高质量发展和学术交流服务。期刊入选2022中国科技期刊卓越行动计划高起点新刊，是《图像图形领域高质量科技期刊分级目录》T1级期刊，现已被DBLP、EBSCO、Google Scholar、CNKI、Wanfang等国内外重要数据库收录。欢迎投稿！

内容概览

本期共发表8篇论文，包括1篇综述论文（Review），7篇研究性论文（Research Article)。

Review

大规模高质量数据合成方法

Review on Synergizing the Metaverse and AI-driven Synthetic Data: Enhancing Virtual Realms and Activity Recognition in Computer Vision

作者：新加坡英伟达人工智能技术中心Megani Rajendran等

引用本文：Rajendran, M., Tan, C. T., Atmosukarto, I., Ng, A. B., & See, S. (2024). Review on synergizing the metaverse and AI-driven synthetic data: enhancing virtual realms and activity recognition in computer vision. Visual Intelligence 2, Article no. 27.

https://link.springer.com/article/10.1007/s44267-024-00059-6

本文简介：本文系统地调研了用于行为检测和目标识别的真实数据集和合成数据集。通过利用元宇宙相关技术，本文提出了SynDa数据合成流程框架，该框架使用真实感渲染和AI姿态估计技术，通过融合现实生活中的视频数据集，生成大规模的合成数据集来解决数据稀缺性问题，同时降低数据获取成本。

Research Article

对话视频生成方法

DialogueNeRF: Towards Realistic Avatar Face-to-Face Conversation Video Generation

作者：上海交通大学晏轶超、杨小康等

引用本文：Yan, Y., Zhou, Z., Wang, Z., Gao, J., & Yang, X. (2024). DialogueNeRF: towards realistic avatar face-to-face conversation video generation. Visual Intelligence 2, Article no. 24.

https://link.springer.com/article/10.1007/s44267-024-00057-8

本文简介：本文提出生成逼真的面对面对话视频的方法。对话生成比单人生成更具挑战性，因为它不仅需要生成逼真的个人演讲者，而且还要求听讲者对演讲做出反应。本文提出了一种基于神经辐射场（NeRF）的新型统一框架来完成此任务。

人脸编辑方法

Face Shape Transfer via Semantic Warping

作者：哈尔滨工业大学张盛平等

引用本文：Li, Z., Lv, X., Yu, W., Liu, Q., Lin, J., & Zhang, S. (2024). Face shape transfer via semantic warping. Visual Intelligence 2, Article no. 26.

https://link.springer.com/article/10.1007/s44267-024-00058-7

本文简介：本文提出了一种新颖的人脸编辑方法，通过自适应地构建编码网络，实现了对面部不同组件（如眼睛、鼻子、嘴巴）的特征嵌入学习，达到了组件级别的可控性。其次，为了充分利用不同尺度的语义解析特征，借助全局密集网络（DenseNet）中的层间连接方法，最大限度地促进信息流动。为了避免变形伪影，引入空间变换网络（STN），有效处理各种类型的语义变形。

人脸识别方法

A Fast Mask Synthesis Method for Face Recognition

作者：中国科学院自动化所王金桥等

引用本文：Guo, K., Zhao, C., & Wang, J. (2024). A fast mask synthesis method for face recognition. Visual Intelligence 2, Article no. 25.

https://link.springer.com/article/10.1007/s44267-024-00060-z

本文简介：本文将人脸关键点和人脸掩码整合在数据增强块中，提出了一种新的掩码人脸识别架构，能够自定义人脸的遮挡区域，运用在各种有遮挡场景的人脸识别领域中；在损失函数中加入了质量判断提升模型训练的鲁棒性，进一步减小数据集质量，尤其是掩码生成之后的噪声带来的影响，使得模型能够更快收敛。

微表情识别方法

Counterfactual Discriminative Micro-Expression Recognition

作者：香港城市大学李勇等

引用本文：Li, Y., Liu, M., Lao, L., Wang, Y., & Cui, Z. (2024). Visual Intelligence 2, Article no. 29.

https://link.springer.com/article/10.1007/s44267-024-00063-w

本文简介：本文提出了一种反事实判别的微表情识别方法，旨在有效捕捉微妙的时序变化以实现稳健的微表情识别。为了明确捕捉隐藏在微表情序列中的时序动态因果关系，我们提出了微表情反事实推理机制，通过比较事实与原始微表情序列和反事实与反事实修正的微表情序列的影响，然后进行因果意识预测，以鼓励模型学习那些潜在的微表情时序线索，最终提升微表情识别的性能。

无监督领域泛化

Learning a Generalizable Re-identification Model from Unlabelled Data with Domain-agnostic Expert

作者：武汉大学叶茫、杜博等

引用本文：Liu, F., Ye, M., & Du, B. (2024). Learning a generalizable re-identification model from unlabelled data with domain-agnostic expert. Visual Intelligence 2, Article no. 28.

https://link.springer.com/article/10.1007/s44267-024-00062-x

本文简介：本文探索了行人重识别领域的无监督领域泛化问题。针对行人重识别中各源域标签空间不一致的问题，引入混合专家模型。然后，设计参数平均和分布正则策略学习领域无关专家挖掘专家间的泛化信息，同时缓解模型在测试阶段依赖于多个专家的问题。

CAGNet: A Context-aware Graph Neural Network for Detecting Social Relationships in Videos

作者: 南京大学武港山等

引用本文: Yu, F., Fang, Y., Zhao, Z., Bei, J., Ren, T., & Wu, G. (2024). CAGNet: a context-aware graph neural network for detecting social relationships in videos. Visual Intelligence 2, Article no. 22.

https://link.springer.com/article/10.1007/s44267-024-00056-9

本文简介：本文将视频上的社交关系检测与场景图生成类比，将问题归约为视频上的社交关系图生成。本文提出了一个利用上下文的图神经网络，通过信息传递获取上下文，可以更有效地生成社交关系图。本文还构建了一个更具挑战性的视频上社交关系检测的数据集，包含了72小时的视频片段，5313个关系实例。

Efficient Forest Fire Detection Based on An Improved YOLO Model

作者: 南京林业大学徐昇等

引用本文: Cao, L., Shen, Z., & Xu, S. Efficient forest fire detection based on an improved YOLO model. Visual Intelligence 2, Article no. 20. https://link.springer.com/article/10.1007/s44267-024-00053-y

本文简介：本文提出了一种基于改进YOLOv5的新型检测技术模型，以增强森林火灾检测的视觉表现并保留更多的全局信息。首先，通过增加即插即用的全局注意力机制，提高了YOLOv5模型在骨干网络和颈部的特征提取效率。接着，我们引入了一个重新参数化的卷积模块，并使用解耦检测头来加速模型的收敛速度。最后，引入加权双向特征金字塔网络（BiFPN），融合本地信息处理的特征信息，从而实现更高效的特征融合。

▼

往期回顾

▼

Visual Intelligence 第1卷第1期正式出版

Visual Intelligence 第1卷第2期在线出版

Visual Intelligence 第1卷第3期在线出版

Visual Intelligence 第1卷第4期在线出版

Visual Intelligence 第2卷第1期在线出版

Visual Intelligence 第2卷第2期在线出版

期刊简介 | Visual Intelligence

欢迎扫描二维码加入中国图象图形学学会

（http://membership.csig.org.cn）

图像图形领域高质量科技期刊分级目录

中国图象图形学学会科普活动、素材征集通知

中国图象图形学学会高校志愿者招募

中国图象图形学学会关于组织开展科技成果评价的通知

2024年CSIG图像图形中国行承办方征集中

http://mp.weixin.qq.com/s?__biz=MzUxMDE4MzAzOA==&mid=2247800311&idx=4&sn=bd7fa8dbf86a4d65bb6b8d8f4ac89273

中国图象图形学学会CSIG

发布图象图形技术的理论研究、应用推广、科学普及、专业培训、技术咨询、学术交流、出版专业书刊等信息，促进该学科技术的发展和在国民经济各个领域的推广应用。

最新文章

【CCIG 2025】2025中国图象图形大会诚招合作单位

【动态】中国图象图形学学会组织编写的《元宇宙产业技术路线图》正式出版

【早鸟票最后一天】第五届CSIG中国媒体取证与安全大会日程安排出炉！

【学习时间】习近平：推进中国式现代化，科学技术要打头阵

【预告】CSIG智能制造新质生产力研讨会将于10月30日在长沙召开

【速览】TPAMI 2024 | 基于可复用网络架构生长的连续立体匹配框架

【科研播报】CSIG理事、北京大学林宙辰教授团队全新混合序列建模架构MixCon：性能远超Mamba

【预告】PRCV2024专题论坛 | 视觉基础模型及其前沿应用

【直播预告】CSIG科普大讲堂—AI for Nobel Prize将于10月20日举办

【CSIG团体会员】四川爱科会易科技有限公司加入CSIG！

【CSIG团体会员】兴图新科受邀亮相北京安博会|10月22日邀您共赏

【直播预告】第三期CSIG理事荟活动将于10月17日晚8点开始

【通知】关于推荐中国科协科技人才举荐和表彰奖励评价专家的通知

【CSIG青年科学家会议2024】大会开放注册

【直播预告】CSIG菁英青云在线论坛第41期将于10月22日举办

【CSIG全国科普日】CSIG-VIS@S35: 高原走进西安高新一中南校区

【通知】中国图象图形学学会2024年度奖励和激励计划初评通过项目公示

【CSIG青年科学家会议2024】大会全部讲者名单发布

【ChinaVR 2024】大会顶刊顶会论文征集

【CSIG全国科普日】“人与AI合作”学术科普讲座在复旦大学成功举办

【动态】中国图象图形学学会主办的20场会议入选中国科协《重要学术会议目录（2024）》

【科研播报】CaPaint：基于扩散模型的时空数据因果解码与修补

【招生简章】中国科学院自动化研究所2025年招收攻读硕士学位研究生招生简章

【速览】TPAMI 2024 | 基于时空量子扩散模型的实时X射线血管造影冠状动脉狭窄检测

【科研播报】NeurIPS 2024录用论文速递Part.3

【直播预告】CSIG云讲堂：10月15日19点，张振宇主讲：表里先验引导的三维数字人重建与生成

【CSIG全国科普日】网络安全科技馆全国科普日活动成功举办

【学习时间】习近平：大力弘扬伟大爱国主义精神，把强国建设、民族复兴伟业不断推向前进

【科研播报】2024诺贝尔物理学奖、化学奖揭晓，AI包揽两大奖项

【科研播报】CSIG副理事长兼秘书长马惠敏教授团队论文被国际顶级会议录用

【直播预告】第三期CSIG理事荟活动将于10月17日晚8点开始

【动态】中国图象图形学学会海智专家服务团赴湖南开展调研活动

【动态】第28期企业行—走进陕西山河明泽生态环境技术咨询有限公司成功举办

【CSIG全国科普日】“启少年志筑科技梦”全国科普日青少年主题科普系列活动成功举办

【通知】第五届CSIG中国媒体取证与安全大会将于10月25日-27日举行

【预告】CSIG10月活动速递第一弹，快来一睹为快~

【秋招进行时】CSIG团体会员：广东履安实业校园招聘火热进行中

【CSIG全国科普日】《点亮少年好奇心，培养强国栋梁》活动在天津工业大学成功举行

【CSIG全国科普日】耿国华教授向西北大学计算机类新生讲授“数字化技术赋能文化遗产保护”专题科普报告

【CSIG全国科普日】“探索《黑神话·悟空》：AI 赋能下的科技艺术融合”活动成功举办

【CSIG全国科普日】手机光影赋新篇塘河古韵映江南—手机摄影美育暨江南塘河古建筑水文化数字化影像保护公益巡讲成功举行

【CSIG月报】2024年9月热点回顾

【科研播报】EMNLP 2024录用论文速递Part.1

【秋招进行时】CSIG团体会员：爱芯元智2025届校园招聘启动 | 共绘AI新纪元

【通知】Visual Intelligence 第2卷第3期在线出版

【科普动态】CSIG-VIS@S31-S34: 袁晓如走进雄安四所中学

【科研播报】高新波：新一代人工智能助推新质生产力的形成和发展

【秋招进行时】CSIG理事单位：商汤科技2025届校园招聘正式启动！

【秋招进行时】CSIG理事单位：商汤2025届校招AI先锋顶尖人才计划启动

【科研播报】NeurIPS 2024录用论文速递Part.2

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉