【CAA期刊】《模式识别与人工智能》第37卷第9期

科技 2024-12-18 19:04 北京

CAA

智慧起航，共创未来

论文与报告

基于目标域增强表示的医学图像无监督跨域分割方法

刘凯¹, 卢汝诺¹, 郑潇柔¹, 董守斌¹

1.华南理工大学计算机科学与工程学院广东省多模态大数据智能分析重点实验室广州 510641

摘要: 不同成像模式设备采集的医学图像存在不同程度的分布差异,无监督域自适应方法为了将源域训练的模型泛化到无标注的目标域,通常是将差异分布最小化,使用源域和目标域的共有特征进行结果预测,但会忽略目标域的私有特征.为了解决该问题,文中提出基于目标域增强表示的医学图像无监督跨域分割方法(Enhanced Target Domain Representation Based Unsupervised Cross-Domain Medical Image Segmentation, TreUCMIS).首先,通过共有特征学习获取源域和目标域的共有特征,通过图像重构训练目标域特征编码器,提取目标域完整特征.然后,通过目标域的无监督自学习方式,加强深层特征和浅层特征的共有性.最后,对齐使用共有特征和完整特征得到的预测结果,利用目标域的完整特征分割目标,提高模型在目标域的泛化性.在两个具有CT和MRI双向域自适应任务的医学图像分割数据集(腹部、心脏)上的实验表明TreUCMIS的有效性与优越性.

关键词：无监督域自适应(UDA), 医学图像, 语义分割, 对抗学习, 一致性正则化

引用本文:

刘凯, 卢汝诺, 郑潇柔, 董守斌. 基于目标域增强表示的医学图像无监督跨域分割方法[J]. 模式识别与人工智能, 2024, 37(9): 755-769.

LIU Kai, LU Runuo, ZHENG Xiaorou, DONG Shoubin. Enhanced Target Domain Representation BasedUnsupervised Cross-Domain Medical Image Segmentation. Pattern Recognition and Artificial Intelligence, 2024, 37(9): 755-769.

链接本文:

http://manu46.magtech.com.cn/Jweb_prai/CN/Y2024/V37/I9/755

边界感知引导多层级特征的知识蒸馏交通场景语义分割算法

谢新林^1,2, 段泽云^1,2, 罗臣彦^1,2, 谢刚^1,2

1.太原科技大学电子信息工程学院太原 030024;
2.太原科技大学先进控制与装备智能化山西省重点实验室太原 030024

摘要: 针对交通场景目标细节信息丢失与模型参数量过大等问题,提出边界感知引导多层级特征的知识蒸馏交通场景语义分割算法,以较少的参数量平滑目标分割边界.首先,构建自适应融合多层级特征模块,融合深层语义信息和浅层空间信息的多层级特征,选择性地突出目标边界信息和目标主体信息.然后,提出交互注意力融合模块,建模空间维度和通道维度的长距离依赖关系,增强不同维度间的信息交互能力.最后,提出基于候选边界的边界损失函数,构建基于细节感知的边界知识蒸馏网络,迁移复杂教师网络中的边界信息.在交通场景数据集Cityscapes和CamVid上的实验表明,文中算法能在实现轻量化的同时保持良好的分割性能,并在处理小目标和细长条目标时具有一定优势.

关键词：语义分割, 深度学习, 知识蒸馏, 交通场景, 注意力机制

引用本文:

谢新林, 段泽云, 罗臣彦, 谢刚. 边界感知引导多层级特征的知识蒸馏交通场景语义分割算法[J]. 模式识别与人工智能, 2024, 37(9): 770-785.

XIE Xinlin, DUAN Zeyun, LUO Chenyan, XIE Gang. Traffic Scene Semantic Segmentation Algorithm with Knowledge Distillation of Multi-level Features Guided by Boundary Perception. Pattern Recognition and Artificial Intelligence, 2024, 37(9): 770-785.

链接本文:

http://manu46.magtech.com.cn/Jweb_prai/CN/Y2024/V37/I9/770

结合深度伪造特征对比的人脸伪造检测

李兆威¹, 高欣健¹, 笪子凯¹, 高隽¹

1.合肥工业大学计算机与信息学院合肥 230009

摘要: 随着AIGC(Artificial Intelligence-Generated Content)技术的不断发展,其伪造技术的多样性对现有检测方法发起巨大的挑战.现有大部分的检测方法是基于各种先进的卷积神经网络提取的人脸伪造特征进行检测,泛化能力不足以解决未知方法伪造的图像鉴伪.因此文中提出结合深度伪造特征对比的人脸伪造检测方法,对未知的伪造技术具有较好的适应能力.方法分为两个阶段:一方面挖掘不同伪造手段的相似特征,提出基于元学习的相似特征融合网络,利用元学习的学习能力获取不同伪造手法之间的相似性特征;另一方面结合具体任务下的独特伪造特征,提出具体任务下的独特性微调方法,提高模型对未知伪造方法的适应能力.在跨伪造手法和跨库测试上实验表明文中方法性能有所提升,在面对未知手段攻击时具有较优的检测能力.

关键词：人脸伪造检测, 深度伪造, 元学习, 相似特征融合, 伪造特征挖掘

引用本文:

李兆威, 高欣健, 笪子凯, 高隽. 结合深度伪造特征对比的人脸伪造检测[J]. 模式识别与人工智能, 2024, 37(9): 786-797.

LI Zhaowei, GAO Xinjian, DA Zikai, GAO Jun. Face Forgery Detection Combined with Deep Forgery Features Comparison. Pattern Recognition and Artificial Intelligence, 2024, 37(9): 786-797.

链接本文:

http://manu46.magtech.com.cn/Jweb_prai/CN/Y2024/V37/I9/786

研究与应用

基于内部知识扩展的软提示学习点击诱饵检测方法

董丙冰^1,2, 吴信东^1,2

1.合肥工业大学大数据知识工程教育部重点实验室合肥 230009;
2.合肥工业大学计算机与信息学院合肥 230601

摘要: 点击诱饵的主要目的是通过引导用户点击链接以增加页面浏览量和广告收入.点击诱饵的内容往往具有低质量、误导性或虚假性的特征,对用户产生潜在不利影响.现有的基于预训练语言模型的提示学习方法依赖外部开放知识库以检测点击诱饵,不仅性能受制于外部知识库的质量和可用性,而且不可避免地导致查询和响应的延迟.为此,文中提出基于内部知识扩展的软提示学习点击诱饵检测方法,从训练数据集本身提取扩展词,同时采用层次聚类和优化策略,在提示学习中对获得的扩展词进行微调,避免从外部知识库检索知识.此外,采用软提示学习可获得适合特定文本类型的最佳提示,避免手工模板带来的偏差.在少样本场景下,尽管文中方法只基于内部知识进行扩展,但在三个公开的点击诱饵数据集上可以以较少的时间取得较优的检测效果.

关键词：点击诱饵检测, 软提示, 内部知识扩展, 提示学习

引用本文:

董丙冰, 吴信东. 基于内部知识扩展的软提示学习点击诱饵检测方法[J]. 模式识别与人工智能, 2024, 37(9): 798-810.

DONG Bingbing, WU Xindong. Soft Prompt Learning with Internal Knowledge Expansion for Clickbait Detection. Pattern Recognition and Artificial Intelligence, 2024, 37(9): 798-810.

链接本文:

http://manu46.magtech.com.cn/Jweb_prai/CN/Y2024/V37/I9/798

基于多类型语音信息分层融合的帕金森病检测模型

吴迪¹, 季薇¹, 郑慧芬², 李云³

1.南京邮电大学通信与信息工程学院南京 210003;
2.南京医科大学附属老年医院南京 210009;
3.南京邮电大学计算机学院南京 210023

摘要: 用于帕金森病检测的语音数据通常包括持续元音、重复音节及情景对话等类型.已有模型大多采用单一类型的语音数据作为输入,容易受到噪声干扰,鲁棒性无法保证.有效整合不同类型语音数据,提取至关重要的病理信息,是当前帕金森病检测任务面临的挑战之一.文中提出基于多类型信息分层融合的帕金森病检测模型,旨在提取全面的病理信息,实现较优的检测性能.首先,针对不同类型的帕金森病语音数据,分别进行多种声学特征的提取.然后,设计挖掘多类型声学特征深层信息的表示学习方案,提取调音和韵律信息,精准反映声学特征中潜在的病理信息.进而针对两类信息,设计解耦的表示学习空间,分别提取各自的私有特征,同时学习它们的共有表示.最后,设计跨类型的注意力分层融合模块,利用交叉注意力机制,以不同粒度交互的方式逐步融合共有表示和私有表示,提升帕金森病检测性能.在公开的意大利语帕金森病语音数据集和自采的汉语帕金森病语音数据集上的实验表明,文中方法性能提升明显.

关键词：帕金森病, 多类型语音, 对比学习, 分层融合

引用本文:

吴迪, 季薇, 郑慧芬, 李云. 基于多类型语音信息分层融合的帕金森病检测模型[J]. 模式识别与人工智能, 2024, 37(9): 811-823.

WU Di, JI Wei, ZHENG Huifen, LI Yun. Parkinson's Disease Detection Model Based on Hierarchical Fusion of Multi-type Speech Information. Pattern Recognition and Artificial Intelligence, 2024, 37(9): 811-823.

链接本文:

http://manu46.magtech.com.cn/Jweb_prai/CN/Y2024/V37/I9/811

面向多域数据场景的安全高效联邦学习

金春花¹, 李路路¹, 王佳浩¹, 季玲¹, 刘欣颖¹, 陈礼青^1,2, 张浩¹, 翁健³

1.淮阴工学院计算机与软件工程学院淮安 223003;
2.福建师范大学福建省网络安全与密码技术重点实验室福州 350007;
3.暨南大学信息科学技术学院广州 510632

摘要: 针对联邦学习在不同领域数据训练中面临的泛化能力差、灾难性遗忘和隐私攻击等挑战,文中提出面向多域数据场景的安全高效联邦学习方案.在本地训练阶段,结合知识蒸馏技术,防止模型在不同领域数据训练时发生灾难性遗忘,同时加速知识在各领域间的迁移,提高训练效率.在上传阶段,提出高斯差分隐私机制,分别对本地更新的梯度和各领域间的泛化差异添加高斯噪声,实现安全上传,增强训练过程的保密性.在聚合阶段,采用动态泛化权重聚合算法,减少各领域间的泛化差异,提升模型的泛化能力.理论分析证明该方案具有较强的鲁棒性.在PACS、Office-Home数据集上的实验表明此方案具有较高的准确度和较短的训练时间.

关键词：联邦学习, 域泛化, 推理攻击, 知识蒸馏, 差分隐私

引用本文:

金春花, 李路路, 王佳浩, 季玲, 刘欣颖, 陈礼青, 张浩, 翁健. 面向多域数据场景的安全高效联邦学习[J]. 模式识别与人工智能, 2024, 37(9): 824-838.

JIN Chunhua, LI Lulu, WANG Jiahao, JI Ling, LIU Xinying, CHEN Liqing, ZHANG Hao, WENG Jian. Secure and Efficient Federated Learning for Multi-domain Data Scenarios. Pattern Recognition and Artificial Intelligence, 2024, 37(9): 824-838.

链接本文:

http://manu46.magtech.com.cn/Jweb_prai/CN/Y2024/V37/I9/824

连续环境中基于语义拓扑图的视觉语言导航推理

谢子龙¹, 许明¹

1.辽宁工程技术大学软件学院葫芦岛 125105

摘要: 针对现有视觉语言导航方法在连续环境中推理能力不足的问题,提出基于语义拓扑图的视觉语言导航推理模型.首先,通过场景理解辅助任务识别导航环境中的区域和物体,构建空间邻近知识库.然后,智能体在导航过程中与环境实时交互,收集位置信息,编码视觉特征,并预测区域和物体的语义标签,逐步生成语义拓扑图.在此基础上,提出辅助推理定位策略,利用自注意力机制,从导航指令中提取物体信息和区域信息,并结合空间邻近知识库和语义拓扑图,对物体和区域进行推理定位,以辅助导航决策,确保智能体的导航轨迹与指令对齐.最后,在公开数据集R2R-CE和RxR-CE上的实验表明,文中模型的导航成功率较高.

关键词：视觉语言导航, 视觉推理, 多模态数据, 具身智能

引用本文:

谢子龙, 许明. 连续环境中基于语义拓扑图的视觉语言导航推理[J]. 模式识别与人工智能, 2024, 37(9): 839-849.

XIE Zilong, XU Ming. Semantic Topological Maps-Based Reasoning for Vision-and-Language Navigation in Continuous Environments. Pattern Recognition and Artificial Intelligence, 2024, 37(9): 839-849.

链接本文:

http://manu46.magtech.com.cn/Jweb_prai/CN/Y2024/V37/I9/839

END

内容来源|模式识别与人工智能

编辑|陈慧琳

责任编辑|叩颖

审核|王坛

往期文章

【明年尔滨见】新质发展，智控未来！2024中国自动化大会圆满落幕！

【活动计划】中国自动化学会2024年度会议计划一览

【CAA赛事】以赛促教，携手未来，智能技术与教育共舞

【重要通知】中国自动化学会关于标准化人才库信息征集工作的通知

【重要通知】关于开展第十届中国自动化学会青年人才托举工程项目申报工作的通知

联系我们

地址：北京市海淀区中关村东路95号

邮编：100190

电话：010-82544542（综合）

010-62522472（会员）

010-62522248（宣传出版及大赛）

010-62624980（财务）

010-82544541（学术活动）

传真：010-62522248

邮箱：caa@ia.ac.cn

中国自动化学会新媒体矩阵

微信公众号

学生分会

CAA OFFICIAL

会员服务

综合媒体

官网

微博

今日头条

视频平台

B站

微信视频号

抖音

学术平台

中国自动化学会会议

中国自动化大会

知乎

点

阅读原文了解更多

喜欢的话点击在看哟~

中国自动化学会

发布自动化、信息及智能科学领域内知识性、普及性、历史性、前沿性的文章、照片、视频等，弘扬学科文化、梳理发展脉络、传播科学知识，宣传科研成果，服务人才培养，积极推进学科普及工作，让更多的人了解自动化、信息及智能科学的过去、现在和未来。

【学生分会】CAA中南大学学生分会成功举办CAA青帆计划第17期活动

【党建强会】推动党的创新理论更加深入人心

【CAA云讲座预告】上海大学教授辛立明 | 机器人的自我进化：形态智能与行为智能

【观点】中国自动化学会理事长郑南宁院士：扎实推进人才强校战略为中国特色、世界一流大学提供人才支撑

【CAA期刊】《模式识别与人工智能》第37卷第9期

【党建强会】为全面深化改革贡献组织力量

【学术报告】东北大学副教授石重霄：多智能体网络下的分布式优化算法研究

【CAA新闻】《2024控制科学与工程学科发展报告》中期汇报会顺利召开

【学生分会】CAA中南大学学生分会成功举办CAA青帆计划第十五期活动

【党建强会】读懂“进一步全面深化改革、推进中国式现代化”

【CAA青帆计划预告】第16期：CAA中南大学学生分会领航计划——留学二三事

【CAA期刊】《机器人》2024年第46卷第6期

【党建强会】增强思想改造的自觉性和彻底性

【CAA青帆计划预告】第15期：“科创赋能·智汇未来”——数模竞赛经验分享

【CAA线上圆桌派预告】第8期：火箭科普大家聊

【CAA青帆计划预告】第15期：“科创赋能·智汇未来”——数模竞赛经验分享

【CAA微周刊】中国自动化学会的一周（12月6日-12月12日）

【党建强会】充分发挥党的政治建设的统领作用

【重要通知】关于开展2024年度CAA科技成就奖（创新团队）推荐工作的通知

【学生分会】CAA中南大学学生分会成功举办“CAA进校园——小学站”第二期科普宣讲活动

【党建强会】增强见事于细见事于早的洞察力

【重要通知】2024中国自动化学会科学技术奖评审结果公示

【CAA期刊】IEEE/CAA JAS第11卷第9期

【党建强会】掌握区分轻重缓急的方法论

【喜报】2025 IEEE Fellow 和 2024 IAPR Fellow 名单公布，学会多位专家当选！

【学生分会】中国自动化学会华南理工大学学生分会成立大会成功召开

【党建强会】在守正创新中进一步全面深化改革

【免费参会】2024世界智能制造大会-人形机器人技术与发展专题活动（12月21日·南京）

【CAA期刊】《机器人》2024年特约综述合集

【党建强会】知识产权赋能新质生产力发展的三重维度

【学术报告】中国自动化学会理事、清华大学教授邓志东 | 自动驾驶3.0与人形机器人：关于端到端纯视觉智能体发展的若干思考

【CAA微周刊】中国自动化学会的一周（11月29日-12月5日）

【党建强会】深入理解把握新质生产力的基本内涵

【学术报告】龙芯中科技术股份有限公司董事长、中国科学院计算所研究员胡伟武：破解卡脖子问题，构建新发展格局

【CAA期刊】《电气传动》2024年第11期

【党建强会】守正创新：我们党不断从胜利走向新的胜利的重要思想方法

【学术报告】国家橡胶与轮胎工程技术研究中心副主任官炳政：轮胎行业智能制造与精益管控

【喜报】热烈祝贺中国自动化学会两位专家荣获2024年度何梁何利基金奖！

【党建强会】加快发展新质生产力推动高质量发展走在前列

【CAA云讲座预告】北京航空航天大学副教授郭克信：无人飞行器仿生安全与操纵

【CAA期刊】《中国自动化学会通讯》2024年第11期发布！

【学生分会】CAA重庆大学学生分会“知行相随，硕博同行”博硕论坛顺利举办

【党建强会】推进改革要“把自己摆进去”

【学术报告】职业科学实验室（CSL）主任祝恒书：大模型时代的职业与技能

【学生分会】“CAA青帆计划”第十四期——CAA中南大学学生分会“领航计划-保研经验分享会”顺利举办

【CAA期刊】《自动化学报》2024年50卷11期目录

【党建强会】为推进马克思主义中国化时代化作出更大贡献

【CAA云讲座预告】浙江大学教授邹俊：基于流体动力的柔性驱动与传动的一些探索与思考

【CAA青帆计划预告】第14期：CAA中南大学学生分会领航计划——保研经验分享

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

【CAA期刊】《模式识别与人工智能》第37卷 第9期

【CAA期刊】《模式识别与人工智能》第37卷第9期