2024年第5期论文速览

学术科技 2024-08-16 18:10 北京

《计算机辅助设计与图形学学报》

2024年第36卷第5期

Vol.36 No.5 May 2024

左右滑动查看目录

➥

交互技术

以人为本的可解释智能医疗综述

作者: 宋淑超, 陈益强, 于汉超, 张迎伟, 杨晓东

单位: 中国科学院计算技术研究所移动终端与新型计算北京市重点实验室；中国科学院大学；中国科学院前沿科学与教育局

摘要：随着人工智能(artificial intelligence, AI)的高速发展, “黑盒”模型已逐渐展示出逼近甚至超越人类的能力, 尤其在智能医疗等高风险应用场景中, 其可解释性是用户在应用中信任和理解 AI 的关键基础. 虽然已有工作提供了大量事前和事后的 AI 可解释方法, 但大都采用通用型解决思路, 未考虑不同用户在不同场景下多维度的理解和信任需求. 以人为本的 AI 可解释方法能够针对用户实际需求对 AI 模型进行可解释分析, 近年来逐渐受到国内外学者的关注. 文中聚焦智能医疗应用, 对近 5 年人机交互国际顶级会议的文献进行分析, 回顾现有辅助诊断、辅助用药、未病预警方面以人为本的 AI 可解释方法及系统, 从决策时间花费、用户专业度和诊疗工作流程 3 个维度梳理和定位可解释需求的系统性方法, 得出 4 类典型用户画像和对应案例; 并从考虑资源受限、不同用户的多样需求、与现有流程结合 3 个方面, 为如何设计可解释的医疗辅助诊断系统提出建议.

关键词: 可解释人工智能; 临床决策支持系统; 智能医疗; 人智交互; 用户体验

长按扫码阅读全文或复制网址访问https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2024.2024-00052

➥

可视化与可视分析

面向癫痫的脑电图可视分析方法

作者: 丁国明, 谢潇, 胡玲利, 巫英才,王爽

单位: 浙江大学 CAD&CG 国家重点实验室; 浙江大学教育学院体育学系; 浙江大学医学院附属第二医院

摘要：为了高效地检测和分析癫痫患者脑电图中的癫痫样放电, 提出一种面向癫痫的脑电图可视分析方法. 首先利用浙江大学医学院附属第二医院在癫痫治疗过程中积累的脑电数据, 建立基于时域和时频域视角的卷积神经网络模型, 用于癫痫样放电自动分类, 使用 Focal Loss 作为损失函数评估放电类别分布不均衡的问题; 然后在分类模型基础上, 结合医生的需求设计交互式的多视图可视分析系统, 其由波形分类视图、离群值检测视图和波形检查视图 3个相互协作的模块组成; 最后招募 10 位被试和 2 位专家, 通过评估实验验证系统在癫痫诊断方面的有效性和可用性. 实验结果表明, 建立的分类模型在所用数据集上的平均 F1 分数为 0.88, 优于其他的脑电分类模型, 且具有良好的鲁棒性; 设计的系统具有良好的可用性和有效性, 可以辅助医生进行癫痫诊断.

关键词: 医学可视化; 机器学习; 脑电图; 癫痫

长按扫码阅读全文或复制网址访问https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2024.19839

面向 Fabric 性能态势感知的联盟链可视分析方法

作者: 任芃锟, 邵怡敏, 王保全, 王轶, 赵凡

单位: 中国科学院新疆理化技术研究所多语种信息技术研究室; 中国科学院大学; 新疆民族语音语言信息处理实验室

摘要: 区块链技术的不断普及, 对联盟链网络运行的稳定性和交易过程的可解释性提出了更高的要求. 通过总结在联盟链实际开发和应用过程中网络性能监控与分析的需求, 提出面向 Hyperledger Fabric 性能态势感知的联盟链可视分析方法. 对网络拓扑图、块高增长图和交易共识动画等多视图进行联合分析, 支持从网络、节点、交易 3 个层面进行探索; 提出 Fabric 网络和节点性能量化方法, 以分值形式衡量性能态势, 便于快速了解联盟链运行情况、通道间活跃度差别与各节点健康度. 案例分析和用户评估结果表明, 所提方法在 Fabric 可视监控、性能态势分析、交易共识轨迹追踪等方面具有实用性和有效性.

关键词: 区块链可视化; 可视分析; 联盟链; 态势感知

长按扫码阅读全文或复制网址访问

https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2024.19855

面向调色板设计的感知一致色彩排序方法

作者: 肖志雄, 许文松, 曾琼

单位: 山东大学计算机科学与技术学院; 大连海事大学信息科学技术学院

摘要: 针对可视化设计中调色板选择涉及的大量视觉比较操作, 为了提升色彩设计效率, 提出一种符合感知的调色板色彩排序方法. 首先建立由全局有序性以及视觉连贯性约束因子组成的色彩排序能量优化方程, 并通过粒子群算法对其求解以获得感知一致的色彩排序; 在此基础上, 开发了一个基于感知一致色彩排序的调色板设计系统, 可以支持调色板选取、调色板全局探索、基于样例的调色板检索等功能. 利用定量度量和用户实验对所提方法在感知一致性及调色板比较任务上进行实验, 结果表明, 该方法可以生成符合感知的调色板色彩排序结果, 能有效地促进调色板相似性比较的准确性及效率.

关键词: 数据可视化; 色彩设计; 自动色彩优化

长按扫码阅读全文或复制网址访问

https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2024.19879

➥

CAD/CAE/CAM

两条 B 样条曲线求交的高效计算方法

作者: 王永澳, 吕杭汀, 陈小雕

单位: 杭州电子科技大学计算机学院

摘要: 曲线曲面间求交计算在 CG 和 CAD 中有着广泛的应用. 牛顿法等迭代法计算效率高但需要良好的初始值; 裁剪法具有良好的鲁棒性但计算效率不理想, 尤其是对于相切情况的求交问题. 为此, 提出一种计算 2 条 B 样条曲线交点的混合方法. 首先提出一种高效的线性复杂度裁剪方法, 用于获得良好的初始值; 然后提出一种与导数无关且效率更高的改进的割线法, 用于验证贯穿性相交情况; 最后提出一个相切情况下收敛阶为 2的迭代公式, 其性能远优于现有的牛顿法和裁剪法. 理论上, 混合方法若与根隔离法相结合, 可以应用于更多类型曲线间的求交问题. 数值实验结果表明, 与现有的同类方法相比, 在贯穿情况下, 所提方法的计算效率提高约 10%, 在相切情况下则提高约100%~300%.

关键词: B 样条曲线/曲线求交; 裁剪法; 线性包围法; 相切; 非多项式函数

长按扫码阅读全文或复制网址访问

https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2024.19869

➥

三维图形计算

密度导向的点云动态图卷积网络

作者: 刘玉杰, 孙晓瑞, 邵文斌, 李宗民

单位: 中国石油大学(华东)计算机科学与技术学院; 中国石油大学胜利学院

摘要: 针对现有主流网络对于点云局部特征提取的能力不足, 以及在特征提取过程中未考虑点云密度的问题, 提出一种密度导向的点云动态图卷积网络. 首先提出点云局部密度指数的概念, 衡量点及其邻域点在相应的空间位置中的密集程度; 然后利用局部密度指数动态赋予每个点一个膨胀因子, 提出密度导向的动态点分组方法对点云构建局部图结构, 对每个局部图结构构造动态边缘卷积模块进行特征的提取与聚合, 既提取了点云的几何特征, 又实现了置换不变性; 最后采用残差网络的思想优化图神经网络的过平滑问题. 实验结果表明, 在分类数据集 ModelNet40与 ScanObjectNN 上, 所提网络的分类准确率分别为 93.5%和 82.2%; 在分割数据集 ShapeNet 与 S3DIS 上, 该网络的平均交并比分别为 85.6%和 60.4%, 均高于 DGCNN 等主流网络; 所提网络在多项任务中的精度都得到显著提升, 且在处理密度不均的点云时有较好的鲁棒性, 验证了所提算法的可行性与有效性.

关键词: 点云密度; 膨胀因子; 动态点分组; 动态边缘卷积; 图卷积网络

长按扫码阅读全文或复制网址访问

https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2024.19845

采用点云分区统计的成捆棒材端面定位方法

作者: 张付祥, 孙和盛, 黄永建, 黄风山

单位: 河北科技大学机械工程学院; 河钢集团石家庄钢铁有限责任公司

摘要: 针对成捆棒材端面贴标过程中出现的端面中心位姿测量难度大、效率低等问题, 提出一种基于点云分区统计的成捆棒材端面定位方法. 首先对端面点云进行预处理操作; 然后使用改进的聚类分割算法对端面点云进行分割, 并以分区统计为依据提出完整单根棒材端面中心定位方法和残缺单根棒材端面中心定位方法, 实现端面中心定位; 最后以端面法向量表征端面中心姿态重建端面中心位姿. 采集 200 组不同姿态的单根棒材端面点云进行实验的结果表明, 单根棒材端面定位时间不超过 0.5 s, 位置误差小于 3 mm, 姿态误差小于 2°; 所提方法是高效的, 可准确地定位棒材端面中心.

关键词: 点云分割; 成捆棒材; 点云分区统计; 端面中心定位

长按扫码阅读全文或复制网址访问

https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2024.19849

基于点云稀疏空间特征聚合激励的单阶段3D 目标检测模型

作者: 鲁斌, 孙洋, 杨振宇

单位: 华北电力大学控制与计算机工程学院; 复杂能源系统智能计算教育部工程研究中心

摘要: 针对目前基于点云的 3D 目标检测中单阶段体素法存在感受野固定、特征尺度单一, 导致模型对点云特征学习不够充分、模型检测效果存在瓶颈等问题, 提出了一种可端对端训练的基于体素的单阶段 3D 目标检测模型. 首先, 利用多尺度稀疏空间特征聚合模块, 聚合点云在不同稀疏空间尺度上的特征, 使特征充分保留点云的空间信息; 然后, 对特征进行分层激励, 通过多尺度感受野对特征进行分层学习, 强化特征的表达能力, 降低噪声信息对检测结果的影响; 最后, 将特征输入检测头进行候选框的分类和回归. 在公开的自动驾驶数据集 KITTI 上与主流单阶段 3D 目标检测模型进行了对比实验, 包含对 3 类目标共 9 个的难度等级目标的检测. 所提模型在其中 5 个等级中的平均准确率有明显提升, 尤其对点云稀疏的目标, 表现出较好的检测效果. 实验结果表明, 所提模型能够充分提取点云空间信息并有效地学习点云多尺度特征.

关键词: 3D 目标检测; 激光雷达点云; 多尺度稀疏空间特征聚合; 分层激励

长按扫码阅读全文或复制网址访问

https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2024.19850

图像语义特征引导与点云跨模态融合的三维目标检测方法

作者: 李辉, 王俊印, 程远志, 刘健, 赵国伟,陈双敏

单位: 青岛科技大学信息科学技术学院; 哈尔滨工业大学计算机学部; 中科元物芯科技有限公司; 哈尔滨工业大学计算机学部

摘要: 受到场景的复杂性和目标尺度变化、遮挡等影响, 三维目标检测仍面临着诸多挑战. 虽然跨模态特征融合图像和激光点云信息能够有效地提升三维目标检测性能, 但在融合效果和检测性能上仍有待提升, 为此, 提出图像语义特征引导与点云跨模态融合的三维目标检测方法. 首先设计图像语义特征学习网络, 采用双分支自注意力并行计算方式, 实现全局语义特征增强, 降低目标错误分类; 然后提出图像语义特征引导的局部融合模块, 采用元素级数据拼接将检索的图像局部语义特征引导融合点云数据, 更好地解决跨模态信息融合存在的语义对齐问题; 提出多尺度再融合网络, 设计融合特征与激光雷达点云交互模块, 学习融合特征和不同分辨率特征间的再融合, 提高网络的检测性能; 最后采用 4 种任务损失实现 anchor-free 的三维目标检测. 在 KITTI 和 nuScenes 数据集中与其他方法进行对比, 针对三维目标检测准确率达 87.15%, 并且实验结果表明, 文中方法优于对比方法, 具有更优的三维检测性能.

关键词: 三维目标检测; 跨模态; 语义特征; 点云; 无锚

长按扫码阅读全文或复制网址访问

https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2024.19862

➥

图像视频处理

基于双维度注意力集成对抗网络的太阳能电池缺陷图像生成

作者: 周颖, 裴盛虎, 陈海永, 颜毓泽

单位: 河北工业大学人工智能与数据科学学院; 河北省控制工程技术研究中心

摘要: 针对太阳能电池缺陷图像稀缺问题, 为了对太阳能电池缺陷检测模型进行训练, 提出一种双维度注意力集成对抗网络的缺陷图像生成方法. 首先构造双生成器与双判别器的集成对抗网络模型; 然后将通道注意力与改进的空间注意力结合为双维度注意力, 并将其融入生成器与判别器中; 最后设计双生成器分时训练的方式解决模型训练不稳定的问题. 在太阳能电池电致发光(EL)缺陷数据集上的实验结果表明, 5 种生成缺陷图像中的图像多样性指标和结构相似性指标比现有最优生成方法最高分别提升 53.87 和 0.46; 利用生成的缺陷图像进行 yolov5 检测模型的训练, 5 种缺陷的平均精度均值达到 96.56%.

关键词: 生成对抗网络; 注意力机制; 双生成器; 双判别器; 太阳能电池

长按扫码阅读全文或复制网址访问

https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2024.19840

融合结构化卷积和双重注意力机制的轻量级眼底图像分割网络

作者: 汪华登, 刘金, 黎兵兵, 潘细朋, 刘振丙, 蓝如师, 罗笑南

单位: 广西图像图形与智能处理重点实验室; 桂林电子科技大学计算机与信息安全学院; 广东省人民医院赣州医院(赣州市立医院)病理科; 广东省医学科学院广东省人民医院放射科

摘要: 眼底血管图像的自动分割对于多种眼科疾病的计算机辅助诊断具有重要作用. 针对血管的尺度差异和图像噪声导致眼底血管图像分割困难、使用单一尺度卷积运算的深度学习方法获取的特征感受野有限, 以及现有的方法复杂度过高的问题, 提出一个融合结构化卷积和双重注意力机制的轻量级眼底图像分割网络. 通过编码器增强、减少下采样次数和特征深度的编码-解码网络设计, 实现参数量只有 0.63M 的轻量化网络. 在编码阶段, 提出一种结构化卷积方法, 有效地避免了网络训练过拟合, 提高了网络捕获差异化血管特征的能力; 在解码阶段, 采用基于空间和通道的双重注意力机制, 使网络更加关注血管特征的上下文和几何空间信息, 抑制病变等噪声的干扰. 在 DRIVE, CHASE_DB1 和 STARE数据集上进行实验的结果表明, 所提网络图像分割的准确率分别为 96.92%, 97.57%和 97.51%, 灵敏度分别为 83.68%, 84.99%和 84.87%, 受试者曲线下的面积(AUC)分别为 98.67%, 99.05%和 99.02%; 并通过在DRIVE 和 STARE 数据集上的交叉训练, 验证了该网络的泛化能力.

关键词: 眼底图像分割; 编码-解码网络; 轻量级网络; 结构化卷积; 双重注意力机制

长按扫码阅读全文或复制网址访问

https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2024.19843

基于自监督与蒸馏约束的正则化类增量学习方法

作者: 徐岸, 吴永明, 郑洋

单位: 贵州大学公共大数据国家重点实验室; 贵州大学现代制造教育部重点实验室

摘要: 针对神经网络模型在增量学习中存在灾难性遗忘问题, 提出一种基于自监督与隐层蒸馏约束的正则化类增量学习方法, 包括自监督伪标签预测、隐层蒸馏约束和参数正则化. 首先基于贝叶斯和信息论提出一种对模型参数重要性评价的正则化策略; 然后利用自监督伪标签预测增强模型的表征能力, 并保留隐层特征, 通过加入高斯噪声提高隐层特征的泛化能力; 最后使用蒸馏约束方法与交叉熵分类损失对历史任务的隐层特征与输出层特征进行训练. 在 CIFAR-10 和 CIFAR-100 数据集上的实验结果表明, 所提方法取得较好的效果, 其中, 在 CIFAR-100 数据集上的平均准确率和遗忘率分别达到 64.16%和 15.95%; 该方法能够有效地减少灾难性遗忘的影响.

关键词: 增量学习; 正则化; 知识蒸馏; 自监督; 伪标签预测

长按扫码阅读全文或复制网址访问

https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2024.19848

基于轨迹预测增强的复杂场景多目标跟踪方法

作者: 刘培刚, 王奔, 李亚传, 崔振东, 王君伍, 杨少波, 李宗民

单位: 中国石油大学(华东)计算机科学与技术学院; 中国石油大学胜利学院

摘要: 以冬奥会的短道速滑比赛场景为例, 针对短道速滑中运动员的目标外观差异性小、运动变化快、目标间遮挡频繁等运动特点, 设计一个应用于短道速滑场景的多目标跟踪数据集, 并提出一种基于轨迹预测增强的多目标跟踪方法. 首先计算包围框交并比距离与外观特征余弦距离, 联合判断检测响应与跟踪轨迹的相似性解决目标外观相似问题; 然后通过跟踪轨迹的全局特征和运动线索恢复被遮挡目标丢失的信息, 提高中断轨迹的重关联能力; 最后根据检测先验控制新轨迹的初始化, 减少噪声检测对轨迹跟踪中身份交换的影响. 实验结果表明, 与 DeepSORT 方法相比, 所提方法在短道速滑场景中能够稳定地跟踪轨迹, 有效地减少了轨迹中断, 其中, IDF1 提升 21 个百分点, MOT 准确度提高 14.3 个百分点; 该方法在目标差异性小、运动变化快的短道速滑场景中保证长期稳定跟踪, 对多目标跟踪在复杂场景中的应用具有启发意义.

关键词: 深度学习; 多目标跟踪; 短道速滑; 卡尔曼滤波; 轨迹预测

长按扫码阅读全文或复制网址访问

https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2024.19851

变尺度特征融合与交叉训练的医学报告生成方法

作者: 韩琪, 张淑军, 谭立玮, 李劲松

单位: 青岛科技大学信息科学技术学院

摘要: 在对医学影像自动生成文本报告的过程中, 针对病灶尺寸小、形状不规则、训练数据量少等因素易导致影像报告出现误诊、漏诊的问题, 提出变尺度特征融合与交叉训练的医学报告生成方法. 首先将条件全局池化后的粗粒度特征与随机丢弃后的细粒度特征相融合, 增强模型对不同尺度病灶的感知能力; 然后通过整体数据和局部细节双路交叉训练的策略间接丰富数据集, 增强模型的鲁棒性, 并在双路中分别使用通道分离思想进一步挖掘影像的通道信息; 最后通过多头注意力编解码网络, 得到准确的医学报告. 在 IU-X-Ray 和 MIMIC-CXR 数据集上与其他多种方法进行实验的结果表明, METEOR 与 BLEU-2 分数分别提升 5.70%和 3.13%, 所提方法可以有效地提升生成报告的可读性与准确性.

关键词: 影像报告生成; 特征融合; 交叉训练; 条件池化

长按扫码阅读全文或复制网址访问

https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2024.19859