为了推动最新科研成果的迅速传播,并提升学术交流的时效性,《计算机辅助设计与图形学学报》自2024年起,对最新录用的论文进行编辑审核后,将在期刊官网“最新录用”版块予以发布,同时在知网网络首发,在保证论文学术和编校质量的同时,第一时间共享领域内的最新科研成果。在此向大家推荐2024年第3季度知网网络首发下载排行TOP10的论文,欢迎关注!
欢迎投稿与我们分享您的研究新见,同时关注最新的学术资讯!
TOP1
网络首发时间: 2024-09-13 09:38:39
作者:史松林, 帕孜来·马合木提
作者单位:新疆大学电气工程学院
摘要:针对超声心动图因噪声大、左心室边缘模糊, 造成分割困难和分割结果不准确的问题, 提出一种结合Transformer和CNN 的左心室分割算法 HeartNet. 首先, 利用2 种网络构架高效地捕捉全局特征和局部细节; 其次, 使用卷积注意力设计特征融合模块, 自适应融合来自 Transformer 和CNN 分支的特征; 最后, 引入桥注意力模块并根据 3 层融合特征计算注意力特征图, 得到更精确的分割结果. 为验证HeartNet 的性能, 在大型心脏图像数据集 EchoNet-Dynamic 上进行训练、验证和测试, 测试 Dice Coefficient 达到 92.41%, 分割性能优于参与对比的其他 6 种算法. 在临床病人的超声图像上测试, 可视化和临床医生的盲审结果说明了该算法的有效性. 实验结果表明, HeartNet 可以精确地分割左心室, 为心脏疾病诊断提供可靠的计算机辅助.
关键词:超声心动图; 左心室分割; Transformer; 卷积神经网络
HeartNet 结构
TOP2
网络首发时间: 2024-09-19 11:30:34
作者:张睿, 李吉
作者单位:太原科技大学计算机科学与技术学院;山西省机电设计研究院有限公司
摘要:为进一步提高焊缝缺陷 X-ray 底片低质影像语义分割精度, 降低人工设计网络主观影响及耗时等问题, 提出一种多级多尺神经网络自搜索的焊缝缺陷语义分割方法. 通过对多尺度轻量化候选操作、通道注意力机制和多层级动态神经网络架构的设计, 从不同维度提升网络对低质影像缺陷特征提取的表达能力; 同时对网络训练早期与最终识别性能之间的潜在关联探索, 提出使用固定采样逐步确定最优候选操作的渐进式快速神经架构搜索方法. 在架构搜索阶段使用自行采集、标注的 483 张 X-ray 焊缝缺陷图片经过随机裁剪、旋转、平移等数据增强操作进行架构寻优, 最终以较低的搜索成本自动构建出焊缝缺陷语义分割网络.实验表明, 所提方法对 X-ray 焊缝缺陷进行语义分割最终 mIoU 指数达到了 49.23%, 高于人工设计网络的 45.41%和直接使用模型迁移的 28.86%, 网络自搜索速度和分割效果提升明显.
关键词:语义分割; 多分辨率多尺度特征融合; 神经架构搜索; 焊缝缺陷; 无损检测
MMSNNA 示意图
TOP3
网络首发时间: 2024-09-27 07:01:31
作者:杨太海, 顾智浩, 马利庄
作者单位:华东师范大学计算机科学与技术学院;上海交通大学电子信息与电气工程学院
摘要:小样本异常检测仅利用少量正常样本进行检测和异常定位, 现有的小样本异常检测方法的训练和测试都在相同的域中进行. 对于跨域场景的研究尚处于空白. 针对跨域小样本异常检测问题, 为了将源域学到的知识迁移到目标域中进行小样本异常检测, 提出基于风格记忆的跨域小样本异常检测方法. 该方法包含 2 个模块, 首先将域差异定义为风格特征差异, 设计风格记忆模块存储来自源域的域内统计特征, 并将学习到的特征集成到目标域中, 减轻域差异带来的影响, 提升性能; 然后引入对比学习策略, 区分不同类别的增强查询特征, 进一步加强模型对源域中不同类别的表征能力,提高小样本检测性能. 在 MVTec AD, MPDD 和 MVTec LOCO-AD 数据集间进行跨域小样本异常检测任务实验, 结果表明, 与最新小样本方法相比, 所提方法取得了最佳性能, 其中, 图像 AUROC 指标提升3%~5%; 在本域内小样本异常检测任务上, 该方法仍然有优异的表现.
关键词:异常检测; 小样本学习; 域差异
本文方法架构
TOP4
网络首发时间: 2024-09-27 10:37:45
作者:张浩然, 张少魁, 孙博远, 林鑫杰, 刘家宏, 陈学斌, 陈境焕, 张松海
作者单位:清华大学美术学院;清华大学计算机科学与技术系;清华大学工程物理系;广州极点三维信息科技有限公司
摘要:场景生成需要度量指导场景的优化. 由于场景度量以场景优化为目的, 并且度量结果对人类通常较难解释, 缺乏专业室内设计背景的人需要通过场景的定量评估来理解一个房间功能、美学和人因因素的合理性. 文中提出用于自动评估室内三维场景的 10 项评估指标, 包括功能、美学和人因 3 个评价维度. 首先, 从场景物件的使用性与功能关联出发, 通过可达性、可见性、开阔度、关联关系和功能比例来衡量场景的功能质量; 其次, 基于场景平面构图和人视点视野, 使用平衡性、齐整度与和谐性度量场景的美学质量; 最后, 根据人类活动模拟, 采用流线合理性和活动舒适度评估人因质量. 所提评估方法能通过分项指标展示输入场景的优缺点, 为场景优化和设计迭代提供参考. 选取 3D-Front 数据库的 50 个场景进行对比评估, 实验结果表明, 采用该方法进行室内场景评估的效果与专业设计师水平相当, 二者平均评分差异为 0.133~0.220, 且评估结果的有效性受到专业设计师和普通用户的肯定; 在与 PlanIT和 HAISOR 的对比实验中, 基于所提评估方法的场景生成技术在用户评估中获得了更高的功能、美学、人因和总体评分, 在度量场景上更加合理.
关键词:场景生成; 场景评估; 场景度量; 空间推断
评估方法框架
TOP5
网络首发时间: 2024-09-26 12:09:12
作者:杨志豪, 彭伟龙, 唐可可, 汪洋涛, 谭恒良, 方美娥
作者单位:广州大学计算机科学与网络工程学院;广州大学元宇宙研究院;广州大学网络空间先进技术研究院
摘要:基于单目视频序列的神经辐射场(NeRF)人体重建由于视野范围限制, 对动作和外观信息覆盖不足, 影响动作可编辑性和图像渲染质量. 为此, 提出了一种新颖的紧凑半侧身体权重的 NeRF 人体表征方法. 首先, 基于 NeRF构建标准人体姿态模型; 然后, 引入可学习的半侧身体线性混合蒙皮权重, 利用人体的对称性提升动作的表达能力, 并实现从特定动作到标准姿态的精准转换; 最后, 通过结构化权重衰减和基于权重的采样策略, 提升体渲染效率和质量. 实验结果表明, 所提方法在 ZJU-MoCap 数据集上处理未见过的动作时表现出较强的可编辑性, 在 SSIM, PSNR和 LPIPS 评价指标上分别为 0.957, 29.16 和 0.028, 均优于对比方法.
关键词:三维人体重建; 神经辐射场; 线性混合蒙皮技术; 动作编辑
TOP6
网络首发时间: 2024-08-26 16:49:18
作者:陈梦成, 龚政, 鲁挺松, 朱合翌, 罗国亮
作者单位:华东交通大学土木工程建筑学院;华东交通大学省部共建轨道交通基础设施性能监测与保障国家重点实验室;华东交通大学软件学院/VR 产业学院;江西博微新技术有限公司
摘要:定期检测混凝土表面的缺陷对延长基础设施的使用寿命能够起着重要的安全保障作用 . 针对人工检测混凝土效率不高, 计算机视觉方法在复杂场景中易出现误判的问题, 将基于眼动追踪的视觉交互方法引入损伤检测, 提出一种智能裂缝检测方法. 首先利用眼动跟踪技术提取人眼信息, 实现对疑似裂缝特征信息的定位交互; 然后结合训练的深度神经网络模型对疑似裂缝区域进行精细化识别和分割, 实现复杂场景图片下裂缝识别和提取. 通过在桥梁损伤数据集CODEBRIM 中的裂缝类集上进行眼动交互定位实验和裂缝识别实验, 定位精度为 90.6%, 判别精度为 83.1%, 与其他方法相比精度更高, 且定位识别效率和准确率高, 可用于结构健康监测.
关键词:可视化分析; 人机交互; 眼动追踪; 智能识别; 混凝土裂缝缺陷; 特征提取; 深度学习类
基于眼动追踪的视觉交互方法
TOP7
网络首发时间: 2024-09-18 17:22:17
作者:王洪申, 贾苏洋, 黄忠金
作者单位:兰州理工大学机电工程学院
摘要:三维 CAD 模型的再利用可以提高产品的开发周期周期, 从而降低成本. 三维模型通过中性交换文件在造型系统间交换时通常会丢失模型的造型特征信息. 为了能够对这些模型通过修改特征实现重用, 需要重建建模的造型特征序列, 即识别建模的特征与建模过程. 为此, 通过分析建模特征相交的痕迹实现特征识别, 运用布尔运算对每次识别出的特征与原模型进行分离处理, 更新模型数据; 如此对造型特征边识别边消除, 使特征识别问题不断简化, 较好地解决了造型中特征相交引起的特征识别和分割困难的问题. 抽取 ESB 模型库中的部分模型进行测试, 测试结果表明该方法可有效地实现 CAD 模型建模特征序列的重建, 为三维模型的重用奠定了基础.
关键词:相交特征; 布尔运算; 特征识别; 特征序列重建; 模型重用性
总体识别算法
TOP8
网络首发时间: 2024-07-25 08:45:28
作者:尹嘉超, 吕耀文, 索科, 黄玺
作者单位:长春理工大学光电工程学院
摘要:印刷电路板(PCB)是一种高精密的电子元器件, 其优良与否对电子产品的质量有着重要影响. 但现有的 PCB缺陷检测算法存在着检测精度不高, 特别是缺陷定位不够精确等问题. 针对以上问题提出一种基于 EfficientNetV2 的PCB 缺陷检测算法. 在 Faster R-CNN 的基础上, 通过选用特征提取能力更强的 EfficientNetV2_M 作为特征提取网络,同时使用通道注意力机制(ECA)对特征融合网络 FPN 进行优化, 提高了细节信息提取能力. 在北京大学智能机器人开放实验室发布的 PCB 瑕疵数据集上的实验结果表明改进后的缺陷检测算法相较于目前检测效果最好的 PCB 缺陷检测算法 LWN-Net, 在 IoU=0.50 时 mAP 由 99.58%提升到 99.66%;在 IoU=[0.50:0.95]时 mAP 由 52.6%提升到 79. 4%.该网络在提升了 PCB 的检测精度的同时解决了缺陷定位不够精确的问题, 实现了高精度的 PCB 缺陷检测, 具有一定的实际意义. 代码已经开源在 https://github.com/ChaO989/Defect_detection.
关键词:印刷电路板; EfficientNetV2; 缺陷检测; Faster R-CNN; 通道注意力机制
改进后的 Faster R-CNN 网络结构
TOP9
网络首发时间: 2024-08-22 14:43:39
作者:费彦琳, 高天, 李俨达, 石洋, 曹楠, 陈思明
作者单位:复旦大学大数据学院;同济大学设计创意学院;上海市数据科学重点实验室
摘要:传记可视化通过图形化语言描述人物的生平故事, 旨在从海量传记数据中提取重要信息并通过可视化获取洞见. 针对从传记文本数据中自动生成叙事可视化存在提炼具有概括力的设计模式、设计传记可视化的自动生成流程、形成具有普适性的可视化设计方案等难点, 开发了基于人物传记文本数据的叙事可视化自动生成系统 BioVistory. 该系统以传记文本数据及其他辅助信息作为输入, 运用自然语言处理的规范进行预处理; 从文本中提取出事件, 分为职业生涯、人物行迹、人际关系和时间信息 4 种不同的视角, 并划分为若干人生阶段; 将提取得到的事件、视角和阶段通过视觉隐喻自动生成传记可视化作品; 为用户提供事件交互、视角交互和阶段交互 3 种不同语义层次的交互探索功能. 通过案例分析和用户实验对 BioVistory 系统进行评估, 结果表明, 该系统可以自动生成高质量的传记可视化作品, 能有效地支持数据驱动的叙事可视化并增强传记文本的表现力和感染力; 支持读者驱动的阅读体验, 提高学习成效, 增进用户参与度, 并减少用户的认知负荷.
关键词:传记文本数据; 数字人文; 叙事可视化; 自动生成
BioVistory 系统的生成流程
TOP10
网络首发时间: 2024-09-19 09:26:23
作者:张志伟, 王晗, 崔凯元
作者单位:北京林业大学信息学院;国家林业和草原局林业智能信息处理工程技术研究中心;腾讯科技有限公司CSIG质量部
摘要:传统数字水印方法对裁剪、噪声、形变等攻击具有强鲁棒性, 但很难抵御真实场景中由图像压缩编码和移动摄像设备翻拍引起的水印信息丢失. 为了增强水印鲁棒性, 利用离散余弦变换频谱中某些频段对人眼的掩蔽特性以及卷积神经网络对一些不可见扰动的学习能力, 提出一种基于频域卷积的端到端图像数字盲水印方法. 首先, 使用卷积神经网络构建编码网络, 将水印信息嵌入到图像频域中; 其次,构建与编码网络对称的解码网络, 从图像频域中提取水印信息; 最后, 对编码和解码网络进行联合训练,并监督编码网络的图像质量和解码网络的水印提取效果. 在MIRFLICKR 数据集上进行的实验结果表明, 该方法的PSNR, SSIM, LPIPS, BPP, 显示器下翻拍的准确率分别达到了36.29dB, 0.951, 3.11×10-3, 2.44×10-3, 93.1%, 与其他基准方法相比具有一定的优势, 证明了该方法的有效性.
关键词:图像数字水印; 离散余弦变换; 鲁棒水印; 卷积神经网络
本文方法框架
数据说明:下载量数据于2024年9月30日统计自知网,根据本季度网络首发论文的日均下载量进行排名。
还没关注?点击下方“卡片”关注,获取第一时间资讯
本公众号发布的所有原创文章欢迎转发和转载,但必须注明作者和文章出处为《计算机辅助设计与图形学学报》公众号;任何媒体、网站或个人不得对本公众号原创图文进行内容修改或摘编。除本公众号原创的图文之外,本公众号发布的图文旨在学术交流,版权归原作者所有,本公众号将不承担任何法律责任;非原创内容均已对来源作出标注,如有侵权,请留言与本公众号联系,我们将及时处理。《计算机辅助设计与图形学学报》拥有最终解释权。