TOP1 | 基于残差双通道注意力U-Net的古代壁画病害检测
最新更新时间: 2024-06-21 16:12
作者:赵辉荣, 余映, 陈安, 倪雪莹, 王信超
单位:云南大学信息学院
摘要:针对现有的古代壁画病害检测方法难以准确地检测壁画病害区域的问题, 提出一种基于残差双通道注意力U-Net 的古代壁画病害检测模型. 首先设计残差双通道模块代替 U-Net 中的编码器和解码器, 构建具有多分辨率分析能力的网络检测复杂背景中不同尺度的壁画病害区域; 然后加入多尺度注意力门融合高层和低层的互补特征, 使网络能突出壁画病害区域的显著特征; 最后设计混合域注意力模块抑制壁画背景信息的干扰, 进一步准确地定位壁画病害区域; 此外, 采用多阶段损失相加的方式提高网络模型的性能. 实验结果表明, 在敦煌莫高窟壁画数据集和云南少数民族壁画数据集上, 所提模型的检测结果在视觉感受方面优于其他对比方法, 在 F-score 指标上分别达到了0.807 7 和 0.728 9, 均高于其他对比方法.
RDCAU-Net 的结构
长按识别二维码阅读全文
或复制网址访问
https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2023-00430
TOP2 | 联合内容和风格表示的无监督字体生成网络
最新更新时间: 2024-06-21 16:13
作者:刘宇, 丁阳, Fatimah binti Khalid, 李昕, Mas Rina binti Mustaffa, Azreen bin Azman
单位:Faculty of Computer Science and Information Technology, University Putra Malaysia; 大连科技学院信息科学与技术学院; 大连民族大学计算机科学与工程学院
摘要:生成包含大量字体的中文字体是具有挑战性的任务, 现有方法主要依赖于大量的配对数据进行监督学习, 然而收集这些数据是劳动密集型的工作, 且很难扩展到新风格字体. 为辅助字体设计师提高计算机汉字字库开发效率, 提出分离字体内容和风格表示的无监督字体生成网络. 首先, 将风格和内容表示在同一域中建立密集的语义对应, 指导解码器产生高质量的输出; 然后, 在跳跃连接中引入可变形卷积, 通过学习偏移量和通道之间的相互依赖性, 使网络更加注字体的结构特征; 最后, 设计多尺度风格判别器, 在不同尺度上评估生成图像的风格一致性. 在公开的数据集上展示并分析 FUNIT、MX-Font 和 DG-Font 等五种字体生成方法的生成效果, 实验结果表明在 L1、RMSE等评估指标和用户研究实验中均优于对比的方法.
本文对比方法生成字体图像的定性比较
长按识别二维码阅读全文
或复制网址访问
https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2023-00397
TOP3 | 融合特征位置编码和误差修正的唐卡图像风格迁移模型
最新更新时间: 2024-06-21 15:56
作者:时新月, 胡文瑾, 乔浪, 康文东
单位:西北民族大学中国民族信息技术研究院教育部重点实验室; 西北民族大学数学与计算机科学学院
摘要:唐卡是藏族文化中一种独具特色的艺术风格, 通过对唐卡图像进行二次创作能够帮助人们了解唐卡风格特征, 促进文化传承与保护. 针对目前唐卡图像风格迁移技术生成新图像中, 生成图像存在伪影、局部图像模糊和细节信息处理不到位等问题, 提出一种融合特征位置编码和误差修正的唐卡风格迁移模型 FPC-EI. 利用二维相对位置编码获取内容序列与风格序列之间的对应位置信息, 实现图像特征之间的对齐和匹配; 坐标注意力机制模块强化利用二维相对位置编码增强编码器对于唐卡以及内容图像纹理细节信息的捕获能力; 密集深度反投影网络使用不断上下采样层的模块进行误差修正, 指导模型提高生成图像质量. 在自建的唐卡数据集和任意图像数据集上进行模型训练的实验结果表明, 与 AdaIN, ArtFlow, AdaAttN 等风格迁移模型相比, FPC-EI 的 SSIM 指标平均提升 32%, LPIPS 和 MSE 指标平均下降 7.3%和 2.7%, 可以有效保留内容结构、特征融合和图像局部细节方面特征.
TangKaTransSet数据集上7种模型实验结果对比
长按识别二维码阅读全文
或复制网址访问
https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2023-00068
TOP4 | 基于VSLAM的室内场景重建与虚实遮挡的边缘优化方法
最新更新时间: 2024-06-14 10:20
作者:刘佳, 张增伟, 陈大鹏
单位:南京信息工程大学自动化学院
摘要:在增强现实环境中, 虚拟物体和真实物体的融合效果经常受到虚实遮挡的影响. 为了提升虚实遮挡效果, 提出一种室内场景下基于视觉同步定位与建图(VSLAM)的三维物体稠密重建与分割的方法. 首先利用 YOLOv5s 和ORB-SLAM2 检测并去除环境中的动态特征点, 只利用静态特征点构建准确的点云地图; 然后使用 OPTICS 聚类算法约束体素边缘并进行网格分割; 最后通过结合形状先验算法对分割后的点云进行预测重建, 使分割的物体边缘更加准确. 在多个数据集上检验了所提方法, 并执行动态特征点去除和虚实遮挡实验. 结果表明, 在动态场景下相比传统ORB-SLAM2, 相机的定位精度提升了 92.62%, 点云的重建精度提升了 35.00%, 说明该方法可以准确地定位虚拟物体和真实物体的遮挡边缘然后进行分割, 同时保持形状化的重建结果, 使得虚实遮挡效果更加真实自然.
Redwood chairs数据集重建分割结果
长按识别二维码阅读全文
或复制网址访问
https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2023-00601
TOP5 | 多尺度窗口下的自适应纹理滤波算法
最新更新时间: 2024-06-12 09:39
作者:崔鹏, 梁皓涵, 王志强
单位:哈尔滨理工大学计算机科学与技术学院
摘要:为了解决现有纹理滤波方法无法有效地生成具有纹理-结构区分度高的结构测度图像, 以及抑制强梯度纹理和保持结构稳定的问题, 提出一种多尺度窗口下的自适应纹理滤波算法. 首先提出一种具有强梯度纹理抑制和精细结构保持的圆形梯度算子, 利用每个像点的圆形邻域范围内多方向、多结构、多通道和多尺度信息计算纹理和结构之间的差异性, 并将其输入至定向各向异性结构度量框架中, 获得具有高对比度的结构测度图像; 然后利用高斯混合模型和 EM 算法实现对纹理和结构的分离; 最后在多尺度窗口下对像点邻域存在结构的可能性进行评估, 提出一种自适应滤波核尺度选择机制, 即纹理区域获得大尺寸滤波核, 结构区域获得小尺寸滤波核, 实现尺度自适应的滤波效果. 使用 F1 评价指标在图像平滑领域经典图像数据集上进行评估, 以及使用 PSNR 和 SSIM 评价指标在 BSD500数据集上进行实验的结果表明, 与已有滤波方法相比, 所提算法既可以有效地抑制强梯度纹理, 又可以保持精细结构尖端区域的稳定和结构周围的整洁.
本文算法流程
长按识别二维码阅读全文
或复制网址访问
https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2023-00694
还没关注?点击下方“卡片”关注,获取第一时间资讯
2024年第2期论文 速览
本公众号发布的所有原创文章欢迎转发和转载,但必须注明作者和文章出处为《计算机辅助设计与图形学学报》公众号;任何媒体、网站或个人不得对本公众号原创图文进行内容修改或摘编。除本公众号原创的图文之外,本公众号发布的图文旨在学术交流,版权归原作者所有,本公众号将不承担任何法律责任;非原创内容均已对来源作出标注,如有侵权,请留言与本公众号联系,我们将及时处理。《计算机辅助设计与图形学学报》拥有最终解释权。