为了推动最新科研成果的迅速传播,并提升学术交流的时效性,《计算机辅助设计与图形学学报》自2024年起,对最新录用的论文进行编辑审核后,将在期刊官网“最新录用”版块予以发布,同时在知网网络首发,在保证论文学术和编校质量的同时,第一时间共享领域内的最新科研成果。在此向大家推荐2024年第二季度知网网络首发下载排行TOP10的论文,欢迎关注!
欢迎投稿与我们分享您的研究新见,同时关注最新的学术资讯!
TOP1
网络首发时间: 2024-03-22 12:01:57
作者:张蕊; 刘孟轩; 孟晓曼; 武益超
作者单位:华北水利水电大学信息工程学院;中国联合网络通信有限公司郑州市分公司
摘要:针对卷积神经网络在图像语义分割时存在部分语义信息丢失、边界定位精度较低等问题, 构建了联合注意力机制和多尺度特征的卷积神经网络. 首先基于注意力机制将网络提取到的多尺度特征进行加权融合, 然后采用扩张卷积和全局平均池化聚合多尺度目标信息, 最后采用边界精细粒度特征提取模块对分割边界进行优化. 在多尺度PASCAL VOC2012 和高分辨率 Cityscapes 数据集上的实验结果表明, 所提网络的分割效果显著优于骨干网络ResNet-101, 平均交并比分别提高了 12.2%和 9.3%.
关键词:语义分割; 注意力机制; 多尺度特征; 卷积神经网络
本文网络架构
TOP2
网络首发时间: 2024-05-24 11:06:56
作者:王卫东; 刘延; 邱实; 刘贤华; 魏晓; 王劲
作者单位:中南大学土木工程学院
摘要:针对目前在铁路场景语义分割中存在的数据获取成本高、分割精度低、泛化能力差等问题, 提出了一种基于改进动态图卷积神经网络的铁路场景语义分割方法. 首先利用高分辨率的无人机采集铁路场景的多视角图像, 并通过结构运动恢复与基于面片的多视角立体视觉算法生成铁路场景的三维点云; 然后在动态图卷积神经网络中引入空间注意力模块, 增强网络结构的分割精度与泛化性; 最后通过改进后的图卷积神经网络对预处理后的铁路场景点云完成高精度的语义分割. 实验阶段采用的铁路场景包括桥梁段、路基段与联络线, 共计 11 个区域. 以平均交并比为评价指标, 与动态图卷积神经网络、PointNet++进行对比, 研究结果表明: 基于图像点云训练的改进动态图卷积神经网络对于铁路场景语义分割具有更高的精度, 与动态图卷积神经网络、PointNet++相比, 分割精度分别提高 3.3%与 6.0%, 且具有更好的泛化能力.
关键词:铁道工程; 点云语义分割; 无人机点云; 卷积神经网络
铁路场景语义分割总体框架
TOP3
网络首发时间: 2024-05-24 11:14:08
作者:卢裕弘; 封颖超杰; 朱琳; 周海怡; 朱航; 喻晨昊; 陈为
作者单位:浙江大学 CAD&CG 国家重点实验室;浙江大学艺术与考古图像数据实验室
摘要:高效地使用提示词实现文本到图片的生成是当前大模型的一个研究热点。针对现有工作在提示词工程方面的不足, 提出一种面向文本生成图片的提示词的交互式可视分析方法——PromptVis, 帮助用户评估并迭代改进提示词,以提升图片质量。首先对用户输入的提示词语句进行成分解析, 并提供改进提示词的建议, 如推荐相关的提示词; 然后将用户输入与系统推荐的提示词集合进行聚类呈现,并支持用户交互探索; 第三,从多个维度自动评估文本提示词和生成的图片, 为用户修改提示词提供参考; 第四,根据推荐的提示词对现有图片进行局部调整, 支持用户预览提示词的修改效果。通过多样化的用户进行提示词创作的案例研究和专家访谈, 证明了所提方法在辅助用户进行提示词创作上的实用性与有效性.
关键词:文本生成图片; 提示词工程; 提示词可视化
PromptVis 方法流程
TOP4
网络首发时间: 2024-05-24 10:34:00
作者:冯琳琳; 王长鹏; 吴田军; 张讲社
作者单位:长安大学理学院;西安交通大学数学与统计学院
摘要:针对科学数据集的规模和复杂性的迅速增长, 现有的降维方法存在“拥挤问题”以及不能嵌入新样本的问题,提出了一种变分自编码器均匀流形近似与投影的数据降维方法. 首先, 为减小高维数据之间的耦合性, 利用变分自编码器将数据预处理变换成潜在变量; 然后, 运用均匀流形近似与投影进一步将潜在变量降维, 使低维嵌入更好地保持原始高维数据之间的相似性关系; 最后, 将所提方法用训练集进行拟合, 并嵌入一个样本外测试集来评估对新数据的泛化能力. 实验结果表明, 在 MNIST 和 Fashion-MNIST 数据集上, 与 UMAP、DensMAP、VAE 和 AE 这 4 个优秀降维方法相比, 所提方法的可信度得分分别达到 0.994 4 和 0.993 9, 超越了当前最好方法 UMAP 0.031 6 和 0.014 1,同时在可视化、Kendall 秩相关系数以及分类精度评价指标上也有显著的改进效果.
关键词:变分自编码器; 均匀流形近似与投影; 非线性降维; 流形学习
VAE-UMAP 方法流程图
TOP5
网络首发时间: 2024-04-17 12:13:10
作者:徐翔; 吴小龙; 陈子凌; 陈然; 徐延宁; 王璐
作者单位:山东财经大学山东省区块链金融重点实验室;山东大学软件学院
摘要:光线追踪是目前最常用的真实感渲染算法, 在三维动画、虚拟现实、数字孪生等领域发挥着巨大作用. 随着人们对场景呈现精度和质量的要求不断增加, 大规模场景光线追踪渲染方法受到了广泛关注. 文章对大规模场景光线追踪的相关工作进行综述, 并从多个角度对各类方法进行分析. 首先从场景数据压缩和场景数据分解 2 个方面简述了大规模场景的数据组织方法; 然后回顾了内外存调度光线追踪方法, 并分析了 LOD 在该类方法中的应用; 接着介绍了分布式光线追踪方法, 并将其分为屏幕空间并行、数据并行和混合并行 3 类进行分析对比; 最后, 总结大规模场景光线追踪的研究进展, 分析现有方法在数据存储、数据访问、渲染质量、渲染速度等方面的问题, 并指出可能的未来研究方向, 包括基于神经网络的场景数据压缩、实例化场景数据分解、计算热点预测、自适应分布式策略等.
关键词:光线追踪; 大规模场景; 分布式渲染; 全局光照; 真实感渲染
大规模场景光线追踪渲染方法分类
TOP6
网络首发时间: 2024-05-24 08:50:37
作者:王婷; 季繁繁; 崔绍君; 袁晓彤
作者单位:南京信息工程大学计算机学院;数字取证教育部工程研究中心;南京信息工程大学江苏省大数据分析技术重点实验室;南京信息工程大学自动化学院
摘要:提出一种融合对比学习的对抗式无监督领域自适应图像分类方法(CADA), 旨在将从标记良好的源域训练得到的模型推广到未标记的目标域时仍然保持良好的泛化性能. 针对于以往的基于对抗的无监督领域自适应方法中存在的只在整体上对齐源域和目标域的特征, 而忽略了两个领域在全局分布对齐的同时属于同一类的特征是否对齐的问题, 以及对无标签的目标域样本利用不充分的问题, 将对比学习的思想引入到基于对抗的无监督领域自适应方法中, 通过不断地拉近目标域中相似样本在特征空间中的距离, 同时不断地推离不相似的样本, 使得无标签的目标域样本的分类边界更加清晰, 从而使得源域和目标域样本在全局对齐的同时也实现类内对齐; 将目标域的样本经过数据增强后送入对比学习模块, 使得目标域无标记的样本得到了更充分的利用. 与原有的基于对抗的无监督领域自适应方法相比, 提出的 CADA 在 Office-31、Office-Home、VisDA-2017 数据集上的平均准确率比原有方法提高了 2~6个百分点.
关键词:无监督领域自适应; 自监督学习; 对比学习; 类对比知识; 图像分类
基于对比学习的对抗式UDA分类模型CADA的总体架构图
TOP7
网络首发时间: 2024-06-03 14:50:35
作者:胡梦楠; 王蓉; 张文靖; 张琪
作者单位:中国人民公安大学信息网络安全学院;山东警察学院治安系;山东警察学院社会治安与应急管理研究中心
摘要:针对指代分割任务中视觉和语言间缺乏充分的跨模态交互、不同尺寸的目标空间和语义信息存在差异的问题,提出了基于双通道注意力机制的多尺度指代目标分割方法. 首先, 利用语言表达中不同类型的信息关键词来增强视觉和语言特征的跨模态对齐, 并使用双通道注意力机制捕捉多模态特征间的依赖性, 实现模态间和模态内的交互;其次, 利用语言特征作为引导, 从其他层次的特征中聚合与目标相关的视觉信息, 进一步增强特征表示; 然后利用双向 ConvLSTM 以自下而上和自上而下的方式逐步整合低层次的空间细节和高层次的语义信息; 最后, 利用不同膨胀因子的空洞卷积融合多尺度信息, 增加模型对不同尺度分割目标的感知能力. 此外, 在 UNC, UNC+, GRef 和ReferIt 基准数据集上进行实验, 实验结果表明, 文中方法的 oIoU 指标在 UNC 上提高了 1.81%, 在 UNC+上提高了1.26%, 在 G-Ref 上提高了 0.84%, 在 ReferIt 上提高了 0.32%, 广泛的消融研究也验证了所提方法中各组成部分的有效性.
关键词:指代目标分割; 跨模态交互; 特征增强; 注意力机制; 多尺度融合
本文方法结构
TOP8
网络首发时间: 2024-05-24 14:52:05
作者:吕品; 邓东平; 石铁柱; 王梦迪; 刘潜; 田雨; 张紫红; 曾赟; 邬国锋
作者单位:深圳大学自然资源部大湾区地理环境监测重点实验室;粤港澳智慧城市联合实验室;亚热带建筑与城市科学全国重点实验室;深圳大学广东省城市空间信息工程重点实验室;深圳大学深圳市空间信息智能感知与服务重点实验室
摘要:在拍摄远距离目标时, 视频序列图像受到大气湍流的影响从而产生畸变和模糊, 为对视频序列大气湍流退化图像进行复原, 提出了一种幸运成像与生成对抗网络相结合的方法. 采用空域幸运成像方法, 在有限的视频序列图像中挑选出幸运区域, 拼接-排序后进行叠加, 从而消除大气湍流带来的几何畸变; 在此基础上引入 DeblurGAN-v2模型, 进一步提升图像质量. 将高速相机拍摄的真实湍流退化图像作为研究对象, 采用所提方法进行实验, 并与图像重采样、灰度变换、巴特沃斯高通滤波、MPRNet 模型和 DeblurGAN 模型等方法进行对比, 并通过客观评价指标对不同方法的结果进行评估. 实验结果表明, 所提方法的 Brenner 梯度函数、Laplacian 梯度函数、灰度差分函数(SMD)、熵函数(Entropy)、能量梯度函数(Energy)、PIQE 以及 Brisque 指标相较于其他方法分别提升了 291%, 66%, 127%, 10%, 74%和 159%. 从主观效果上看, 幸运成像与生成对抗网络相结合的方法能显著地提高图像的视觉质量, 并有效降低图像的模糊和几何畸变程度.
关键词:图像复原; 大气湍流效应; 幸运成像; 生成对抗网络
不同方法对幸运叠加图像复原结果对比
TOP9
网络首发时间: 2024-05-29 17:25:12
作者:熊伟; 娄政浩; 徐敏夫; 袁和金
作者单位:华北电力大学计算机系;河北省能源电力知识计算重点实验室
摘要:针对动态图卷积模型只在局部尺度上独立提取点特征, 未将局部点互相关联的问题, 提出了一种集多头点注意力与边卷积的点云分类分割模型. 首先, 设计单头点注意力模块分别计算点云的注意力特征与邻域注意力特征,学习点云的旋转不变性, 使用多头机制将单头点注意力模块进行聚合, 构建多头点注意力模块, 赋予邻域内不同点相应的注意力系数; 其次, 设计加权金字塔池化模块进行特征融合, 获得更加丰富的特征信息. 最后, 提出结合交叉熵损失和焦点损失的联合损失函数, 解决数据集中存在的难分类样本和类别不平衡问题. 在 ModelNet40 数据集和ShapeNet 数据集上分别进行了点云分类与分割实验, 在 ModelNet40 数据集上, 所提模型的总体精度提升到了 94.1%;在 ShapeNet 数据集上的平均交并比提升到了 86.3%, 有效地提升了模型的分类分割性能.
关键词:点云数据; 分类与分割; 多头点注意力; 边卷积; 特征融合; 损失函数
MHPAEC 模型结构图
TOP10
网络首发时间: 2024-04-20 14:45:06
作者:王前前; 章子豪; 姜洪旭; 冯伟; 高全学; 焦李成
作者单位:西安电子科技大学通信工程学院;西安交通大学计算机科学与技术学院
摘要:为了保持多个模态间聚类空间的一致性, 消除各个模态内的无关信息, 提出一种基于自监督信息熵学习的深度多模态聚类算法. 首先采用多模态卷积自编码器结合重建任务以获取低维的潜层特征; 然后使用深度嵌入技术为多个模态学习一个理想的公共聚类空间, 将其作为标签以自监督的方式来约束各模态的聚类子空间不断接近理想,保证每个模态的潜层特征具有相似的分布; 最后结合信息熵的理论, 约束标签与各模态潜层特征间的互信息, 保证模态间的相关性, 同时降低模态内数据的冗余性. 此外, 在 Fashion-MNIST, COIL-20, FRGC, YTF, RGB-D 以及Noisy-MNIST 基准数据集上展开实验. 实验结果表明, 所提算法在 ACC 和 NMI 聚类指标上均优于其他对比算法, 尤其在 Fashion-MNIST 数据集上, ACC 相较于先进的 StSNE 算法提高了 2.2 个百分点. 消融实验和参数分析证明了所提算法的合理性和鲁棒性.
关键词:多模态聚类; 信息熵; 自监督学习; 自表达学习
DMSC-SI 网络框架图
数据说明:下载量数据于2024年7月1日统计自知网,根据本季度网络首发论文的日均下载量进行排名。
还没关注?点击下方“卡片”关注,获取第一时间资讯
本公众号发布的所有原创文章欢迎转发和转载,但必须注明作者和文章出处为《计算机辅助设计与图形学学报》公众号;任何媒体、网站或个人不得对本公众号原创图文进行内容修改或摘编。除本公众号原创的图文之外,本公众号发布的图文旨在学术交流,版权归原作者所有,本公众号将不承担任何法律责任;非原创内容均已对来源作出标注,如有侵权,请留言与本公众号联系,我们将及时处理。《计算机辅助设计与图形学学报》拥有最终解释权。