开源代码 | 基于循环双向Transformer的伪CT影像生成方法

学术   科技   2024-09-12 18:00   北京  

点击文末 “阅读原文” 下载全文

肖宁, 赵俊, 贾保平, 强彦, 赵涓涓, 吕亚丽

山西财经大学信息学院
太原理工大学信息与计算机学院
山西省心血管病医院心内科

引用本文: 肖宁, 赵俊, 贾保平, 强彦, 赵涓涓, 吕亚丽. 基于循环双向Transformer的伪CT影像生成方法[J/OL]. 计算机辅助设计与图形学学报,1-11[2024-09-12]. https://www.jcad.cn/article/doi/10.3724/SP.J.1089.2023-00736

Citation: Xiao Ning, Zhao Jun, Jia Baoping, Qiang Yan, Zhao Juanjuan, Lyu Yali. Synthetic Computed Tomography Generation via Cycle Bi-directional Transformer[J/OL]. Journal of Computer-Aided Design & Computer Graphics, 1-11[2024-09-12]. https://www.jcad.cn/article/doi/10.3724/SP.J.1089.2023-00736


本文代码已开源:https://github.com/XmaNm/CycleBiTransformer

磁共振成像引导的放射治疗可以根据肿瘤和对器官的威胁情况实时调整治疗计划, 依靠使用磁共振成像生成伪计算机断层扫描进行放射治疗. 目前, 伪层析成像的生成技术基于对抗性网络的生成方法, 但这种方法在训练过程中使用像素级损失更新网络参数, 很容易导致模式崩溃, 生成不稳定的伪计算机断层扫描. 为了精准地实现基于磁共振影像的伪计算机断层扫描生成, 利用视觉Transformer的上下文敏感性以及卷积算子的归纳偏置, 提出一种循环双向Transformer医学影像合成方法. 在编码预测阶段, 循环双向Transformer利用U-Net编码得到的码本表示图像, 并使用非自回归编码与向量量化方式缩短生成码本的长度, 生成局部真实并且全局一致的图像; 使用归一化互信息作为损失函数, 并加入了循环一致性损失解决数据不匹配的问题. 在颅脑磁共振成像数据集TCGA-GBM与CPTAC-GBM上进行一系列实验, 验证了所提方法在影像生成任务上的有效性.


相关工作

○ 跨模态医学影像生成

模态医学影像生成指在给定受试者源域中影像的情况下, 准确地估计同一受试者目标域模态影像的问题, 可以作为多模态医学影像数据分析的来源, 大大降低采集不同模态图像耗费的时间和财力, 同时提高诊断的准确性, 如图1所示.

1  基于MRI生成伪CT与原始CT的对比

在临床中, 由于多模态医学影像数据十分稀缺, 因此跨模态医学影像生成就成为研究重点.  虽然已有不少针对医学影像跨模态的研究, 但是如何提高跨模态映射的精准性, 有效地提取多模态影像的基本特征, 减少跨模态合成影像的结构损失等, 仍然是该领域内亟待解决的问题.

○ Transformer模型

Transformer模型是用于处理序列数据的深度学习模型, 使用注意力机制捕捉输入序列中的全局依赖关系, 而不依赖于固定的滑动窗口或者固定长度的历史信息. Transformer模型的每层都由一个注意力机制组成, 该机制是在不同的位置上的完全连接网络, 该网络可以独立地应用于所有位置. Transformer模型的结构如图2所示.

2  Transformer模型结构

在临床中, 由于多模态医学影像数据十分稀缺, 因此跨模态医学影像生成就成为研究重点.  虽然已有不少针对医学影像跨模态的研究, 但是如何提高跨模态映射的精准性, 有效地提取多模态影像的基本特征, 减少跨模态合成影像的结构损失等, 仍然是该领域内亟待解决的问题.



CycleBiTrans

1.  总体模型架构
本文提出的CycleBiTrans框架如图3所示.
3  CycleBiTrans框架
CycleBiTrans模型分为2个阶段: (1) 需要模型对数据进行标记, 即对输入图像进行编码, 将其压缩到离散的潜空间中. 该阶段由基于U-Net的编码器, 码本和基于U-Net的解码器3部分组成. 编码器学习从原始MRI影像在潜空间的标记码; 码本先将潜空间内的标记码组成表, 然后通过序号对标记码进行编号, 最后直接利用序号搜索相关标记码本; 解码器的功能是将标记码重建, 得到影像. (2) 使用双向Transformer模型码本中的标记码预测影像码的潜在先验, 然后使用第1阶段的解码器将影像码重建, 得到CT影像.

2.  编码与迭代解码
伪CT影像的合成需要一个可以理解图像全局组件的模型, 使其能够生成局部真实和全局一致的影像, 因此本文不是用像素来表示图像, 而是将其表示为感知丰富的码本. 为了有效地学习一个空间语义丰富的码本, 使用卷积方式并结合离散表示学习的思想对码本进行建模, 使用典型对称结构U-Net作为编码器. 对图像进行编码之后, 双向Transformer利用非自回归编码的方式对标记码进行预测生成. 
解码时, 本文使用一种迭代解码的方式加速重建过程, 所有标记码都是同时并行生成. 对于当前被遮掩的标记码, 模型预测所有遮掩位置的概率; 在每个遮掩位置上, 模型基于其在码本中所有可能的标记码上的预测概率对标记码采样, 其相应的预测得分被用作指示该预测置信度的得分; 根据掩码调度函数计算标记码的数量. 在迭代中模型同时预测所有标记码.
为了使用Transformer表示图像, 需要极大程度地压缩序列长度, 并且让序列中的元素尽可能包含更多的信息. 为了实现这一目标, 本文使用归一化互信息(NMI)损失函数, 使模型能够在高压缩率的情况下保持良好的图像质量. 为了聚合图像的上下文信息, 本文在最低分辨率尺度上引入一个单独的注意力层, 可以显著地减少标记码的长度, 得到更有效的Transformer模型.

3.  利用双向Transformer实现伪CT影像生成
双向Transformer通过联合调节所有网络层中的上下文预训练未标记的图像块深度双向表示, 即该模型从左到右和从右到左学习信息, 其中, 双向自注意力可以利用来自2个不同方向的上下文来预测遮掩标记码, 一个是正向特征提取, 另一个是反向特征提取, 从而可以在不同的粒度级别上表示上下文, 如图4b所示. 双向Transformer的结构包括堆叠的Transformer单元组成, 其中, Transformer单元由自注意力层、完全连接的编码层和解码层组成, 如图4a所示.

4  双向Transformer模型结构


实验与结果分析

叙事结构抽象方法是叙事可视化的重要组成部分, 通过对叙事结构进行抽象和表示, 可以更好地理解和呈现叙事内容. 本文将叙事结构的抽象方法分为连续性表示、单元式表示和离散化表示3类.

1.  定性结果比较
将CycleBiTrans 6种医学影像生成方法进行实验, 结果如表1和表2所示. 其中, 使用7种方法将2个数据集中的MRI影像转化为CT影像, 在每种方法的预测结果下方突出显示出每幅影像由红框勾勒出的ROI细节图, 以及使用不同方法生成的伪CT影像与真实CT影像之间的误差图, 为了便于观察, 本文使用的是误差反相图.

此外, 本文还使用CycleBiTrans将已有的CT影像转化为MRI影像, 并与原始MRI影像进行对比, 结果如图5所示.
5  利用CT影像生成伪MRI影像

2.  定量结果分析
本文还对7种方法生成的伪CT影像进行定量实验, 进一步比较CycleBiTrans方法的有效性, 结果如表3所示.
通过采用单元结构和滚动叙事, 可以将复杂的信息和故事分解为逻辑上相关的独立单元, 使读者逐步浏览和理解内容, 每个单元可以包含一个特定的主题、可视化手段或相关的文本描述, 以便读者逐步探索和消化信息.

3.  消融实验
使用不同编解码器的进行消融实验, 证明CycleBiTrans中使用的基于U-Net编解码器对码本构建的作用, 结果如表4所示.
设计双向Transformer时, 编码部分实际上是由多个Transformer单元堆叠而成. 为了探索伪CT生成最佳Transformer单元数量, 分别将双向Transformer中单元数量设置为2, 4, 6, 8, 10和12, 解码部分也是堆叠同样的数量, 结果如图6所示; 不同Transformer单元数量下的伪CT生成结果如图7所示.
6  不同Transformer单元数量的结果对比

7  不同单元数量下的伪CT生成结果

4.  损失函数对比
通过对伪CT的影像使用不同的损失函数, 验证本文中影像转换损失函数的有效性, 结果如表5所示.


5.  主观评价
本文邀请42名来自不同医院的专业医师, 分别在噪声抑制、伪影减少、细节信息和综合质量4个指标上, 评估伪CT影像在临床诊断上的影响, 以验证生成伪CT影像的临床质量, 结果如表6所示.

结  语

MRI引导放射治疗可以根据肿瘤与器官的威胁情况实时调整治疗计划, 为了实现依靠MRI生成伪CT进行放射治疗, 本文提出一种基于CycleBiTrans的方法实现MRI影像到伪CT影像的合成, 该方法还可以实现CT影像到MRI影像的转化. CycleBiTrans方法利用基于U-Net的编解码器得到码本, 之后将码本输入到双向Transformer中进行转化, 并在损失函数中引入循环一致性保持伪CT影像生成的质量. 从定量结果比较、定性结果分析、消融实验等诸多方面进行实验的结果表明, CycleBiTrans能够可靠地从颅脑MRI影像生成对应的伪CT影像, 可以较好地应用于临床放射治疗的计划中.

利用MRI生成伪CT进行引导放射治疗可以有效地避免患者在进行扫描时的电离辐射风险, 同时减少了患者进行检查时的经济负担. 本文只使用患者的单一序列MRI影像T1序列与CT影像训练模型生成伪CT影像, 虽然多序列MRI图像在生成过程中产生运动伪影, 但是使用多序列MRI影像可以提高伪CT影像生成质量. 受到收集到的数据集限制以及实验设备的影响, 本文未能探究多序列MRI图像对伪CT影像生成精度的影响. 未来将研究使用多序列MRI图像, 进一步提高伪CT影像生成性能.




肖   宁(1994—), 男, 博士, 讲师, 主要研究方向为机器学习、医学图像处理.

赵   俊(1996—), 女, 博士研究生, 主要研究方向为深度学习、图像处理.

贾保平(1979—), 女, 博士研究生, 副主任医师, 主要研究方向为高血压、冠心病、心力衰竭.

强   彦(1969—), 男, 博士, 教授, 博士生导师, 主要研究方向为机器学习、云计算、图像大数据、人工智能. 

赵涓涓(1975—), 女, 博士, 教授, 博士生导师, 主要研究方向为模式识别、情感计算、图像处理.

吕亚丽(1975—), 女, 博士, 教授, 硕士生导师, 主要研究方向为数据挖掘与机器学习、因果学习.



编辑:李姝昊
审核:赵敏


— END —

还没关注?点击下方“卡片”关注,获取第一时间资讯

综述推荐      


综述推荐 | 开放环境下的跨域物体检测综述

综述推荐 | 基于叙事结构抽象的可视分析方法综述

综述推荐 | 监控场景下基于单帧与视频数据的行人属性识别方法综述及展望

综述推荐 | 面向超级计算机系统的可视化综述

综述推荐 | 数字图像多功能水印综述

综述推荐 | 基于RGB图像的三维人手姿态估计技术综述

综述推荐 | 数字图像多功能水印综述

综述推荐 | 基于条件生成对抗网络的图像翻译综述

综述推荐 | 基于单目RGB数据的三维模板物体跟踪算法综述

综述推荐 | 基于可视分析的训练数据质量提升综述

综述推荐|数字说话人视频生成综述

综述推荐 | 基于骨架的人体动作识别技术研究进展

综述推荐 | 面向计算机程序的可视化综述


开源代码      


开源代码 | 语义扩散对齐的多尺度感知医学图像分割方法

开源代码 | 基于EfficientNetV2的PCB缺陷检测算法


合辑荐读      


合辑荐读 | 计算机技术与传统文化论文合辑

合辑荐读 | 几何建模与优化最新论文合辑

合辑荐读 | 目标检测、目标跟踪与重识别最新论文合辑

合辑荐读 | 医学图像处理最新论文合辑

合辑荐读 | 感知与交互最新论文合辑

合辑荐读 | VR/AR/MR最新论文合辑

合辑荐读 | 三维图形计算最新论文合辑

合辑荐读 | 可视化与可视分析最新论文合辑

合辑荐读 | 《计算机辅助设计与图形学学报》最新综述论文


整期论文速览


2024年第6期论文速览

2024年第5期论文速览

2024年第4期论文速览

2024年第3期论文速览

2024年第2期论文速览

2024年第1期论文速览

2023年第12期-CAD几何引擎架构及算法专刊论文速览

2023年第11期论文速览

2023年第10期论文速览

2023年第9期论文速览

2023年第8期论文速览

2023年第7期论文速览

2023年第6期论文速览




声明

本公众号发布的所有原创文章欢迎转发和转载,但必须注明作者和文章出处为《计算机辅助设计与图形学学报》公众号;任何媒体、网站或个人不得对本公众号原创图文进行内容修改或摘编。除本公众号原创的图文之外,本公众号发布的图文旨在学术交流,版权归原作者所有,本公众号将不承担任何法律责任;非原创内容均已对来源作出标注,如有侵权,请留言与本公众号联系,我们将及时处理。《计算机辅助设计与图形学学报》拥有最终解释权。




计算机辅助设计与图形学学报
《计算机辅助设计与图形学学报》官方平台。本刊创刊于1989年,EI、Scopus、北大核心、CSCD、CSTPCD、CNKI等国内外数据库收录,CCF推荐中文科技期刊A类、计算领域高质量科技期刊T1类。期刊官网:www.jcad.cn。
 最新文章