综述 | CT影像组学在肺结节鉴别诊断中的价值

文摘 2024-08-14 10:49 上海

是新朋友吗？记得先点蓝字关注我哦～

引用本文

刘云泽, 李宬润, 任红, 郭俊唐, 刘阳. CT影像组学在肺结节鉴别诊断中的价值[J]. 中华胸部外科电子杂志, 2024, 11(02): 120-129.

本文刊于

中华胸部外科电子杂志 2024, 11(02): 120-129.

作者：刘云泽，李宬润，任红，郭俊唐，刘阳

作者单位：中国人民解放军总医院研究生院，第一医学中心胸外科，北京

通讯作者：刘阳

刘阳教授

摘要

"新冠后时代"到来，胸部CT的应用更加广泛，导致肺结节的检出率越来越高，不同种类结节的治疗和预后区别很大，所以准确鉴别诊断有重要意义。传统的临床特征和影像学对于结节的鉴别存在较高的差错率，而影像组学的研究在近十年内迅速兴起，通过计算机挖掘影像中的高通量数据来辅助临床决策，提高了诊断效能，使得患者获益。本文综述了CT影像组学概述及其在肺结节鉴别诊断中的价值，并且讨论了其优势、挑战和不足，展望了未来影像组学的发展方向。

关键词

肺结节，计算机断层扫描，影像组学，诊断

点击下方，免费下载全文PDF

CT影像组学在肺结节鉴别诊断中的价值.pdf

肺癌目前是全世界最常见的癌症（占所有癌症诊断的11.4%），也是癌症相关死亡率的主要原因（占癌症总死亡率的18.0%）^[1,2]。国家癌症中心数据显示：中国2022年新发肺癌106万，死亡人数63万，人群发病率和死亡率为癌症之首^[3]。显著降低肺癌死亡率的公共卫生策略主要包含2个方面，一是从19世纪50年代就被广泛呼吁的减少烟草使用，另一项就是对于人群的肺癌筛查，从早期的X线筛查、肿瘤标志物筛查，到现在基于对无症状个体进行低剂量计算机断层扫描（low-dose computed tomography，LDCT）筛查，用以早期发现肺癌^[4,5,6]。一项于我国8个省12个城市的多中心、基于人群的前瞻性队列研究，招募了101万名受试者，充分证明一次性LDCT筛查与肺癌死亡率和全因死亡率显著降低相关^[7]。早发现、早治疗使得部分恶性肺结节患者5年生存率为>75%^[8,9]。然而通过大规模筛查出的肺部结节，绝大多数是良性的。它们往往并不会造成较差的预后，却因为模棱两可的诊断导致过度治疗。所以如果能准确诊断肺结节，可以避免许多不必要的治疗，减轻患者痛苦，减少社会经济负担^[4,10,11,12]。

在肺癌的诊断和检查中，临床医生和放射科医生利用CT和正电子发射计算机断层显像（positron emission tomography，PET）这些医学影像来初步判断疾病的种类，诊断的依据往往是依靠临床经验，所以有时会有误诊的情况发生。

影像组学这一概念在2012年由Lambin等^[13]提出，之后Kumar等^[14]对其进行了补充解释。其原理是应用计算机算法从图像中提取大量高维定量图像特征，捕获肉眼可能忽略的信息，以数字化的形式将其展现，并且对通过算法进行筛选和建模，从而获得更为精准的诊断。本文就CT影像组学在肺结节鉴别诊断的研究现状进行综述。

一、CT影像组学概述

CT首次应用于医学事业，可以追溯至1971年，这项技术革命性的改变了现代医学。时至今日，通过医生肉眼判读CT图像诊断肿瘤疾病仍然是全球的主流。但是人工阅片有很明显的缺陷，存在很强的主观性，十分依赖阅片医生的经验，不同医生、甚至同一医生不同时期的阅片，都会产生不同判断。而且随着成像条件的提升，图像内部细小的差异肉眼已经无法分辨。而CT影像组学是以CT扫描的原始DICOM数据为基础，通过勾画感兴趣区域（volumes of interest，VOI），锁定需要提取影像特征的部分，再利用高算力的计算机，对整个区域的灰度进行分析。通过影像组学的方法可以得到上千种特征，很多特征肉眼无法捕捉，但对于临床的结果有十分重要的意义，极大提高了分辨的能力。而且计算机获取特征更加具有稳定性，也有更好的可重复性，避免了仅依靠医生主观解读医学影像的多种问题。目前广泛应用于各种肿瘤的初步诊断，比如肺癌、肝癌、胃癌、乳腺癌及脑肿瘤^{[15,16,17,18,19]}等，也可应用于很多延申的医疗领域。

对比传统影像学，CT影像组学也存在其特有的局限性：①结论依赖于原始数据质量的一致性和人工对肿瘤区域选定的准确和稳定性；②对于设备运算能力的高要求和技术的复杂性；③过程和结果的可解释性相较传统影像学也较差。如果能够克服这些局限性，得到的结论将会对临床起到很大帮助。

标准的影像组学工作流程应该包括5个步骤：图像的采集与初步处理、图像分割、特征提取、降维与特征选择、模型开发与应用^{[20,21,22,23,24,25]}。

1．图形获取和初步重建

在日常工作中，患者间的医学影像资料的基础参数存在较大差异。不同格式的影像、不同医学中心，甚至是同中心的不同机器的影像，都可能存在不可比性。这给模型建立提出了巨大挑战。为了尽量减少差异，主要的办法一方面是制定图像采集规范，尽可能从参数上，选取相同的影像，另一方面可以应用N4偏置场矫正、图像归一化等多种预处理手段，使得影像达到基本同等可比^[26]。N4偏置场矫正主要是从原始图像中，去除偏置场数据，用来纠正亮度不均的问题，也会使得图像边界更加清晰。而图像归一化是指将图像的强度值，调整到标准范围，常用的归一化方法包括"Z得分归一化""最小-最大归一化"等，假设将不同患者图像信息比喻成数组，用"10、20、30、40、50"代替，通过预处理将其变成"1、2、3、4、5"，保证相对特征不变的情况下，减少个体之间的差异。

2．图像分割

影像组学的特征提取，针对的是肿瘤区域，或者人为规定的VOI，对VOI的勾画会对后续步骤起决定作用。目前对于VOI勾画的金标准仍然是手工勾画，但是手工勾画要求操作者有较强的操作和阅片能力，而且将会耗费大量时间和精力。不同勾画者得出的结果可能会有较大差异，所以目前基于人工智能（artificial intelligence，AI）的自动或者半自动分割，也在图像分割中占据较为重要的部分^[27,28]。

3．特征提取

影像组学的核心部分，就是特征提取。这是应用计算机算法，对于勾画的VOI区域，和原始的DICOM影像数据进行计算，从勾画出的区域提取出特征标签的过程。特征从类型上分为人工命名的特征，和深度学习的特征。人工设计的特征通俗来讲就是有明确命名，并且代表可描述的含义的特征，可以分为强度、形状、纹理、小波4类，强度特征和形状特征，是较为基础且容易理解的特征，一般是VOI内部的灰度最大值、最小值、偏度、最大经、最小经、体积等，这些往往也是视觉可以捕捉到的信息。纹理特征则指的是描绘VOI区域中视觉无法捕捉到的深层次纹理信息。如灰度游程矩阵，他表示在一个特定方向上，连续相同的像素点数量。强度、形状、纹理特征可以提取固定频域的肿瘤信息^[29]，为了获取更多信息，提高鉴别效能，可以利用小波变换，将肿瘤分解成水平、垂直、对角、低频4个方向不同频域的图像，再次提取高维抽象信息，虽然视觉无法判读，但是其中蕴涵的信息也可以为临床判断提供价值。

4．特征选择与降维

提取特征后，会得到一个较大的数组，通常包含上千种特征，然而临床研究的样本量往往不足以支撑过多的特征建模，就要对特征进行选择和降维，避免复杂度过高而导致的维度灾难，排除干扰和不相关的特征，减少过拟合的发生，增加模型诊断效能。一般可以应用相关性分析、方差分析等方式评估特征值的相关性。但是最常用的降维方式，为最小绝对值收敛和选择算子（least absolute shrinkage and selection operator，LASSO）。LASSO回归可以构造惩罚函数来精炼模型，将相关性小的特征的系数降维0。除此之外还有L2范数正则化，弹性网等方式。最终获得相关性好，影响系数大的一部分特征，进行模型的构建。

5．模型的开发和应用

模型用来表示筛选出的各特征与预测结果之间的相关性，也是计算机与医学诊断的有机结合。常用的模型有很多种，如线性回归、线性分类、树模型等。比如支持向量机（support vector machine，SVM）就是一种常用的有监督学习，引入hinge损失函数，评估分界面，以找到两类别距离相等的面，作为模型，即使样本量不大，仍旧能有不错的表现。以训练集数据进行模型建立后，用测试集数据进行验证，再利用受试者工作曲线下面积（area under the curve，AUC）来评估模型的好坏，并且应用临床决策曲线（decision curve analysis，DAC）来分析是否适用于临床。具体流程简图如图1所示。

二、CT影像组学在肺结节鉴别诊断中的应用

随着肺结节的筛出率逐步增高，结节性质的判定也成为了临床中的巨大挑战。良恶性结节的治疗方案和预后有明显差异，因此对于术前鉴别诊断，医疗行业有极大的需求。从良性结节的角度来讲，因其种类繁多，对应的治疗也千差万别，所以具体分型有重要意义；从恶性结节的角度来讲，不论是术前分期、预后推断，还是治疗效果预测等，也都有巨大潜在价值。以往受限于成像设备落后和计算机算力不足，无法全面获得影像特征。随着科技进步，CT影像学也有了巨大突破，影像组学的兴起和发展，为医疗行业提供了一条行之有效的道路。总结如表1所示。

1．CT影像组学鉴别肺结节良恶性

无症状人群接受低剂量胸部CT筛查，明显减低了肺癌死亡率，这主要是因为许多肺癌在早期发现并且进行及时的治疗。但是低剂量CT依靠人工读片，有着较高的假阳性率^[36]，影像组学可以更为深入、更为广泛的探查肿瘤影像的特点，从而令我们获得了更多有价值的信息。

Ardila等^[37]对美国国立肺筛查试验（National Lung Screening Trial，NLST）中的超过40000例肺结节患者的胸部CT数据进行分析，逐层对这些肺结节进行人工识别和影像组学特征提取，经过模型建立和验证，测试集验证AUC为0.944。大样本加高准确率的研究，说明了影像组学在肺部结节良恶性辨别上的可行性，并且同期与6名具有8年以上工作经历的放射科医师进行诊断结果比较，发现在假阴性率和假阳性率上，分别降低了5%和11%。在Xu等^[30]的研究中，对242名接受术前双层光谱CT（dual-layer Spectral Detector CT，SDCT）检查的肺结节患者进行了研究。他们基于动脉期、静脉期图像以及SDCT的120 kVp图像，分别对VOI进行了勾画，并从中提取影像组学特征。接着计算并挑选出用于构建识别不确定肺结节的影像组学模型。首先根据显著的临床特征和光谱定量参数构建了常规模型，然后又创建了一个融合了放射组学模型和常规模型的综合模型。他们对3种模型的区分能力、校准程度和临床应用性能进行了评估，其中基于SDCT图像的影像组学模型的AUC达到0.96，充分证明了模型的优秀性能。

2．CT影像组学推测肺结节分期

目前针对肺癌常用的分期方式还是第8版TNM分期^[38]。不同分期的肺癌，治疗和预后有较大的差异。然而在临床工作中，准确的TNM分期需要依赖术后病理，或者术前参考更加先进的PET/CT，如果可以在无创且更加平价的情况下，准确推断肿瘤TNM分期，对改善患者的身体健康和提高经济效益都有很大的帮助。

（1）CT影像组学对于淋巴结转移的预测：Das等^[39]的研究回顾性纳入了216例患者，包含训练集113例，内部验证集50例和53例临床分期cT1N0M0的外部验证集，从肿瘤区域提取影像组学特征，后经LASSO逻辑回归法筛选，采用多因素回归分析构建列线图，根据列线图的校准、辨别力和临床实用性评估其性能。列线图的鉴别能力在内部和外部都得到了验证，其中外部验证的AUC值为0.72，已经初步具备较好的诊断效能。同样，Cong等^[40]和Zhang等^[41]的研究也都证明影像组学对于肺肿瘤淋巴结转移的预测有重要作用。

（2）CT影像组学对于远处转移的预测：是否存在远处转移是影响肺癌患者治疗方案和预后的关键因素之一，肺癌的远处转移诊断标准仍旧为病理活检，肉眼判读CT准确率较差，PET/CT又较为昂贵，CT影像组学在鉴别肺癌远处转移上，起到了重要作用。在Chen等^[42]的研究中，纳入195例肺CT数据，经过提取特征和特征筛选，最终保留7个特征，应用这些特征建立模型，用以预测非小细胞患者是否会发生骨转移，最终，预测模型的AUC可以达到0.82。Chen等^[31]对89例T1期肺腺癌病例展开研究，进行影像组学对于肺腺癌脑转移的预测，经过勾画和特征提取后，共得到1 160个已经被人为定义过影像组学特征，筛选后建立了影像组学模型，AUC值为0.847，说明基于CT的影像组学模型在预测T1类肺腺癌患者的脑转移方面具有良好的预测性能和巨大潜力。同样地，对于肺结节在其他部位的转移的预测^[43]，CT影像组学都具有很好的效果，潜力值得期待。

3．CT影像组学鉴别不同肺结节病理亚型

不管是良性结节还是恶性结节，在进行手术切除，行使常规病理检查之前，取得病理都是困难的。而穿刺活检是有创操作，患者需要承担有创操作所带来的风险，并且穿刺活检有着较高的假阴性率。对于肺癌而言，根据WHO对肺癌的分型，可分为9类。E等^[44]的研究回顾性分析了229例经病理确诊的肺癌患者。所有招募的患者均接受非增强和双相胸部造影增强CT；从1160个影像组学特征进行筛选和降维，建立影像组学分类模型。肺鳞癌、腺癌、小细胞肺癌两两对比，得出的AUC值平均为0.78，说明CT影像组学对于区分肺癌的病理类型来说，是一个有临床应用前景的工具。

4．CT影像组学鉴别肺结节的侵袭性

早期两项研究^[45,46]显示，高达52%和58%的纯磨玻璃结节在随访期间出现进展。之后经过学者们的长时间探索研究，发现纯磨玻璃结节进展，很有可能是因为其中含有侵袭性成分。这也说明侵袭性成分的出现或许是肿瘤从惰性生长转为快速生长的标志。已经有人应用CT影像学推测肺结节的侵袭性，取得了不错的效果^[32,47]。Sun等^[48]的研究纳入了395名患者，应用CT影像组学预测肺结节的侵袭性，选取5个影像组学特征和4个影像学特征来预测浸润性病变。在验证集中，放射影像组学组合模型（AUC 0.77；95%CI，0.69～0.86）的表现优于影像学模型（AUC 0.71；95%CI，0.62～0.81）和影像组学模型（AUC 0.72；95%CI，0.63～0.81）。说明影像组学不论是单独对肺结节侵袭性的预测，还是与其他模型联合应用，都具有很好的诊断效能。

5．CT影像组学鉴别不同肺结节基因分型

表皮生长因子受体（epidermal growth factor receptor，EGFR）基因型和间变性淋巴瘤激酶（anaplastic lymphoma kinase，ALK）基因型对肺癌的治疗决策至关重要^[33,49]，但在基因测序过程中，仍旧面临着肿瘤组织获取困难的问题。而且，并非所有EGFR突变患者，在使用EGFR酪氨酸激酶抑制剂（tyrosine kinase inhibitor，TKI）都能取得较好的预后，所以对于EGFR突变的患者中，也有必要进行区分和分层，以求更加合理的治疗方式。Wang等^[50]基于CT影像组学和人工智能，建立全新的评估系统，该系统从CT图像中挖掘全肺信息，如EGFR突变、分型及治疗后效果。该研究共纳入了18232例肺癌患者，来自中国和美国的9个队列进行CT成像和EGFR基因测序，在验证队列中，取得了大于0.75的AUC，说明CT影像组学可以提供一种非侵入性方法来检测EGFR基因型并识别具有TKI耐药高风险的EGFR突变患者。

6．CT影像组学对于肺结节治疗效果和预后的预测

对于肺结节，存在内科和外科治疗不同的方式，对于内科治疗后的效果评估，和外科治疗后的复发性观察，是临床中患者和医生非常关注的问题。可是目前，这种评估都是依赖于医生对复查结果的经验性判断，可能会存在疏漏。目前有研究证明，CT影像组学在肺结节治疗效果评估和预后预测上，有着很好的效能。在Huynh等^[51]的研究中，分析113例接受立体定向消融放射治疗的Ⅰ～Ⅱ期非小细胞肺癌患者的CT图像，筛选出12个影像组学特征，评估特征与临床结局的相关性及其预后价值，将影像组学特征与影像学语义特征和临床参数进行比较，证明了影像组学在放疗效果评估的优势。对于肺癌复发，Mattonen等^[34]应用影像组学评估45例接受立体定向消融放射治疗的患者（15例局部复发与30例无局部复发匹配）的治疗后CT扫描的图像，以对比临床医生和影像组学在评估反应方面的表现。研究过程中，医生将大多数图像评估为无复发，平均误差为35%，同时，由5个图像外观特征组成的影像组学特征表现出优异的辨别性，受试者工作特征AUC为0.85，分类误差为24%，取得较好的结果。另外对于肺癌化疗^[52]，总生存期^[53^]等多方面，也表现出较好的结果。这说明影像组学对于肺结节的治疗和预后预测效果良好，可以给临床医生的判断提供有力的参考和支持。

7．CT影像组学联合其他模型对诊断效能的提高

随着人工智能、深度学习的进一步发展，影像组学联合其他多组学的联合模型，展现出明显的优势。在Kammer等^[35]的研究中，使用梅奥模型^[54]计算456例患者结节的癌症概率，并将患者分为低、中、高危组。在队列1（n＝170）中训练了包括临床变量、血清部分肿瘤标志物水平和影像组学特征在内的组合生物标志物模型，并在队列2～4中进行了验证（总n＝286）。与梅奥模型相比，此研究的新模型提供了更高的诊断准确性，AUC改善了0.124。对此模型的临床效用进行估计分析，指导的策略将使良性结节人群的侵入性手术从62.9%减少到50.6%，并将中风险癌症诊断的中位时间从60天缩短到21天。这种融合模型，除了判断良恶性，对于病理亚型的判别^[55]也有很好效果，说明联合模型对于肺结节的诊断有着更好的效果，也将成为未来疾病诊断的发展趋势。

本文涉及多项研究和数据，以上所有研究展现出的模型效能都是令人满意的。但大多研究为回顾性研究，收集病例资料的过程中可能存在偏差，而且目前影像组学并未有一个统一的公式可以参考，且研究中的具体代码和特征往往不被公开，为了保证得出的结论真实可靠，应该尽可能扩充训练集的大小，并且引入外部验证集。

三、总结和展望

本综述从对肺结节筛查情况、CT影像组学概述、CT影像组学在肺结节多方面预测的作用3个方面进行阐述，总体而言影像组学作为新兴的技术工具，为临床提供了更加准确的诊断与预测，使得患者收益。下面对CT影像组学在肺结节鉴别诊断中的价值进行总结和展望。

1．总结

随着人们健康意识的提高，越来越多的人进行肺部CT筛查，也就有越来越多的不确定性肺结节被发现^[56]。因为不同性质的肺结节有差别很大的治疗方式和预后，所以明确诊断尤为重要。诊断的金标准为病理诊断，而病理取材都是侵入性的，相对而言有一定的操作风险^[57]，且容易出现假阴性的结果，所以对于无创的临床诊断的新方法和高效能提出了前所未有的要求。在肺结节诊断上，胸部X线、胸部CT之类的传统影像学多年以来占据重要地位^[58]，而在影像组学概念提出后，研究者们通过计算机深入挖掘CT图像上肉眼不可见的高维数据，经过复杂的计算，定量分析图像内元素，依靠大量的数据学习，建立多个适用于不同情况的影像组学模型，使得CT影像对于肺结节的诊断效能有了明显的提升。除了基础的疾病种类的判别，目前已经证实肺结节的CT影像组学在诸如判断恶性肺结节转移情况、病理分型、侵袭性、分子亚型、预测治疗效果和预后等多方面有较好的表现。同时CT影像组学联合其他组学，如磁共振组学、蛋白组学等^[59,60]，进一步提高了预测效能。除此之外还有瘤周影像组学^[61,62]，扩充了VOI区域，提取出更多的信息，也对临床诊断提供了一定的帮助。

影像组学将影像分析从依靠主观、经验，引领入客观、量化的时代，许多高维度，人眼无法捕捉的信息，也被纳入统计分析，增加了准确性。虽然目前临床上众多的研究结果还未得到广泛、大规模的认可和应用，但是随着研究结果的进一步完善，影像组学将对临床疾病的诊断和治疗方式的选择可能起不可替代的作用。

2．展望

众多研究报道，对于肺结节的CT影像组学目前的诊断效能已经领先于传统影像学，而且有成本相对较低、避免有创检查的风险的优点，有很好的临床应用前景，未来发展方向主要为：①融合与提高。融合深度学习和人工智能，融合其他生物标志物，联合多组学、基因组数据库，以及同一个体多个时间序列的动态发展影像组学的研究，进一步提高诊断效能，逐步探索无创诊断的极限，最终在某些情况下，有望代替穿刺活检，进行基因层面预测、最佳治疗方案制定、预后推断等，实现虚拟活检的目标。②个体化。通过累计大样本量的训练，根据不同地域、不同人种以及不同身体基础情况等多种混杂因素，筛选更加个体化的影像组学敏感特征，建立解释性强、准确性高、鲁棒性好的智慧影像组学。③监测与预测。利用静态的影像组学，评估动态发展的疾病的潜在风险和疗效预后，做到对医疗全局的把握和准确及时的医疗决策下达。

3．挑战

（1）稳定性和可重复性：对于兴趣区的选定，进行深层次研究。目前兴趣区域制定的金标准，仍旧是人工勾画。人工勾画确实可以避免自动或者半自动勾画的误识别，将既往学习经验更好的加入到工作中。但是不同医生的勾画水平和VOI选定会有一定差异，使得影像组学模型的稳定性和可重复性不强。未来需要进一步加强自动VOI分割算法的研究，既避免了人为偏差，又能大量减少人力成本^[63,64]。

（2）标准化：制定统一的成像、特征提取、筛选、建模的流程化和规范化标准^[65,66]。目前因为成像机器参数、编程软件、特征提取与筛选的代码参数、模型建立节点的规定值等都存在差异，使得影像组学的结果在临床应用中存在很大困难。在技术层面的挑战之外，还需要加强权威监管，对可用的代码、模型、数据进行统一制定标准，同时避免伦理问题的发生^[67,68]。

4．结语

随着"新冠后时代"的到来，人群胸部CT筛查的频率明显提升，也就有更多的不确定肺结节被发现，对这些结节的准确诊断，是医学界面临的重大挑战。CT影像组学利用大数据进行复杂计算，得出有利于肺结节诊断的多种模型，大大促进了个体化治疗的发展，使患者、社会都有明显获益。虽然目前影像组学的应用存在局限性，但是随着研究者的不断努力，影像组学将会给人类带来巨大获益！

利益冲突所有作者均声明不存在利益冲突

参考文献

文献详见本文期刊官网链接https://zhxbwkdzzz.cma-cmc.com.cn/CN/10.3877/cma.j.issn.2095-8773.2024.02.08

本文为《中华胸部外科电子杂志》原创文章，版权归中华医学会所有。其他媒体、网站、公众号等如需转载本文，请联系本刊编辑部获得授权，并在文题下醒目位置注明“原文刊于《中华胸部外科电子杂志》，卷（期）：起止页码”。谢谢！

征稿活动

征稿通知 |《中华胸部外科电子杂志》综合性征稿启事

征稿通知 | “术说”优秀手术视频文章征集启事

扫码关注获得更多期刊资讯

胸部外科时间

http://mp.weixin.qq.com/s?__biz=Mzk0MjQ5NjU0OA==&mid=2247489800&idx=2&sn=5984c7927a3eacafd005d0fedad92e6b

胸部外科时间

《中华胸部外科电子杂志》内容公布，胸部外科知识普及及继续教育