重点号 | 18F-FDG PET影像组学在术前预测肺腺癌脉管浸润及脏层胸膜侵犯中的应用价值
文摘
科学
2024-07-08 16:11
江苏
对于术后易复发的肿瘤,积极监测和早期预测是重中之重。研究显示,脉管浸润和脏层胸膜侵犯与早期肺癌复发有关,是肺腺癌的不良预后因素。南京医科大学附属泰州人民医院的孙晓慧等尝试通过18F-FDG PET影像组学在手术前对患者进行风险评估,而不必完全依赖术后病理,以提早及优化临床决策,改善患者的预后。研究结果证实了预设,构建的SVM、LR、DT、KNN模型均对肺腺癌患者的脉管浸润和脏层胸膜侵犯表现出良好的预测效能,其中SVM模型的表现最佳。引用本文: 孙晓慧, 刘志鹏, 杨大壮, 等. 18F-FDG PET影像组学在术前预测肺腺癌脉管浸润及脏层胸膜侵犯中的应用价值 [J] . 中华核医学与分子影像杂志, 2024, 44(2) : 74-79. DOI: 10.3760/cma.j.cn321828-20230313-00056.
通信作者:张俊, Email:dr.junzhang@njmu.edu.cn
肺癌是全球常见且死亡率较高的恶性肿瘤之一[1]。非小细胞肺癌(non-small
cell lung cancer, NSCLC) 约占肺癌的80%,肺腺癌(lung
adenocarcinoma, LAC) 是其主要组织学亚型[2]。手术切除是早期NSCLC患者的首选治疗方法,然而,肺癌切除后5年复发率仍然很高,ⅠA~ⅢA期患者复发率为24%~73%[3];Ⅰ~Ⅱ期
NSCLC患者5 年生存率仅为30%~60%[4]。脉管浸润(lymphovascular invasion, LVI)是指肿瘤细胞在动脉、静脉或淋巴管腔内的浸润,是导致肿瘤局部复发和远处转移的第1步[2]。脏层胸膜侵犯(visceral
pleural invasion, VPI)与早期肺癌复发有关[5]。LVI和VPI是LAC的不良预后因素[6-7],但其只能在手术后被病理检查检出。如果能在手术前对患者进行准确的风险评估,将大大降低临床决策的困难,改善患者的预后。影像组学能从医学图像中提取和分析定量特征来表征肉眼不可见的潜在生物学过程[8]。本研究探讨基于18F-FDG
PET影像组学特征建立的机器学习模型用于术前预测LAC患者LVI和VPI的价值。回顾性分析南京医科大学附属泰州人民医院2018年8月至2022年8月期间经手术病理确诊的LAC患者,记录其年龄、性别、肿瘤位置、LVI及VPI情况。所有患者接受了术前18F-FDG
PET/CT检查,并进行根治性肺切除术。排除标准:(1)未在本院手术者;(2)病历资料不完整者;(3)合并其他恶性肿瘤者;(4) PET/CT检查前曾行抗肿瘤治疗者。本研究符合《赫尔辛基宣言》的原则。共纳入87例患者,其中男42例(48.3%),女45例(51.7%);年龄为(64.6±9.0)岁。共90个病灶,其中位于左肺叶的34个(37.8%),位于右肺叶的56个(62.2%);有LVI的病灶27个(30.0%),无LVI的病灶63个(70.0%);有VPI的病灶35个(38.9%),无VPI的病灶55个(61.1%)。患者在PET/CT检查前至少禁食6
h,并且需要控制空腹血糖水平≤11.1 mmol/L。在患者安静状态下,经其肘静脉按体质量注入18F-FDG 3.70~5.55
MBq/kg。嘱患者休息并保持平静状态1~2 h,使用德国Siemens Biograph mCTs PET/CT仪采集图像。扫描范围自颅顶至股骨上段,先采集低剂量CT图像(管电压120
kV,管电流100 mA,层厚5 mm);后采集PET图像,共采集6~8个床位,每个床位采集2.5~3 min。PET图像经由CT数据衰减校正。对PET及CT图像进行融合及后处理,获得冠状位、矢状位、轴位及最大密度投影的PET/CT图像。所有PET/CT图像由1位核医学科医师勾画ROI,1位对临床信息不知情的具有10年以上经验的核医学科医师审核肿瘤分割。使用三维(three-dimensional,
3D) Slicer软件勾画ROI,并用其自带的Python软件包从PET图像中提取影像组学特征。 在特征筛选之前,用中位数填充缺失值及异常值。然后,使用 Z-score 数据标准化方法对组学数据进行预处理,以提高模型的精度。对数据集采用最大相关最小冗余(minimum
redundancy and maximum relevance, mRMR)特征筛选方法,分别筛选10 个与 LVI、VPI最具相关性的影像组学特征。之后,使用Python Scikit-learn(https://scikit-learn.org/stable/user_guide)建立4种常见机器学习分类模型,包括逻辑回归(logistic
regression, LR)、K-最近邻(K-nearest neighbor, KNN)算法、决策树(decision tree, DT)和支持向量机(support
vector machine, SVM)模型。使用Python中的StratifiedkFold函数将数据按8∶2进行分层抽样,分成训练集和测试集,使用5折交叉验证法验证模型性能的稳定性并绘制ROC曲线,获取AUC来评估模型预测LAC病灶LVI和VPI的价值。同时计算以下性能指标:准确性、特异性、精度(也称为阳性预测值)、召回率(也称为灵敏度)和F1分数(准确性和召回率的调和平均值)。数据统计分析通过R语言(http://www.rproject.org)实现。使用“mRMRe”包进行mRMR分析;用“pROC”包实现ROC曲线分析,计算AUC评估各模型性能。采用Delong检验比较不同模型之间AUC的差异,以P<0.05为差异有统计学意义。共提取855个影像组学特征,包括(1)原始图像的14个形状特征,反映
ROI 的形状和大小;(2) 18 个一阶直方图特征,包括能量、熵等常用指标,定量描述体素强度分布;(3) 68 个纹理特征,包括 22 个灰度共生矩阵(gray
level co-occurrence matrix, GLCM)、16 个灰度大小区域矩阵(grey level size zone matrix,
GLSZM)、16 个灰度游程长度矩阵(gray level run length matrix, GLRLM)、14 个灰度依赖矩阵(gray level
dependence matrix, GLDM),量化ROI的异质性;(4)基于小波转换形成的一阶特征和纹理特征,使用8个频段组合:低(low)-高(high)-低(LHL)、低-高-高(LHH)、高-低-低(HLL)、高-低-高(HLH)、低-低-高(LLH)、高-高-高(HHH)、高-高-低(HHL)和低-低-低(LLL)。
筛选得到的与LVI显著相关的10个特征见表1,与VPI显著相关的10个特征见表2。
基于PET影像组学特征建立的SVM、LR、DT和KNN模型评价LVI状态的平均AUC在训练集分别为0.91、0.90、0.91、0.91,在测试集分别为0.85、0.87、0.77、0.78;平均F1分数分别为0.59、0.56、0.58、0.56。SVM模型平均F1分数最佳,其准确性、特异性、灵敏度、阳性预测值分别为0.78、0.87、0.56、0.72,ROC曲线见图1。SVM与LR、DT、KNN,LR与DT、KNN,DT与KNN的AUC差异均无统计学意义(z值:0.00、1.14、1.44、-1.10、1.35、0.25,均P>0.05)。4种模型评价VPI状态的平均AUC在训练集分别为0.86、0.86、0.84、0.81,在测试集分别为0.82、0.80、0.69、0.78;平均F1分数分别为0.66、0.62、0.55、0.57。SVM模型平均F1分数最佳,其准确性、特异性、灵敏度、阳性预测值分别为0.78、0.85、0.69、0.73,ROC曲线见图2。SVM与LR、DT、KNN,LR与DT、KNN,DT与KNN的AUC差异均无统计学意义(z值:0.00、1.71、0.89、-1.71、0.89、-1.46,均P>0.05)。
研究表明,有LVI或VPI的肺癌患者可能不适合亚肺叶切除[9-11]。美国国家综合癌症网络(national
comprehensive cancer network, NCCN)指南推荐,对有LVI和VPI等高危特征的患者应考虑行辅助治疗[12],而对于ⅠB期没有LVI和VPI的患者可能不适合进行额外的全身治疗[13]。因此,开发和验证风险分层系统,对于识别癌症特异性死亡风险最高的患者具有重要意义,可以帮助实现个体化精准治疗。18F-FDG
PET/CT影像组学在肿瘤诊断、疗效评价、预后预测等方面已取得较好的结果[14-17],而在LAC术前预测LVI、VPI价值方面的研究极少。Koike等[18]的研究表明,SUVmax是LAC患者VPI和LVI的独立危险因素。Tsuchiya等[19]发现,基于整个肿瘤体积的表观系数直方图分析能够对NSCLC患者LVI、VPI进行分层。但这些结果尚未得到广泛认可。本研究通过提取18F-FDG
PET的影像组学特征构建了SVM、LR、DT和KNN 4种机器学习模型,以预测LAC患者术前LVI、VPI状态。本研究筛选的预测LVI、VPI最有意义的特征中大多数为小波滤过的特征,纹理特征均来自GLCM、GLSZM、GLRLM三大矩阵。长游程强调(long
run emphasis, LRE)值越大,图像纹理越粗糙。灰度不均匀性(graylevelnon-uniformity,GLNU)、归一化灰度不均匀性(gray
level non-uniformity normalized, GLNN)值越低,灰度值越均匀。标准化逆差分矩(inverse difference
moment normalized, IDMN)值越高,图像越均匀。本研究发现,有LVI的病灶图像纹理更粗糙、灰度值更不均匀、图像更不均匀。这与Li等[20]的研究结果基本一致:他们通过增强CT影像组学预测食管鳞状细胞癌LVI,发现球度(sphericity)和GLNU是预测LVI最重要的影像组学特征。GLNU是稳定性良好、重复性最高的放射组学特征之一[21],其对重构的卷积核不敏感,因此在不同的图像重构算法下具有更高的稳定性[22]。GLNU随着肿瘤异质性的增加而增加,这与肿瘤侵袭、治疗反应和预后有关[23]。本研究结果显示,有LVI的肿瘤比无LVI肿瘤的GLNU值更高,提示存在LVI的肿瘤异质性更高、侵袭性更强。因此,GLNU可以用作LVI的预测因子,反映肿瘤的异质性和侵袭性。逆差分(inverse difference,ID)值越高,图像越均匀。区域熵(zone
entropy, ZE)值越高,异质性越高。归一化大小区域不均匀性(size zone non-uniformity normalized, SZNN)值越低,同质性越高。集群阴影(cluster
shade)值越高,图像越不对称。本研究发现,有VPI的病灶图像更不对称、不均匀,异质性更高,这与Zha等[24]的研究结果一致。Tsuchiya等[19]的研究结果显示,峰度(kurtosis)是区分有无VPI的最佳参数。本研究亦显示,kurtosis与VPI有关,表明kurtosis可能是预测VPI有前景的指标。影像组学可以结合大量定量特征和人工智能算法建立各种预测模型,从而提高对疾病的诊断能力。Li等[20]从增强CT提取影像组学特征,建立LR、SVM和DT模型预测食管鳞状细胞癌的LVI,结果显示SVM与LR模型的效能无明显差异,均优于DT模型。Nie等[2]发现,PET及CT影像组学模型对LAC
LVI有良好的预测效果。Fan等[25]从PET/CT及增强CT中提取影像组学特征,使用自适应提升(adaptive boosting, AdaBoost)、线性判别分析(linear
discriminant analysis, LDA)和LR分类器建立模型预测胃癌LVI,3种模型的AUC分别为0.849,0.778和0.810。本研究中SVM模型表现最佳,其AUC在训练集和测试集中分别为0.91、0.85,而LR模型的AUC在训练集和测试集中也分别达0.90、0.87,2种模型AUC差异无统计学意义(均P>0.05),均有良好的预测效能。Zha等[24]采用CT的影像组学特征建立模型预测LAC VPI,在训练队列和验证队列中的AUC分别为0.83和0.81。Wei等[26]基于CT影像组学特征建立LR模型预测早期NSCLC的VPI,结果显示AUC为0.824,预测性能良好。本研究使用PET图像提取影像组特征建立模型来预测LAC
VPI,结果显示SVM的预测效能最佳,其AUC与上述研究结果相当。综上所述,18F-FDG PET影像组学模型在LAC患者LVI、VPI状态的预测中表现出了良好的性能,SVM模型表现最佳。然而,SVM模型的灵敏度和F1分数仍偏低,这可能与本研究病例数较少且阳性病例占比较少有关,需要以后的大样本、多中心研究进一步验证和完善。