引用本文
甘雅娇,胡淇平,卓敏玲,等. 基于直肠腔内超声的影像组学模型预测直肠癌KRAS基因突变的应用[J]. 肿瘤影像学, 2024, 33 (3): 293-300.
通信作者:陈志奎 E-mail: jimchen2003@163.com
基于直肠腔内超声的影像组学模型预测直肠癌KRAS基因突变的应用
甘雅娇1,胡淇平2,卓敏玲1,钱清富1,郭晶晶1,陈志奎1
1.福建医科大学附属协和医院超声科,福建 福州 350001 ;
2.福建省福州市晋安区宦溪卫生院超声科,福建 福州 350024
[摘要] 目的:探讨基于直肠腔内超声(endorectal ultrasound,ERUS)图像的影像组学模型对直肠癌患者KRAS基因突变的预测价值。方法:本研究共纳入225例就诊于福建医科大学附属协和医院的直肠癌患者,按17∶3随机将患者分为训练组(191例)和测试组(34例)。选择每例患者的清晰且肿瘤浸润最深的ERUS图像,进行手动分割和特征提取,经过降维和筛选后,分别采用logistic回归(logistic regression,LR)、支持向量机(support vector machine,SVM)、随机森林(random forest,RF)3种算法构建模型。绘制受试者工作曲线、校准曲线和决策曲线分析(decision curve analysis,DCA),分别用于评估模型的预测效能、拟合优度和临床价值,并通过DeLong检验比较3个模型的效能差异。结果:经筛选后得到了8个最佳的影像组学特征,训练组和测试组中SVM、LR和RF的曲线下面积(area under curve,AUC)分别为0.94、0.93、0.91和0.82、0.88、0.85。经DeLong检验,3个模型的AUC差异无统计学意义(均P>0.05)。DCA结果显示,3个模型均具有一定的临床效益,其中测试组LR模型的临床效益最高。校准曲线显示3个模型均有良好的拟合效果。结论:ERUS图像的影像组学模型对直肠癌KRAS基因突变有良好的预测价值,可作为无创预测直肠癌患者KRAS基因突变的补充方法,有助于指导临床决策。
[关键词] 直肠癌;直肠腔内超声;KRAS基因;影像组学
[Abstract] Objective: To explore the predictive value of radiomics models based on endorectal ultrasound (ERUS) images for KRAS gene mutations in rectal cancer patients. Methods: A total of 225 patients with rectal cancer admitted to Fujian Medical University Union Hospital were included in this study. Those patients were randomly separated into training cohort (191 cases) and testing cohort (34 cases) according to the ratio of 17∶3. The ERUS images of each patient’s clearest and deepest tumor infiltration section were selected for manual segmentation and feature extraction. After dimensionality reduction and selection, three classification algorithms, logistic regression (LR), support vector machine (SVM) and random forest (RF) were used to construct models to predict the KRAS gene status of rectal cancer. Receiver operating characteristic (ROC) curve, calibration curve and decision curve analysis (DCA) were drawn to evaluated the predictive performance, goodness of fit and clinical value of the models, respectively. DeLong test was used to compare the efficiency differences of the three models. Results: After features selection, the best 8 features were used to construct models for predicting KRAS gene mutations in rectal cancer patients. The area under the curve (AUC) of SVM, LR and RF models were 0.94, 0.93, 0.91 and 0.82, 0.88, 0.85 in the training cohort and testing cohort, respectively. There was no significant difference in the AUC of the three models ( all P>0.05 ) by DeLong test. The DCA showed that all three models had certain clinical benefits, and the LR model had the highest clinical benefit in the testing cohort. The calibration curve showed that the three models fitted well. Conclusion: The radiomics models of ERUS images have great predictive value for KRAS gene mutations in rectal cancer. It can be used as a supplementary method for non-invasive evaluation of KRAS gene mutations in rectal cancer patients and has great guiding significance for clinical selection of targeted therapy.
[Key words] Rectal cancer; Endorectal ultrasound; KRAS gene; Radiomics
结直肠癌是全球第三大常见的癌症,也是癌症相关死亡的第二大原因[1-4]。针对表皮生长因子受体的抑制剂可通过抑制RAS信号转导通路抑制肿瘤细胞增殖,已被证实对其他治疗无效的直肠癌患者有效[5-6]。然而,约40%直肠癌患者存在KRAS癌基因突变[7-8],这使得RAS膜受体酪氨酸蛋白激酶信号转导通路激活,上游信号调节中断,肿瘤细胞增殖加速,患者无法从抗表皮生长因子受体的药物治疗中获益[9-10]。因此,早期评估直肠癌患者的KRAS基因亚型对临床制订精准治疗方案具有重要意义。
KRAS基因检测的金标准是肿瘤组织病理学检查[11-12]。然而,目前临床上部分直肠癌患者确诊时已经处于肿瘤进展期[13],失去直接手术的机会,而肠镜活检只能获取少量肿瘤组织,无法全面检测肿瘤基因状态[14]。此外,基因检测费时、价格昂贵。因此,寻找相对简便、经济有效的KRAS基因状态预测方法具有重要意义。直肠腔内超声(endorectal ultrasound,ERUS)是直肠癌常用的影像学检查方法之一,在直肠癌诊断与分期中具有较高价值[15-16]。本研究拟构建基于ERUS图像的影像组学模型,预测直肠癌KRAS基因的突变状态。
1
资料和方法
1.1 研究对象
回顾并收集2019年6月—2023年3月就诊于福建医科大学附属协和医院的225例直肠癌患者的临床和影像学资料。纳入标准:① 患者术前未经过放化疗等治疗;② 术后病理学检查证实为直肠癌且具有完整的T分期和KRAS基因检测报告(野生型/突变型);③ 术后病理学标本KRAS基因检测与ERUS检查时间间隔不超过30 d;④ 超声图像质量高。排除标准:① 术前已进行过放化疗等治疗;② 临床和术后病理学资料不完整;③ 高位直肠癌等病灶显示不完整,图像质量欠佳;④ 术后病理学标本KRAS基因检测与ERUS检查时间间隔超过30 d。本研究获得医院伦理委员会批准,并豁免患者知情同意。
1.2 仪器和检查方法
采用日本Hitachi公司的Preirus彩色多普勒超声诊断仪进行检查。使用腔内环扫探头(型号R54AW-19,频率5~10 MHz)、腔内端扫探头(型号EUP-V53W,频率4~8 MHz)。检查前患者灌肠清洁肠道后,取左侧屈髋屈膝位,经肛门注入温水150 mL建立声窗,探头外套一次性隔离套,缓慢伸入直肠进行系统全面扫查,记录病灶距肛缘距离、上下径、厚径、浸润直肠及系膜组织深度,与周边组织关系(边界清/不清),有/无淋巴结肿大,并存图。
1.3 图像分割和特征提取
使用ITK-SNAP 3.8.0软件,由1名具有10年超声诊断工作经验的超声科医师(A医师)选择图像清晰且肿瘤浸润最深的声像图,手动分割感兴趣区(region of interest,ROI)。间隔10 d后,由A医师和另外1名具有5年超声诊断工作经验的医师(B医师)分别再次勾画ROI。2名医师对患者的病理学检查结果均不知情。使用Python编程语言的pyradiomics库对图像进行影像组学特征提取。
1.4 特征筛选和模型构建
采用了随机分组的方法,将患者按照17∶3分为训练组和测试组,其中训练组包含191例患者,测试组包含34例患者。
计算A医师勾画的2次ROI所提取的特征之间的组内相关系数(intraclass correlation coefficient,ICC);计算A医师第1次勾画与B医师勾画的ROI提取的特征之间的ICC,去除两次ICC<0.75的特征。经最大相关最小冗余算法(max-relevance and min-redundancy,mRMR)保留30个具有最大相关性的特征,再通过最小绝对值收缩和选择算子(least absolute shrinkage and selection operator,LASSO)算法内部交叉验证筛选出最优特征后,构建3个基于影像组学的预测模型,即logistic回归(logistic regression,LR)、支持向量机(suport vector machine,SVM)和随机森林(rodom forest,RF)模型,绘制受试者工作特征(receiver operating characteristic,ROC)曲线,计算曲线下面积(area under curve,AUC)、灵敏度、特异度、准确度等评估模型的预测效能。以DeLong检验比较3个模型的效能差异。采用校准曲线和Hosmer-Lemeshow检验检测模型的拟合优度,再使用决策曲线分析(decision curve analysis,DCA)评估模型的临床价值。
1.5 统计学处理
采用SPSS 25.0软件对数据进行统计学分析。计数资料采用χ2检验或Fisher精确概率检验比较两组间的差异。P<0.05为差异有统计学意义。
2
结 果
2.1 患者基本信息
纳入研究的225例直肠癌患者中,男性 147例,女性78例,年龄24~88岁,中位年龄 62岁,其中KRAS基因野生型111例,突变型11 4例。如表1所示,训练组和测试组中,野生型和突变型在性别、年龄、肿瘤长径、肿瘤最厚径、距肛缘距离、糖类抗原(carbohydrate antigen,CA)19-9、癌胚抗原(carcinoembryonic antigen,CEA)、淋巴结肿大和病理学T分期等方面差异均无统计学意义。
2.2 影像组学特征提取和筛选
从每例患者的ERUS图像提取了1 032个特征,去除两次ICC<0.75的特征126个,经过mRMR和LASSO内部交叉验证(图1),进行LASSO回归后得到最优的8个影像组学特征(表2)。
图1 LASSO回归提取特征
A:LASSO模型的调节参数(λ)选择采用最小准则的10折交叉验证,垂直线表示LASSO调节参数(λ)的最优值;B:不同Log(λ)的LASSO系数剖面图,垂直虚线代表8个具有最佳λ值选择的非零系数的影像组学特征。
2.3 模型构建与评价
2.3.1 模型的预测效能评价
SVM、RF和LR预测模型的ROC曲线见图2,3个模型均具有较好的诊断效能(表3)。DeLong检验结果显示,3个模型预测KRAS基因突变的AUC差异无统计学意义(训练组:PRF-SVM=0.20,PRF-L=0.45,PSVM-LR=0.36;测试组:PRF-SVM=0.27,PRF-LR=0.55,PSVM-LR=0.28)。
图2 SVM、RF和LR模型的ROC曲线
A:训练组;B:测试组。
2.3.2 模型的拟合度优度检验
模型RF、SVM和LR的Hosmer-Lemeshow检验结果显示,χ2值分别为0.115、0.915和0.853,P值分别为0.694、0.339和0.356。校准曲线(图3)显示3个模型的预测值和观察值的一致性良好,均P>0.05。
图3 SVM、RF和LR模型的校准曲线
A:训练组;B:测试组。
2.3.3 模型的临床效益评价
如图4所示,3个模型的临床获益均优于“假定患者均为KRAS野生型”及“假定患者均为突变型”,而测试组中LR模型的临床获益最佳。
图4 SVM、RF和LR模型预测直肠癌患者KRAS基因突变的决策曲线
A:训练组;B:测试组。
3
讨 论
影像组学通过数据挖掘提取影像学图像中ROI内的数据特征[17-19],包括了一阶统计特征、纹理特征、基于形状和大小的特征,以及滤波器特征。大量客观、量化的数据能够反映肿瘤异质性,可进行一系列的统计学分析,涵盖肿瘤诊断与鉴别诊断、肿瘤分型、生物危险度预测、生存预测等[20-21]。这些无创的预测模型可为临床诊断、鉴别诊断、作出治疗决策提供有力依据。
医学影像因其自身具有的疾病图像库优势,与影像组学的联合研究尤为紧密。通过超声图像提取影像组学特征可量化肿瘤的灰度、形态和纹理等特征,评估肿瘤的异质性,从而更客观地在术前预测KRAS基因的突变状态[22]。本研究共筛选出了8个特征,包括2个一阶统计特征和6个纹理特征。均值和四分位间距这2个一阶统计特征体现突变型病灶ROI像素值更高且分布范围更广,这些特征在KRAS基因突变型和野生型之间的差异,可能与KRAS基因突变后细胞恶性增殖、凋亡减少、组织成分复杂,导致内部回声更为复杂有关。纹理特征数目最多,但单个特征占重均不高,可能单个纹理特征只能反映肿瘤的部分内部特征,需要综合多个纹理特征,才能发挥较高的预测效能。
本研究在分割ROI时,由2名工作经验丰富的超声科医师同时分割,且一段时间后由A医师再次分割,只留下两次ICC均>0.75的特征进行下一步分析,从分割的层面上控制特征的稳定性;特征提取采用pyradiomics软件,已有研究[23]表明该软件对所有特征都具有出色的可靠性。既往有学者[24]研究超声组学特征的再现性,并发现小波和剪切波的特征具有最好的再现性,本研究最后筛选的特征中小波特征占比不高,可能与不同癌种之间的异质性相关,未来将进一步探索剪切波特征对直肠癌KRAS基因的预测价值,更全面地研究超声对直肠癌KRAS基因的检测效能。
本研究建立的3个预测模型都具有良好的诊断效能,其中LR模型的临床效益优于SVM和RF模型。LR模型是在多元回归分析的基础上,综合多个预测因子,利用多个指标对疾病的发生或进展进行诊断或预测[25]。线性分类算法的LR模型比非线性分类算法的SVM和RF模型表现出更高的效率,表明直肠癌患者KRAS基因的表达与超声影像组学特征的潜在关系可用线性关系来解释。
目前通过影像途径预测KRAS基因突变的研究主要有计算机体层成像(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)和正电子发射体层成像(positron emission tomography,PET)/CT,超声领域的研究暂未见报道,各项研究的预测价值高低不一。He等[26]的研究显示,18F-FDG PET/CT预测结直肠癌KRAS基因突变的准确度为68.2%,明显低于本研究结果,且由于PET/CT辐射大,临床上不作为结直肠癌的常规检测方法,其应用受限。CT扫描虽然在临床上应用广泛,但也存在辐射损伤,并且CT检查难以显示直肠壁的层次结构。Yang等[27]研究增强CT对KRAS、BRAF和NRAF突变的预测价值,得出AUC为0.869。MRI无辐射、对软组织成像效果好,目前已有不少MRI预测结直肠癌KRAS基因突变的研究报道。Zhang等[28]通过横向弛豫时间(transverse relaxation time,T2)加权成像图像特征预测KRAS基因,结果显示该影像组学模型的AUC仅为0.70;Liu等[29]建立MRI影像学特征联合临床资料的深度学习模型预测KRAS基因突变,最终得出模型AUC为0.84,提示深度学习算法有助于提高MRI对KRAS基因突变的预测价值。
ERUS操作方便,无辐射污染[30],采用高频率腔内超声探头可清晰地显示直肠壁的层次结构,与以往有关PET/CT、CT、MRI预测KRAS基因的研究相比,超声预测模型的AUC、灵敏度、特异度、准确度均较高,具有较高的诊断效能。
本研究存在一定的局限性:首先,本研究为回顾性研究,可能存在一定的选择偏倚。第二,样本量较小,未来需要进一步扩大样本量,并增加外部验证来判断模型的预测效能。最后,本研究没有比较特征提取和筛选的算法,最终提取的特征可能不是最优的,这可能影响模型的预测性能。
综上所述,基于ERUS图像的影像组学预测模型对直肠癌KRAS基因突变有良好的预测价值,可用于术前无创评估直肠癌患者KRAS基因突变情况,从而为临床选择靶向治疗提供参考。
[参考文献]
编辑:徐虹
审核:倪明