点击上方 蓝字 关注我们 了解更多资讯
刘展1,刘晓鹏1,刘敏2,甄雅南1,郑夏1,温见燕1,叶志东1,刘鹏1
1. 北京大学医学部中日友好临床医学院 中日友好医院 心脏血管外科(北京 100029)
2. 中日友好医院 放射诊断科(北京 100029)
刘展和刘晓鹏为共同第一作者
通信作者:刘鹏,Email:pengliu5417@163.com
关键词:重度无症状性颈动脉狭窄;机器学习;影像组学;预测模型;人工智能
引用本文:刘展, 刘晓鹏, 刘敏, 等. 基于机器学习的影像组学模型在重度无症状性颈动脉狭窄危险分层中的应用. 中国胸心血管外科临床杂志, 2022, 29(10): 1270-1276. doi: 10.7507/1007-4848.202205046
Liu Z, Liu XP, Liu M, et al. Machine learning-based radiomics model for risk stratification of severe asymptomatic carotid stenosis. Chin J Clin Thorac Cardiovasc Surg, 2022, 29(10): 1270-1276. doi: 10.7507/1007-4848.202205046
摘 要
目的 探讨基于机器学习的影像组学模型在重度无症状性颈动脉狭窄危险分层中的应用价值。方法 回顾性收集2017—2021年中日友好医院心脏血管外科188例重度颈动脉狭窄患者的病例资料及头颈CT血管造影图像,其中训练集131例[男107例、女24例,平均年龄(68±8)岁],验证集57例[男 50 例、女 7 例,平均年龄(67±8)岁]。在横断面上沿颈动脉斑块的边缘逐层手动勾画感兴趣体积。使用Python软件的Pyradiomics包提取影像组学特征。采用组内及组间相关系数、冗余性分析、最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归分析进行特征筛选。使用逻辑回归、决策树、随机森林、支持向量机、朴素贝叶斯和K最邻近6种不同的有监督机器学习算法将筛选出的影像组学特征用于构建预测模型。采用受试者工作特征(receiver operating characteristic,ROC)曲线和ROC曲线下面积(area under the curve,AUC)比较各预测模型的诊断效能,并通过验证集进行验证。使用校准曲线和决策曲线分析(decision curve analysis,DCA)评价预测模型的校准度和临床实用性。结果 基于训练集最终筛选出4个影像组学特征用于构建预测模型。在6种机器学习模型中,逻辑回归模型表现出较高且稳定的诊断效能,在训练集中的AUC为0.872,灵敏度为100.0%,特异性为66.2%;在验证集中的AUC为0.867,灵敏度为83.3%,特异性为78.8%。校准曲线及DCA显示,逻辑回归模型具有良好的校准度及临床应用价值。结论 基于机器学习的影像组学预测模型在重度无症状性颈动脉狭窄患者危险分层中具有一定的应用价值。
1
资料与方法
1.1 临床资料
回顾性收集2017—2021年中日友好医院心脏血管外科重度颈动脉狭窄患者的病例资料。纳入标准:(1)头颈CT血管造影(CT angiography,CTA)证实为颈动脉重度狭窄(70%~99%);(2)有可用的头颈CTA图像。排除标准:(1)非动脉粥样硬化性颈动脉狭窄;(2)双侧颈动脉重度狭窄;(3)图像质量不佳;(4)缺乏完整的临床资料。颈动脉狭窄程度依据北美症状性颈动脉内膜切除试验[14]标准在头颈CTA图像上进行测量。根据既往6个月内有无颈动脉狭窄所致的短暂性脑缺血发作、卒中或其它相关神经症状将患者分为症状性患者和无症状性患者[15]。最终纳入重度颈动脉狭窄患者188例,采用随机数字表法将纳入患者随机分为训练集(n=131)和验证集(n=57)。
1.2 CT血管造影图像采集
使用256层螺旋CT(Brilliance iCT,美国飞利浦公司)进行扫描。患者取仰卧位,扫描范围从主动脉弓到颅骨顶点。采用高压注射器经肘静脉团注对比剂碘克沙醇,碘浓度为320 mg/mL,注射流率为3~4 mL/s。采用触发扫描,监测平面位于主动脉弓,阈值为100 HU,系统触发后延迟5 s自动启动扫描。
1.3 影像组学分析
1.3.1 图像感兴趣区的勾画
为确保斑块分割和影像组学特征提取的可重复性,由1名血管外科医生和1名影像科医生在不知临床信息的情况下使用3D slicer软件(Version 4.13.0,https://www.slicer.org)对斑块进行分割,在横断面上沿斑块的边缘逐层手动勾画感兴趣体积(volume of interest,VOI);见图1。1个月后,由同一位血管外科医生对所有图像再次进行手动分割。
图1 颈动脉斑块感兴趣区勾画示意图
a:头颈动脉CT血管造影横断面图像;b:在横断面图像上沿斑块的边缘勾画感兴趣区
1.3.2 影像组学特征的提取和筛选
使用Python软件(Version 3.7,https://www.python.org)的Pyradiomics包(Version 3.0.1,https://github.com/Radiomics/pyradiomicsand)从每个VOI中提取了1 218个影像组学特征。提取的影像组学特征包括一阶特征(252个)、形态特征(14个)及纹理特征(952个)。纹理特征包括灰度共生矩阵(308个)、灰度游程矩阵(224个)、灰度大小区域矩阵(224个)及灰度依赖矩阵(196个)。其中一阶特征及纹理特征在原始图像、高斯拉普拉斯滤波图像(sigma=1.0,2.0,3.0,4.0,5.0)及小波变换图像[3个维度中每个维度使用高通(H)和低通(L)滤波器的所有组合,包括LLH、LHL、LHH、HLL、HLH、HHL、HHH、LLL,组距为10]上分别提取。使用组间及组内相关系数(intraclass correlation coefficient,ICC)对2名观察者提取的影像组学特征进行一致性评价,保留稳定性较好(ICC>0.75)的影像组学特征用于后续分析。影像组学特征的筛选在训练集中进行。首先对训练集的影像组学特征进行Z评分标准化,然后使用训练集的平均值及标准差对验证集进行标准化。使用Pearson或Spearman相关性检验进行冗余性分析,剔除相关系数>0.9的冗余性特征。最后进行最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归分析,通过10折交叉验证选择误差最小的超参数λ,进而选择最佳特征子集。
1.3.3 机器学习模型的构建与验证
使用逻辑回归、决策树、随机森林、支持向量机、朴素贝叶斯和K最邻近6种不同的有监督机器学习算法将筛选出的影像组学特征用于构建预测模型。为避免过拟合,使用5折交叉验证。采用受试者工作特征(receiver operating characteristic,ROC)曲线和ROC曲线下面积(area under the curve,AUC)来评价预测模型的诊断效能。使用校准曲线和Hosmer-Lemeshow拟合优度检验评价预测模型的校准度。通过量化不同阈值概率下患者的净收益进行决策曲线分析,阈值概率是当治疗的预期收益等于避免治疗的预期收益时的概率,在不同阈值概率下通过净收益评估预测模型的临床应用价值。在验证集中对各预测模型进行验证。
1.4 统计学分析
使用R软件(Version 3.5.1,https://www.r-project.org)进行统计学分析。使用单变量K-S检验对连续变量进行正态性检验,符合正态分布的变量用均数±标准差(±s)描述,组间比较采用独立样本t检验;非正态分布的变量使用中位数及上下四分位数[M(P25,P75)]描述,组间比较采用Mann-Whitney U检验。计数资料用频数和百分比(%)描述,组间比较采用χ2检验或Fisher确切概率法。对正态分布的影像组学特征进行Pearson相关性分析,对非正态分布的特征进行Spearman相关性分析。所有统计分析采用双侧检验,检验水准α=0.05。
1.5 伦理审查
本研究已通过中日友好医院伦理委员会审核,批准号:2019-142-K98。
2
结果
2.1 患者一般资料
本研究共纳入重度颈动脉狭窄患者188例,其中男157例、女31例。训练集131例,其中男107例、女24例,平均年龄(68±8)岁,症状性患者54例。验证集57例,其中男50例、女7例,平均年龄(67±8)岁,症状性患者24例。性别、年龄、病变位置、狭窄程度以及有无临床症状在训练集和验证集间差异均无统计学意义(P>0.05);见表1。
2.2 影像组学模型的构建
在提取的1 218个影像组学特征中,1 068个特征具有良好的稳定性(ICC>0.75)。随后使用冗余性分析将相关系数>0.9的冗余性特征剔除,剩余116个特征纳入LASSO回归分析;见图2。最后筛选出4个影像组学特征用于构建预测模型,分别为:高斯拉普拉斯滤波图像中的灰度共生矩阵相关性信息度量1(log.sigma.5.0.mm.3D_glcm_Imc1)、高斯拉普拉斯滤波图像中的一阶特征最大特征值(log.sigma.5.0.mm.3D_firstorder_Maximum)、小波变换图像中的一阶特征峰度(wavelet.LLH_firstorder_Kurtosis)和小波变换图像中的灰度依赖矩阵灰度非均匀性(wavelet.LLL_gldm_GrayLevelNonUniformity)。使用逻辑回归、决策树、随机森林、支持向量机、朴素贝叶斯和K最邻近6种不同的有监督机器学习算法将筛选出的影像组学特征用于构建预测模型,并使用5折交叉验证避免过拟合。
图2 最小绝对收缩和选择算子回归分析筛选影像组学特征
a:二项式偏差随参数λ变化的曲线图;b:影像组学特征系数分布图
2.3 影像组学模型的评价及验证
不同预测模型在训练集和验证集中的AUC、灵敏度和特异性见表2。在训练集中,随机森林模型具有最高的AUC(0.906),其灵敏度为90.7%,特异性高达96.1%。其次逻辑回归、决策树、朴素贝叶斯也表现出较好的诊断效能(AUC>0.87)。而在验证集中,逻辑回归模型表现出最佳的诊断效能,AUC为0.867,灵敏度为83.3%,特异性为78.8%。而随机森林模型在验证集中的AUC仅为0.710;见图3。因此,逻辑回归模型在训练集和验证集中表现出较高的诊断效能且较为稳定;见图4。校准曲线显示逻辑回归模型在训练集和验证集中均表现出良好的校准度,预测曲线与理想曲线间没有明显偏差。而Hosmer-Lemeshow拟合优度检验显示逻辑回归模型在训练集和验证集中差异均无统计学意义(P>0.05),表明预测概率与实际概率之间具有较好的一致性,校准曲线没有偏离拟合;图5。决策曲线分析显示,逻辑回归模型在训练集和验证集中均表现出良好的临床应用价值,在绝大部分概率阈值下,与全部识别为症状性患者和全部识别为无症状患者相比,预测模型均可获得临床收益;见图6。
图3 6种机器学习算法构建的预测模型的受试者工作特征曲线
a:训练集;b:验证集
图4 逻辑回归预测模型的列线图
图5 逻辑回归模型的校准曲线
a:训练集;b:验证集;预测概率与实际概率具有良好的一致性
图6 逻辑回归预测模型的决策曲线分析
a:训练集;b:验证集;在较宽的概率阈值范围下使用逻辑回归预测模型对重度无症状性颈动脉狭窄患者进行危险分层均可获得临床净收益
3
讨论
目前重度ACS患者的治疗方案仍不明确,因此对这类患者进行危险分层和个体化治疗是非常重要的。对于高危患者,在严格最佳药物治疗(best medical therapy,BMT)的基础上,积极接受血管重建治疗可以避免脑缺血事件的发生。而对于低危患者,单纯BMT可能是更好的选择,同时也可以避免围手术期卒中和死亡风险。因此2017年欧洲血管外科学会临床实践指南[4]指出,需要开发临床/影像学算法来识别需要血管重建治疗的高危ACS患者。本研究基于颈动脉斑块的CT影像组学特征构建了6种基于机器学习的影像组学预测模型。结果显示,逻辑回归模型在识别高危重度ACS患者中表现出稳定、良好的诊断效能、校准度以及临床实用性。
影像组学可以从医学图像中提取海量的定量特征,挖掘肉眼难以识别的信息。近年来,影像组学逐渐应用于颈动脉斑块的分析。Zhang等[8]建立的基于核磁的影像组学预测模型可以显著区分症状性斑块和无症状性斑块。其在训练集和验证集中的AUC分别为0.988和0.989,要显著高于由斑块内出血和富含脂质坏死核心构成的临床预测模型(AUC分别为0.825和0.804)。Chen等[9]的研究也得到了相似的结果。在超声方面,Huang等[10]的研究也表明,基于超声的影像组学预测模型同样优于临床和传统的超声模型。超声检查具有无创、便捷、无辐射等优点,是临床上颈动脉斑块评估的首选检查方式,但是操作者主观性较强,图像噪声高然、分辨率较差。而核磁检查无辐射,可以进行多参数、多序列成像,提供了更为详细的斑块信息,且可以识别斑块内出血、富含脂质坏死核心等成分,在不稳定斑块评估中具有重要作用,但是其费用高,成像时间长,临床应用相对较少。而CTA是评估颈动脉狭窄和斑块形态的稳健方法,除了提供关于管腔狭窄程度的准确信息之外,它还可以提供关于斑块形态和特征的丰富细节[16]。但是其具有辐射性,需要注射含碘造影剂,肾功能不全患者受到一定限制。与核磁和超声检查相比,CTA具有广泛的临床应用性及操作者独立性,非常适合于颈动脉斑块影像组学分析。但是目前缺乏大样本的基于CT的颈动脉斑块影像组学研究。因此本研究对颈动脉斑块进行了影像组学分析,经过特征筛选最终得到4个组学特征,分别为高斯拉普拉斯滤波图像中的灰度共生矩阵相关性信息度量1、高斯拉普拉斯滤波图像中的一阶特征最大特征值、小波变换图像中的一阶特征峰度、小波变换图像中的灰度依赖矩阵灰度非均匀性。这4项组学特征均在一定程度上反映了像素的分布情况[17-18],可能反映了斑块的潜在组织病理学改变。但是目前尚无有关斑块组学与组织病理学的对照研究,因此斑块组学特征的生物学意义仍需进一步研究。此外,我们发现筛选出的4项组学特征与之前的2项初步研究[11-12]的结果并不相同,这可能与纳入标准的差异相关。本研究纳入患者均为单侧重度狭窄患者,而既往研究[11-12]纳入的患者颈动脉狭窄程度异质性较大。此外,各研究间组学特征提取方法各不相同,因此尚需标准、统一的研究进一步予以验证。
本研究基于上述4项组学特征构建了基于CT的影像组学模型,结果显示,逻辑回归模型在识别高危重度ACS患者中表现出较高的、稳定的诊断效能,训练集AUC为0.872,95%CI(0.813,0.931),验证集AUC为0.867,95%CI(0.776,0.959)。校准曲线及Hosmer-Lemeshow拟合优度检验显示预测概率与实际概率之间具有较好的一致性。决策曲线分析显示逻辑回归模型具有良好的临床应用价值。因此对于预测模型识别的倾向于发生临床症状的高危ACS患者而言,在严格BMT的基础上,积极接受血管重建治疗可能是更好的选择,但是仍然需要前瞻性研究进一步予以证实。
此外,机器学习可以综合大数据影像资料,深度挖掘多维影像学信息,实现精准诊断及预测[19]。而选择适当的机器学习算法可提高模型的稳定性和预测效能。因此使用逻辑回归、决策树、随机森林、支持向量机、朴素贝叶斯和K最邻近6种不同的有监督机器学习算法将筛选出的影像组学特征用于构建预测模型。结果显示,在训练集中,随机森林模型表现出最高的诊断效能(AUC为0.906),但是在验证集中AUC仅为0.710,存在过拟合。而综合6种算法,发现逻辑回归模型具有较高的且更为稳定的诊断效能。同时,逻辑回归模型也是目前临床最为常用的机器学习算法,并且易于操作,适合二分类变量的模型构建。此外,一项系统综述[20]也表明,在结局为二分类变量的临床预测模型中,其它较为新颖的机器学习算法的预测能力并不优于传统的逻辑回归算法。
本研究存在以下局限性:(1)本研究为回顾性研究,部分缺乏CTA图像的患者被排除,选择偏倚无法避免;(2)大部分患者接受了手术治疗,术者基于临床经验的筛选可能会对研究结果产生影响;(3)本研究为单中心研究,缺乏外部验证;(4)为了最大程度地反映斑块信息,我们对整个斑块进行了勾画,这也导致部分特征的稳定性欠佳;(5)本研究未对相关临床特征进行分析,因此影像组学预测模型的诊断效能是否优于临床特征仍需进一步研究。
总之,基于机器学习的影像组学预测模型在识别高危重度ACS患者中具有良好的诊断效能、校准度和临床应用价值,有望作为临床决策的辅助工具。
利益冲突:无。
作者贡献:刘展负责数据分析和论文初稿撰写;刘晓鹏负责数据收集和论文初稿撰写;刘敏负责数据收集;甄雅南、郑夏、温见燕负责数据收集和整理;叶志东负责研究指导和论文修改;刘鹏负责论文设计、审阅与修改。
参考文献略。
本文编辑:雷芳,刘雪梅
审校:董敏
排版:张洪雪
推荐阅读
《中国胸心血管外科临床杂志》人工智能论文集
人工智能一体化三维重建应用于胸外科的中国专家共识
《人工智能在肺结节诊治中的应用专家共识(2022年版)》解读
人工智能驱动的科学研究(AI4S)在药物研发与临床实践中的应用进展
经验性与人工智能指导下精准肺段切除术效果比较的回顾性队列研究
长按或扫描二维码关注我们!