引用本文
秦 琼,文 荣,白秀梅,等. 基于示卓安超声造影Kupffer期的深度学习预测肝细胞癌微血管侵犯的研究[J]. 肿瘤影像学, 2024, 33 (4): 432-441.
基金项目:广西壮族自治区自然科学基金(2020GXNSFDA238005,2023GXNSFDA026013);南宁市青秀区科技计划(2020045);广西医科大学第一附属医院临床研究攀登计划青年科技启明星计划(YYZS2020024)
通信作者:杨 红 E-mail: yanghong@gxmu.edu.cn
第一作者简介
秦琼,主治医师,广西医科大学在读硕士。研究方向:肝细胞癌免疫微环境。
通信作者简介
杨 红,女,医学博士,主任医师,硕士研究生、博士研究生导师,博士后合作导师,广西医科大学第一附属医院超声医学科主任。2007年获中山大学影像医学与核医学专业博士学位,2017—2018年在美国匹兹堡大学病理学系作访问学者。现于广西医科大学第一附属医院超声科工作,专业为腹部、小器官及浅表组织超声诊断与介入超声,专业特长为腹部及浅表器官超声造影与介入超声,近年专注于肝癌的早期诊断及早期介入治疗。作为课题负责人曾获4项国家级、4项省部级、2项厅级科研课题资助,并于国内外发表论著100余篇。当前在研国家自然科学基金2项,广西自然科学基金重点项目1项。现任中国研究型医院学会肿瘤介入专业委员会副主委,广西医学会超声医学分会主委,广西医师协会超声分会副主委,广西医师协会介入超声医师专委会主委,中华医学会超声分会全国青年委员会委员,中国医师协会超声医师分会介入超声专业委员会委员,海峡两岸医药卫生交流协会超声医学青年专家委员会委员,中国抗癌协会肿瘤影像专业委员会超声医学专业学组组员,广西抗癌协会肝癌及胆胰癌症专业委员会委员等。
基于示卓安超声造影Kupffer期的深度学习预测肝细胞癌微血管侵犯的研究
秦 琼,文 荣,白秀梅,高瑞智,杨院萍,甘翔宇,廖 蔚,阙 翘,陈玉姬,何 云,杨 红
广西医科大学第一附属医院超声医学科,广西 南宁 530021
[摘要] 目的:评估基于注射用全氟丁烷微球[商品名示卓安(Sonazoid)]超声造影Kupffer期的深度学习模型预测肝细胞癌(hepatocellular carcinoma,HCC)微血管侵犯(microvascular invasion,MVI)的效能,并将其与影像组学模型及临床模型进行比较。方法:回顾并纳入2020年7月—2022年9月于广西医科大学第一附属医院接受Sonazoid超声造影检查的146例原发性HCC患者,以7∶3随机划分为训练集102例和验证集44例。基于肿瘤感兴趣区,使用ResNet101模型通过迁移学习提取深度学习特征,使用PyRadiomics提取影像组学特征。采用Mann-Whitney U检验、最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)算法进行特征降维。LASSO回归用于构建深度学习模型和影像组学模型,同时还基于临床特征构建一个临床模型。采用受试者工作特征曲线的曲线下面积(area under the curve,AUC)、灵敏度、特异度和准确度评估模型的诊断效能。DeLong检验用于比较模型间的诊断效能。结果: 在训练集中,深度学习模型、影像组学模型、临床模型的AUC(95% CI)分别为0.931(0.880~0.981)、0.823(0.744~0.903)、0.719(0.614~0.824)。在验证集中,深度学习模型、影像组学模型、临床模型的AUC(95% CI)分别为0.895(0.757~1.000)、0.711(0.514~0.909)、0.606(0.390~0.822)。DeLong检验表明在训练集和验证集中,深度学习模型的诊断效能均优于影像组学模型及临床模型(P<0.05)。单因素及多因素logistic回归分析示甲胎蛋白和巴塞罗那临床肝癌分期可作为HCC患者MVI的独立预测因子(P<0.01)。结论:基于Sonazoid超声造影Kupffer期的深度学习模型在预测HCC患者MVI方面表现出优异的性能,有望成为预测MVI的无创影像学生物标志物。
[关键词] 肝细胞癌;超声造影;注射用全氟丁烷微球;Kupffer期;深度学习;微血管侵犯
[Abstract]Objective: To evaluate the performance of a deep learning model based on the Kupffer phase of perflubutane microspheres for injection (product name Sonazoid) contrast-enhanced ultrasound in predicting microvascular invasion (MVI) of hepatocellular carcinoma (HCC), comparing it with radiomics model and clinical model. Methods: This study retrospective included 146 patients with primary HCC who underwent Sonazoid contrast-enhanced ultrasound examination in The First Affiliated Hospital of Guangxi Medical University from July 2020 to September 2022, randomly divided into a training set of 102 and a validation set of 44 in a 7∶3 ratios. Based on the region of interest in tumors, ResNet101 model was used to extract deep learning features through transfer learning, and PyRadiomics was utilized to extract radiomics features. Mann-Whitney U test and least absolute shrinkage and selection operator (LASSO) algorithm were employed to reduce features dimension. LASSO regression was used to construct both the deep learning model and radiomics model, a clinical model was also built based on clinical features. The diagnostic performance of models was evaluated using the area under the receiver operating characteristic curve (AUC), sensitivity, specificity, and accuracy. DeLong testing algorithm was used to compare the diagnostic performance between models. Results: In the training set, the AUC (95% CI) for the deep learning model, radiomics model, clinical model was 0.931 (0.880-0.981), 0.823 (0.744-0.903) and 0.719 (0.614-0.824), respectively. In the validation set, the AUC (95% CI) for the deep learning model, radiomics model, clinical model was 0.895 (0.757-1.000), 0.711 (0.514-0.909) and 0.606 (0.390-0.822), respectively. DeLong testing indicated that in both the training and validation sets, the diagnostic performance of the deep learning model was superior to that of the radiomics model and clinical model (P<0.05). Both univariate and multivariate logistic regression analyses showed that AFP (P<0.05) and Barcelona Clinic Liver Cancer staging (P<0.001) could be used as independent predictors of MVI in HCC patients. Conclusion: The deep learning model based on the Kupffer phase of Sonazoid contrast-enhanced ultrasound demonstrates excellent performance in predicting MVI in HCC patients. It has the potential to become a non-invasive imaging biomarker for predicting MVI.
[Key words] Hepatocellular carcinoma; Contrast-enhanced ultrasound; Perflubutane microspheres for injection; Kupffer phase; Deep learning; Microvascular invasion
原发性肝癌是全球范围内常见的恶性肿瘤之一,最新的全球肿瘤流行病学统计数据显示,其致死率高居恶性肿瘤第三位[1]。其中,肝细胞癌(hepatocellular carcinoma,HCC)是原发性肝癌主要的病理学亚型,占所有肝癌的75%~85%[2]。目前肝癌的根治性治疗方法仍是肝移植、手术切除及消融治疗[3]。但治疗后转移和复发率高依然是困扰全球医师的一大难题。近年来多项研究[4]表明,微血管侵犯(microvascular invasion,MVI)是术后复发的独立预测因子,与患者的预后密切相关。虽然多项研究已报道关于MVI的预测方法,但临床上仍缺乏一种公认可行的非侵入性方法,目前诊断MVI的金标准仍然是术后病理学检查。假设基于示注射用全氟丁烷微球[商品名示卓安(Sonazoid)]超声造影Kupffer期图像构建深度学习模型能够在术前预测HCC的MVI,这将有利于临床手术决策和患者的个性化治疗方案制订,从而改善患者的预后。超声造影是一种无创、便捷的影像学检查方法,对于病灶内微循环血流灌注的检测很敏感,已广泛应用于肝癌的诊断和疗效评估[5-7]。Sonazoid作为第二代超声造影剂,其特有的Kupffer期主要表现在巨噬细胞的特异性吞噬作用,可指导肝脏肿瘤的诊疗,目前已广泛应用于临床[8]。近年来,飞速发展的影像组学和深度学习在医学领域的发展中贡献卓越,深度学习算法是通过模拟构建人类大脑思维方式的神经网络机制,能够通过深度神经网络提升机器学习的效能,实现对人眼无法识别的微观图像信息的深度挖掘和解释[9],因此部分研究人员将其应用于预测MVI的研究,从而提升模型的预测效能[10]。但目前基于Sonazoid超声造影Kupffer期的深度学习模型预测MVI的研究尚未见报道。本研究希望通过构建基于Sonazoid超声造影Kupffer期的深度学习预测模型,探索其在术前预测HCC患者MVI的效能。
1
资料和方法
1.1 患者资料
回顾并纳入2020年7月—2022年9月于广西医科大学第一附属医院接受Sonazoid超声造影检查的患者。纳入标准:① 经病理学检查诊断为原发性HCC的患者;② 经手术切除的患者;③ 术前未接受其他治疗,包括放疗、化疗、介入治疗和消融治疗等;④ 图像质量合格。排除标准:① 无病理学检查结果;② 病理学检查诊断为非原发性HCC;③ 未行手术切除者;④ 术前已接受其他治疗;⑤ 影像学资料不合格者。该项回顾性研究得到广西医科大学第一附属医院伦理委员会的批准,并免除知情同意的要求。
1.2 仪器和方法
1.2.1 超声检查
采用美国GE公司的Logiq E9(C1-5凸阵探头,频率2~5 MHz)和深圳迈瑞生物医疗电子股份有限公司Mindray Resona 7(SC5-1U凸阵探头,频率1~5 MHz)超声诊断仪行腹部超声检查。首先灰阶模式下找到病灶最佳切面,再切换至造影模式。超声造影剂为示卓安(Sonazoid),使用前注入生理盐水5 mL,配制成混悬液,经肘正中静脉快速团注造影剂0.5 mL,随后5 mL生理盐水冲管,同步计时录像,持续观察病灶动脉期、门脉期、延迟期及Kupffer期的增强、消退情况。采集并保存Kupffer期(8 min以后)[5]病灶的静态图像,所有图像均以DICOM格式存储。
1.2.2 病理组织学评估
根据中国临床肿瘤学会(Chinese Society of Clinical Oncology,CSCO)2022版原发性肝癌诊疗指南,2名经验丰富的病理科医师独立双盲对所有患者根据指南MVI评级标准评级,意见不统一时通过讨论达成一致。MVI评级标准如下:M0,未发现MVI;M1,≤5个MVI,且发生于近癌旁肝组织;M2,>5个MVI,或MVI发生于远癌旁肝组织。
本项研究将患者分为两组:将MVI评级为 0级的患者定义为MVI阴性;将MVI评级为1~2级的患者定义为MVI阳性[11]。
1.2.3 临床信息
收集患者的临床病理学参数,包括性别、年龄、巴塞罗那临床肝癌(Barcelona Clinic Liver Cancer,BCLC)分期、MVI分级、肿瘤大小、肿瘤病理分化等级、甲胎蛋白(alpha-fetoprotein,AFP)、癌胚抗原(carcinoembryonic antigen,CEA)、糖类抗原(carbohydrate antigen,CA)125、CA153、CA19-9、细胞角蛋白(cytokeratin,CK)19、CK7和Ki-67增殖指数。
1.2.4 超声图像分割与特征提取
由1名有6年腹部超声工作经验的医师使用ITK-SNAP(http://www.itksnap.org,版本4.0.1)基于Sonazoid超声造影Kupffer期图像手动分割肿瘤感兴趣区(region of interest,ROI)并储存为Nii格式,另1名有10年超声工作经验的高年资医师对所有勾画好的靶区进行修正。将原始图像和勾画好ROI的图像输入Onekey AI平台提供的OKT-crop_max工具,截取每个病灶的最大切面并储存为PNG格式。
基于Onekey AI平台提供的ResNet101模型对所有PNG格式图像进行迁移学习,使用ResNet101倒数第二层avgpool层提取深度学习特征2 048个。PyRadiomics[12]用于提取影像组学特征1 239个,提取的特征均来源于原始图像和勾画好靶区的图像,包括7种类型:① 形状特征 17个;② 一阶特征247个;③ 灰度级依赖矩阵特征182个;④ 灰度级形状矩阵特征208个;⑤ 相邻灰度差矩阵特征65个;⑥ 灰度级长度矩阵特征208个;⑦ 灰度共生矩阵特征312个。所有特征通过Z-score算法标准化处理,转化为统一量度进行比较。
ResNet101是一种深度卷积神经网络模型,使用残差块来构建深度网络,使得网络可以更加容易地进行训练,因此近年来在医学图像识别任务中取得了较好的效果[13]。迁移学习是在预训练模型的基础上继续对深层次模型进行训练,从而训练出特定的模型参数,其优势在于训练时间大大缩短且效果比较理想;当数据集较少时,也能训练出理想的效果[14]。因此我们尝试使用ResNet101模型通过迁移学习来提高模型预测MVI的效能。
1.2.5 特征筛选与模型构建
为了避免过拟合,将经Z-score标准化处理后的目标特征采用Mann-Whitney U检验筛选组间差异有统计学意义的深度学习特征和影像组学特征。为了减少冗余特征,用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)算法进行特征降维,并采用10折交叉验证筛选与MVI最相关的18个深度学习特征和19个影像组学特征。LASSO回归用于构建深度学习模型和影像组学模型,同样采用10折交叉验证对模型进行训练以选择最优参数从而提高模型稳定性,我们还基于临床特征构建一个临床模型。每个特征与其回归系数相乘后求和得到每例患者的深度学习评分和影像组学评分。LASSO回归是在常用的多元线性回归中添加惩罚函数,不断压缩系数,从而达到精简模型的目的,以避免共线性和过拟合。
1.3 统计学处理
采用SPSS 23.0统计学软件处理临床数据,利用单因素及多因素logistic回归分析筛选组间差异有统计学意义的临床参数。基于R 4.2.3及相应的R包筛选特征和构建模型。计数资料以n(%)表示,采用χ2检验进行组间比较。服从正态分布的计量资料用x±s表示,采用t检验进行组间比较;符合偏态分布的计量资料以M(Q1,Q3)表示,采用Mann-Whitney U检验进行组间比较。双侧P<0.05为差异有统计学意义。评估模型诊断效能的参数包括受试者工作特征曲线的曲线下面积(area under curve,AUC)、灵敏度、特异度和准确度。
2
结 果
2.1 临床信息
本研究最终纳入146例患者(表1):包括MVI阳性的患者49例(33.56%),MVI阴性的患者97例(66.44%)。以7∶3将患者随机划分为训练集102例和验证集44例(图1),包括122例(83.56%)男性和24例(16.44%)女性患者,年龄26~84岁,平均(51.27±10.29)岁。
单因素和多因素logistic回归分析结果示,血清AFP和BCLC分期组间差异有统计学意义(P<0.01),该结果表明AFP和BCLC分期可作为HCC患者MVI的独立预测因子(图2,表2)。
图1 患者筛选流程图
图2 术前预测肝细胞癌MVI的临床参数
A:血清AFP在有MVI和无MVI组间差异有统计学意义;B:BCLC分期在有MVI和无MVI组间差异有统计学意义。
2.2 筛选特征
Z-score标准化处理后的目标特征经过Mann-Whitney U检验筛选组间差异特征,将排名前50的深度学习特征和影像组学特征采用LASSO进行降维,得到18个与MVI最相关的深度学习特征用于构建深度学习模型和19个与MVI最相关的影像组学特征用于构建影像组学模型。包括深度学习特征18个,灰度级形状矩阵特征6个,灰度共生矩阵特征3个,灰度级依赖矩阵特征2个,灰度级长度矩阵特征4个,相邻灰度差矩阵特征4个(图3,表3)。
图3 深度学习特征和影像组学特征筛选流程
A~C:影像组学特征筛选流程;D~F:深度学习特征筛选流程。A、D:通过聚类热图可视化影像组学特征和深度学习特征;B、E:LASSO回归筛选与MVI最相关的影像组学特征和深度学习特征;C、F:影像组学特征和深度学习特征按权重可视化排列。
2.3 深度学习模型、影像组学模型和临床模型的预测效能
在训练集中,深度学习模型的AUC(95% CI)为0.931(0.880~0.981),灵敏度87.5%,特异度90.3%,准确度89.2%;影像组学模型的AUC(95% CI)为0.823(0.744~0.903),灵敏度87.5%,特异度66.1%,准确度74.5%;临床模型的AUC(95% CI)为0.719(0.614~0.824),灵敏度67.5%,特异度72.6%,准确度70.6%。在验证集中,深度学习模型的AUC(95% CI)为0.895(0.757~1.000),灵敏度88.9%,特异度82.9%,准确度84.1%;影像组学模型的AUC(95% CI)为0.711(0.514~0.909),灵敏度77.8%,特异度51.4%,准确度56.8%;临床模型的AUC(95% CI)为0.606(0.390~0.822),灵敏度55.6%,特异度62.9%,准确度61.4%(图4,表4)。DeLong检验结果表明在训练集和验证集中,深度学习模型的诊断效能均优于影像组学模型和临床模型(表5)。
本研究中的深度学习模型(ResNet101)是一种深度卷积神经网络,是在预训练模型的基础上通过迁移学习继续对深层次模型进行训练(图5),从而提取深度学习特征用于构建深度学习模型,研究结果显示深度学习模型的预测效能表现优异。
图4 深度学习模型、影像组学模型和临床模型的ROC曲线
A:在训练集中,深度学习模型、影像组学模型和临床模型的ROC曲线;B:在验证集中,深度学习模型、影像组学模型和临床模型的ROC曲线。
图5 ResNet101模型迁移学习过程可视化
A~C:可视化ResNet101模型迁移学习有MVI病灶;D~F:可视化ResNet101模型迁移学习无MVI病灶。A、D:基于Sonazoid超声造影Kupffer期的肿瘤原始图像;B、E:迁移学习识别病灶区域的热图;C、F:可视化ResNet101模型所识别的病灶区域。
3
讨 论
本研究中,基于HCC的Sonazoid超声造影Kupffer期图像,使用Onekey AI平台提供的ResNet101模型通过迁移学习提取深度学习特征,采用开源软件PyRadiomics提取影像组学特征。所有特征通过降维后得到与MVI最相关的18个深度学习特征和19个影像组学特征用于LASSO回归构建深度学习模型和影像组学模型,同时基于临床特征构建一个临床模型。在验证集中,深度学习模型的AUC高达0.895,准确度84.1%;影像组学模型的AUC为0.711,准确度56.8%。DeLong检验结果显示不管是训练集还是验证集,深度学习模型的诊断效能均优于影像组学模型(P<0.05),这可能归因于深度学习模型的学习能力更强,所提取的特征更准确,这为其在未来成为无创预测MVI的方法提供了有力证据。本研究的优点在于使用术前影像学数据预测MVI,这将在更早的时间指导临床医师为患者选择合适的治疗方法从而改善患者的预后;另外我们通过DeLong检验比较模型间的性能,证实了深度学习模型的应用价值。
近年来,基于深度学习预测HCC患者MVI的研究屡见报道,但大多基于计算机体层成像(computed tomography,CT)和磁共振成像[15-16],基于超声的报道相对较少。Zhang等[17]的研究表明,基于术前超声造影视频的深度学习模型可作为预测HCC患者MVI状态的工具,用于预测患者预后。Qin等[18]的研究表明,基于超声造影图像的深度学习算法能够准确地预测HCC的MVI,帮助识别高危患者进行辅助治疗。目前基于Sonazoid超声造影Kupffer期的深度学习模型预测HCC患者MVI的研究尚未见报道,我们试图通过构建Sonazoid超声造影Kupffer期的深度学习模型来预测HCC的MVI,研究结果表明,深度学习模型在预测MVI方面具有较高的灵敏度、特异度和准确度。令人惊喜的是,最近一项研究[11]报道了基于Sonazoid超声造影Kupffer期图像预测HCC MVI的影像组学研究结果,但我们的研究具有相对大的样本量(146 vs 50)和相对高的AUC(0.895 vs 0.834)。此外Chen等[19]报道了基于组织学图像肿瘤区域的深度学习预测HCC MVI的研究,本研究基于Sonazoid超声造影Kupffer期图像的深度学习模型AUC与其相当(0.895 vs 0.871,0.895 vs 0.904),但Sonazoid超声造影Kupffer期图像的获取相比组织学全玻片图像(WSI)更加快速、便捷。
既往研究[20-22]显示,众多临床因素与HCC的MVI相关,包括AFP、肿瘤大小、肿瘤数目等。本研究通过单因素和多因素logistic回归分析表明AFP和BCLC分期也与MVI相关,可作为MVI的独立预测因子(P<0.01)。AFP>400 ng/mL的患者MVI的发生率更高,这与前人的研究[23]一致;本研究中BCLC分期为B、C期的患者MVI的发生率也较高。这些发现都将为患者的个性化治疗提供参考。
虽然本研究结果令人鼓舞,但也存在不足:第一,本研究是单中心回顾性研究,可能导致选择性偏倚并缺乏普遍性,未来拟将进行前瞻性、多中心数据整合以及外部验证研究来提高模型的临床适用性。第二,样本量相对较少,未来扩大样本量对模型进行训练,有望提高模型稳定性。第三,我们只用了Kupffer期的图像,未来将联合动脉期、门脉期及延迟期图像来训练模型,从而提高其效能是必要的。第四,我们只用了超声图像,未来将联合CT和磁共振成像等多模态数据训练模型也是有必要的。
综上所述,基于Sonazoid超声造影Kupffer期的深度学习模型在预测HCC的MVI方面表现出优异的性能,有望在未来成为预测MVI的无创性影像学生物标志物,从而指导临床手术决策和患者个性化治疗。
[参考文献]
编辑:徐虹
审核:倪明