“北京医院泌尿外科研究生学习实录”旨在分享北京医院泌尿外科研究生定期学习中的新发现、新感想,为关注的同道提供最新的文献和解读,诚挚欢迎各位同道与我们共同学习、深入交流。
发表杂志:《NPJ precision oncology》
发表时间:2023年12月
DOI: https://doi.org/10.1038/s41698-023-00481-x
文献分享:A deep learning model, NAFNet, predicts adverse pathology and recurrence in prostate cancer using MRIs
分享人:李晗
联系方式:010-85136272
邮箱:hanli@student.pumc.edu.cn
前列腺癌是男性癌症死亡的第五大原因,每年有140万新发病例和37.5万例死亡。约29%的患者术后Gleason评分升级,25%出现不良病理(AP),导致生化复发(BCR)或转移。
多参数MRI(mpMRI)在前列腺癌诊断、治疗计划和AP预测中具有重要作用,但现有基于放射组学的机器学习方法效率较低。
本研究提出一种新型深度学习模型NAFNet,采用无非线性激活函数设计,具备像素级特征提取能力,与ResNet50相比在计算成本更低的情况下实现先进性能。
研究通过整合NAFNet与术前临床变量,开发列线图预测AP和BCR,并验证其在外部队列中优于CAPRA和PI-RADS评分。
接受根治性前列腺切除术(RP)且术前完成mpMRI,无新辅助或辅助治疗史,术前3T高质量MRI图像,且图像中可见病灶。
内部队列包括2019至2021年复旦大学肿瘤医院的367名患者,随访中位时间为10个月;外部队列包含147名来自五家三级医院的患者,随访中位时间为32个月。
BCR定义为术后PSA水平≥0.2ng/mL两次以上;bRFS为RP至BCR的间隔;AP包括ISUP≥4、广泛阳性切缘、精囊侵袭、盆腔淋巴结转移等。
内部和外部队列间的变量无统计学差异。
为探讨NAFNet的算法优势,研究将其与计算机视觉和医学影像深度学习中广泛使用的ResNet50进行了比较。
NAFNet分类器与ResNet50分类器在MRI图像上的预测结果如图2a所示:蓝色区域表示AP事件概率最低,红色区域表示AP事件风险最高。对比无AP患者(左图)与确诊AP患者(右图),NAFNet分类器在预测AP事件的表现上明显优于ResNet50。
通过外部测试集的ROC曲线分析显示,NAFNet分类器的AUC值为0.799(95%CI: 0.724−0.873),显著高于ResNet50分类器的AUC值0.703(95%CI: 0.618−0.787,P=0.013)(图2b)。决策曲线分析(DCA)进一步表明,NAFNet分类器在AP预测中相比ResNet50提供了更大的临床效益(图2c)。
图2:NAFNet分类器与ResNet50分类器在预测不良病理(AP)能力上的比较
(a) NAFNet分类器和ResNet50分类器在MRI图像上的AP预测结果可视化。左侧为无AP事件患者的MRI图像,NAFNet分类器预测的AP概率为0.126,ResNet50分类器为0.151;右侧为有AP事件患者的MRI图像,NAFNet分类器预测AP概率为0.632,ResNet50分类器仅为0.264。右侧的颜色条表示识别区域内每个像素的AP事件概率,红色表示概率较高,蓝色表示概率较低。 (b) 接收器工作特性曲线(ROC)显示,NAFNet分类器在外部测试集中的AUC(0.799)明显高于ResNet50分类器的AUC(0.703)。 (c) 决策曲线分析(DCA)表明,NAFNet分类器在预测AP事件方面提供了比ResNet50分类器更高的净收益。
为进一步构建基于深度学习的列线图(DL-nomogram),研究结合NAFNet分类器和其他临床病理变量。通过多变量逻辑回归分析发现,NAFNet分类器(作为连续变量)、临床T分期和穿刺活检ISUP评分是AP事件的显著预测因子,而PI-RADS评分和PSA值的预测能力不足(图3a)。因此,基于上述三项变量构建了DL-nomogram(图3b),其中NAFNet分类器权重最高。
此外,研究还将NAFNet分类器作为二分类变量(采用最佳阈值为分界)进行逻辑回归分析,但ROC分析结果表明,将NAFNet分类器作为连续变量在AUC上具有更大优势。因此,在后续分析中将其视为连续变量。
图3:基于NAFNet分类器和临床变量构建DL-nomogram
(a) 森林图显示基于内部数据集的多变量逻辑回归分析结果,用于预测不良病理(AP)事件。其中,NAFNet分类器被视为连续变量,结果表明NAFNet分类器、穿刺ISUP评分和临床T分期均为显著预测因素。(b) 列线图(DL-nomogram)整合了NAFNet分类器、穿刺ISUP评分和临床T分期,用于预测AP事件。
为验证深度学习模型的性能,研究对外部测试集中NAFNet分类器、DL-nomogram、临床评分(CAPRA)、放射评分(PI-RADS)和ResNet50分类器的AP预测能力进行了评估。
结果显示(图4a),尽管NAFNet分类器与CAPRA临床评分的AUC差异未达到统计学显著性(P=0.334),但DL-nomogram的AUC值显著高于CAPRA评分(P<0.001)。其中,DL-nomogram的AUC最高(0.915,95% CI: 0.871-0.959),准确率也最高(0.850)。
决策曲线分析(DCA)进一步表明,与其他模型相比,DL-nomogram提供了更高的净收益(图4b)。根据补充表1中列出的阈值,研究将五种模型的预测结果可视化(图4c)。
热图显示,DL-nomogram的预测结果与标准金指标的一致性最佳,其次是NAFNet分类器,再依次为PI-RADS评分、CAPRA评分和ResNet50分类器。
图4:多种模型在预测不良病理(AP)事件中的性能分析
(a) 各模型的ROC曲线显示,DL-nomogram的AUC最高,优于NAFNet分类器、PI-RADS评分、CAPRA评分和ResNet50分类器。(b) 决策曲线分析(DCA)表明,DL-nomogram在预测AP事件中提供了最大的净收益,与其他模型相比表现更优。(c) 热图可视化了各模型对AP事件的预测结果。结果显示,DL-nomogram的预测结果与标准金指标一致性最高,其次为NAFNet分类器,随后依次为PI-RADS评分、CAPRA评分和ResNet50分类器。
为全面评估NAFNet分类器模型的预测潜力,研究对其在bRFS预测中的能力进行了分析。在外部测试集中,分别使用NAFNet分类器、PI-RADS评分、DL-nomogram和临床评分(CAPRA)进行Kaplan-Meier生存分析,预测bRFS。每个模型的临界值通过ROC曲线的最佳阈值确定。
结果表明(图5),四种模型均能够对外部测试集患者的bRFS进行分层预测。其中,DL-nomogram的C指数从CAPRA评分的0.643(95%CI: 0.586-0.700)提高到0.732(95%CI: 0.671-0.793),表现出在bRFS预测中的显著潜力。
图5:不同模型在预测生化复发生存(bRFS)中的Kaplan-Meier分析
(a) 基于DL-nomogram的bRFS生存曲线;(b) 基于NAFNet分类器的bRFS生存曲线;(c) 基于放射评分(PI-RADS)的bRFS生存曲线;(d) 基于临床评分(CAPRA)的bRFS生存曲线。各模型的截断点均来源于对应ROC曲线的最佳阈值。结果显示,DL-nomogram在bRFS预测中表现优于其他模型,具有更高的预测能力。
由于ISUP评分≥4是AP的标准之一,研究旨在扩展NAFNet分类器用于术前预测临床显著性前列腺癌(csPCa)。多变量逻辑回归分析证实,NAFNet分类器、临床T分期(cT stage)和PSA值均可预测术后ISUP高风险组(补充表4)。
随后构建了DLPT列线图(将NAFNet分类器与PSA和cT分期整合),其术后ISUP高风险预测性能显著优于临床评分(PBCG)(P=0.003)。此外,单独使用NAFNet分类器的表现也优于PBCG评分。
本研究评估了深度学习模型NAFNet在术前mpMRI图像中的应用潜力。由于NAFNet具备像素级分割能力,其在预测不良病理(AP)方面优于传统模型ResNet50。
NAFNet分类器不仅单独表现优异,还通过整合临床T分期和穿刺ISUP评分显著提升了预测能力。
基于此构建的DL-nomogram在预测AP和生化复发生存(bRFS)方面优于CAPRA评分和PI-RADS评分,展现出非侵入性、快速、低成本且高效的人工智能工具的潜力,为精准识别不适合主动监测和可能从辅助治疗中获益的患者提供了新方法。
本研究的优势包括:使用NAFNet这一无非线性激活函数的新型深度学习框架,降低计算成本的同时保持出色性能;基于全切病理(WSI)数据训练模型,提升标注准确性;在五个外部机构的数据上独立验证模型,证明其鲁棒性和适应性。相比于CAPRA和PI-RADS评分,DL-nomogram在DCA曲线中表现出更高的净收益,为患者治疗决策提供支持。
然而,本研究存在一定局限性:外部测试集中不同机构的病理结果可能存在差异;ROI由放射科医生手动标注;随访时间不足以直接评估转移;深度学习模型的特征可解释性较弱,需进一步优化以平衡复杂性和可解释性。
尽管如此,本研究构建的DL-nomogram在术前前列腺癌风险分层中表现优异,未来通过进一步外部验证,有望革新局限性前列腺癌患者的风险评估与管理。
刘明 教授
中华医学会泌尿外科学分会常务委员,中华医学会泌尿外科学分会泌尿男科工程学组组长,北京医学会泌尿外科学分会副主任委员兼秘书,亚洲机器人泌尿外科协会(ARUS)教育培训委员会委员,中国抗癌协会泌尿男生殖系肿瘤专业委员会微创学组副组长,NCCN前列腺癌指南国际评审专家,海峡两岸医药交流协会肿瘤防治专业委员会委员。
侯惠民
北京医院泌尿外科,临床医学博士,专业方向:前列腺癌,良性前列腺增生。
承担和参与“十二五”“科技部国家重点研发计划”在内多项省部级课题,对前列腺癌精准诊断和综合治疗进行探索实践,发表相关成果论文十余篇。
北京医院前列腺癌MDT团队成员,负责患者治疗计划制定与随访。
中华医学会泌尿外科分会泌尿男科工程学组秘书;中华医学会老年医学分会泌尿肿瘤青年联盟发起者;中国医药教育学会科普教育中心泌尿外科专业组委员;中国抗癌协会泌尿肿瘤整合康复委员会委员;北京慢性病防治与健康教育研究会老年泌尿疾病筛查与防治委员会委员兼秘书长。
声明:本内容仅供医学药学专业人士阅读,不构成实际治疗建议。转载请后台联系授权,侵权必究!
编辑:吴梦霞
审核:黄鹏程
👇
★ 启程医路 携手前行 ★
点击了解
★ 启程医路 携手前行 ★
点击了解
▼
为了方便泌尿男科医生交流、分享, 学习联盟特意搭建了学习联盟微信群, 欢迎扫码获取入群方式!
▼