点击上方 蓝字 关注我们 了解更多资讯
王志林,朱晓雷,张潇文,冯义辉,潘剑云,姜杰,耿国军
厦门大学附属第一医院 胸外二科(福建厦门 361003)
通信作者:姜杰,Email:jiangjie06@126.com;耿国军,Email:ggj622@126.com
关键词:非小细胞肺癌;人工智能;病理学;预后预测;综述
引用本文:王志林, 朱晓雷, 张潇文, 等. 人工智能在非小细胞肺癌病理学和预后中应用的研究进展. 中国胸心血管外科临床杂志, 2022, 29(9): 1223-1229. doi: 10.7507/1007-4848.202205033
Wang ZL, Zhu XL, Zhang XW, et al. Research progress on the application of artificial intelligence in the pathology and prognosis of non-small cell lung cancer. Chin J Clin Thorac Cardiovasc Surg, 2022, 29(9): 1223-1229. doi: 10.7507/1007-4848.202205033
摘 要
非小细胞肺癌是全球癌症死亡的主要原因,其发病率逐年升高,严重危害人类健康。早期的非小细胞肺癌依据症状体征一般难以被发现,因此准确的病理学诊断、精准的预后预测对于非小细胞肺癌患者制定最佳治疗计划、改善患者生存期至关重要。人工智能在非小细胞肺癌诊疗中的应用已显示出良好的性能和巨大的潜力,本文介绍了人工智能在预测非小细胞肺癌分型、分期、基因组学和预后方面的研究进展。
1
人工智能概述
人工智能(artificial intelligence,AI)是计算机模拟人类某些思维过程和智能行为的应用[6]。AI的核心是机器学习,通过应用数学和统计方法来提高计算机的性能,包括有监督或无监督的方法。机器学习可应用于癌症筛查,如乳房X光检查中的计算机辅助检测,显著增加了放射科医生筛查乳腺癌的敏感度[7]。诸多研究[8-13]表明,通过机器学习方法提取病理学信息可确定恶性肿瘤的亚型,包括肺癌、前列腺癌、结直肠癌和卵巢癌等。这些计算方法可以与其它临床评估方法相辅相成,提高组织病理学评估的性能、正确性和稳定性[14]。
深度学习是机器学习广义上的子领域,其工作原理是通过计算机自动生成大量人工神经网络的连接,这些网络的功能类似于人类大脑。深度学习具有直接从原始图像生成高级特征信息的优势,被证明可以在分割、分类和预测等各种任务中产生精准的结果,已成为医学成像领域的领先机器学习工具[15-18]。其中,卷积神经网络(convolutional neural networks,CNN)是常用于癌症图像分类的深度学习模型,包括迁移学习和自动编码器等方法。它通过一系列连续的线性和非线性层将成像滤波器与人工神经网络结合起来,能够以良好的性能检测肿瘤[15, 18-21]。例如,通过正电子发射计算机断层显像判断淋巴结的转移情况,结果发现深度学习的敏感性高于放射科医师,但特异性低于放射科医师[22]。
AI技术在预测NSCLC患者的预后中已经取得了很好的验证[23]。根据临床因素准确地将NSCLC患者分型、分期是癌症治疗的关键一步。到目前为止,临床医生还不能确定哪些早期NSCLC患者术后可能复发,但AI可以协助医生更准确地预测[17]。因此,本文综述了AI技术在NSCLC患者诊断、治疗以及预后中的最新进展和应用。
2
人工智能预测非小细胞肺癌分型
病理学切片的目测检查是肿瘤组织学分型的主要评估方法之一,通过活检或手术等侵入性手段来获取组织,人工阅片具有效率低、易出现疲劳阅片现象等缺点。另有研究[24]表明,视觉评估在某些肿瘤亚型和阶段的诊断病例中被证明是不准确和不可重复的。NSCLC的病理学评估对于患者的诊断至关重要,而AI的应用在提高诊断精度和帮助减少人为错误方面具有巨大潜力。
NSCLC可分为3种主要的组织学类型:鳞癌、腺癌和大细胞癌。其中,肺腺癌和肺鳞癌的组织学特点的区别不明显,尤其是低分化肿瘤。由于不同类型肺癌的治疗方法有很大的差异,基于AI技术的计算机视觉算法在图像分类方面表现出了非常好的性能,帮助病理科医师检测肺癌类型[25-28]。例如,Yu等[29]将传统的阈值处理、图像处理技术与随机森林分类器、支持向量机或朴素贝叶斯分类器等机器学习方法相结合,结果显示该方法在区分正常和肿瘤切片的曲线下面积(area under the curve,AUC)为0.85,区分肺腺癌和肺鳞癌切片的AUC为0.75;Khosravi等[30]基于CNN的深度学习方法构建了一个独立的管道来有效地对肺腺癌和肺鳞癌1 520个苏木精-伊红染色(hematoxylin-eosin staining,HE染色)的全切片组织病理学图像以及1 629个HE染色的高分辨率图像进行分类,结果显示基于斯坦福组织微阵列数据库(TMAD)和TCGA图像的肺部肿瘤亚型鉴别的准确率高达92%和100%,其中基于TCGA图像的肺部肿瘤类型分类的AUC为0.83。Coudray 等[15]基于TCGA的1 634个全幻灯片图像构建了一个深度CNN,包括1 176个肿瘤组织和459个正常组织,该深度学习模型的敏感性和特异性为89%和93%。通过分类模型,将全载玻片图像分类为正常肺、肺腺癌或肺鳞癌,其准确性(AUC为0.97)显著高于既往研究(AUC为 0.75和 0.83)[29-30],该模型性能与病理科医师的诊断相当。
肺腺癌的亚型繁多,包括微小浸润性腺癌、浸润性非黏液性腺癌、浸润性黏液腺癌、胶样肺腺癌、肿瘤型腺癌(肺胎儿腺癌)、肠型肺腺癌等[31-32]。识别肺腺癌的组织学亚型对于肿瘤预后和治疗极为重要,但对此类模式进行准确分类具有一定的挑战性。一项研究[33]发现,对肺泡结构的维持或丧失的不同评估导致了腺泡和贴壁模式的不同分类,并且当两者混合时,乳头状和微乳头状亚型的主要-次要分类是有争议的。此外,即使是少量容易被忽视的高级模式也已被证明与更差的预后相关,尤其是对于微乳头亚型[34]。由于病理学家之间缺乏一致性以及同一患者多种组织学模式的混合,亚型的分类对病理学家来说仍然是一个不小的挑战。Wang等[35]回顾性纳入3个医疗机构共1 222例非典型腺瘤样增生、原位腺癌、微浸润性腺癌、浸润性腺癌5种主要成分的匿名术前CT图像和病理标记,基于深度学习、放射组学策略和深度放射组学组合算法对组织学亚型的分类任务进行了建模,结果发现深度放射组学算法表明在2类(包括非典型腺瘤样增生、原位腺癌+微浸润腺癌),3类(无微乳头状或实性成分组、无微乳头状或实性成分组和以微乳头状和实性成分为主的组)分类中AUC分别达到0.8776和 0.8061;在8个分类(包括非典型腺瘤样增生、原位腺癌、微浸润腺癌、鳞状腺癌、腺泡腺癌、乳头状腺癌、微乳头状腺癌和实性腺癌)中,内部验证的AUC为0.739~0.940,其结果显示AI在检测肺腺癌亚型分类中取得了很好的表现。
Xiao等[36]从TCGA纳入162个RNA数据集(肺腺癌n=135,对照组n=37),基于深度学习的多模型方法取得了令人满意的结果,区分肺腺癌与正常肺组织的准确率达到了99.20%,在肺腺癌预测中明显优于单个经典分类器。Wei等[28]选取143例独立的肺腺癌数据集,该模型使用CNN来识别肿瘤细胞的区域,然后聚合这些分类以推断任何给定数据的主要和次要组织学亚型。结果显示AI模型的Kappa系数为0.525,与3位病理学家对主要模式进行分类的一致性为66.6%;病理学家Kappa系数为0.485,在该测试集上的一致性为62.7%,其结果略微优于3位病理学家的判读结果。
通常,许多研究选择了NSCLC的全切片图像和基因图谱的大型数据集来训练深度学习模型或机器学习模型以构建稳健的AI方案,随后在另一个独立的数据集中进行了验证[37-38]。与机器学习算法相比,能力不断增强的CNN算法可能更适合区分NSCLC的异质性,尤其是数字整片。通过处理技术诊断NSCLC 的定量图像和遗传特征在提高组织病理学评估的效率、准确性和一致性方面具有价值。因此,AI技术在组织学图像和基因图谱中都可以作为肺腺癌病理亚型有前途的诊断工具。
3
人工智能预测非小细胞肺癌分期
目前NSCLC的分期基于肿瘤的大小和范围、扩散至淋巴结的程度以及转移程度。由于晚期Ⅱ~Ⅳ期患者难以提高生存率,治疗方法应根据疾病进展量身定制,因此对早期患者进行准确分期至关重要[39]。据报道[40],基因表达变异在肿瘤进展和转移中具有关键作用,因此表明遗传生物标志物用于检测和分类NSCLC亚群的可行性。尽管基因谱已被确定为临床诊断或 NSCLC 结果的预测因子,但尚未确定基因谱是否可用作病理分期标志物。Choi等[41]研究了通过联合自动编码器网络、CNN的级联深度学习方法,从癌症影像档案的公共领域获得了6个具有病理分期信息的NSCLC队列,使用预处理计算机断层扫描来分类早期和晚期NSCLC。结果表明,在CPTAC队列中,与其它方法(AUC为0.6824~0.7206)相比,基于级联深度学习模型的NSCLC早期分类的准确性达到了0.8649,敏感度为0.8000,特异性为0.9412,AUC为0.8206。另外,该模型在TCGA队列中的NSCLC患者分期也显示出了良好的结果,其准确性为0.8077,灵敏度为0.7692,特异性为0.8462,AUC为0.8343。
Dong等[42]纳入TCGA 的369个肺腺癌转录组测序数据(甲基化数据和拷贝数变异),开发了一种基于机器学习的MLW-gcForest模型,其整合多模态遗传数据在肺腺癌分级(准确度为0.908,精度为0.896)中取得了更好的分类性能,有效提高了肺腺癌分期的准确性,明显优于传统的机器学习算法。此外,Yang等[40]从TCGA数据库纳入600个肺腺癌病例数据集,通过16-miRNA特征选择和支持向量机分类器来构建模型,结果发现分类模型具有准确区分肺腺癌病理阶段的能力,16-miRNA 特征可以作为肺腺癌病理分期的有希望的诊断生物标志物。
通常,基因突变在肿瘤进展和肿瘤表型中起关键作用。尽管上述研究中鉴定的早期肺癌特征基因的表达谱具有预测准确和稳健的NSCLC分期能力,但与常规临床变量相比,AI技术应通过更多研究进行验证。
4
人工智能在非小细胞肺癌基因组学中的应用
基于组织的病理诊断是当前的金标准,但具有取样误差、原发性肿瘤和转移部位之间的生物学异质性等局限性[43]。放射生物基因组学是指识别检测到的病变中的生物基因组、蛋白质组改变,涉及图像分割、特征提取和机器学习模型,以预测潜在的肿瘤基因型和临床结果,提高临床诊断的特异性、表征病变内的异质性,有助于肿瘤治疗的选择和预后。
Coudray 等[15]从TCGA下载了匹配患者样本的基因突变数据,训练CNN来预测肺腺癌中10个最常见的突变基因,结果发现其中6个突变基因STK11、EGFR、FAT1、SETBP1、KRAS和TP53的AUC值为0.733~0.856,这说明深度学习模型可以精准地帮助病理学家检测癌症基因突变。Shiri等[44]收集了NSCLC患者的186个正电子发射计算机断层显像图像和175个低剂量计算机断层扫描和对比增强诊断质量CT图像,提取了2万多个放射性特征,采用6种特征选择方法和12种分类器来预测患者的EGFR和KRAS 基因突变状态;结果发现机器学习算法比常规临床放射特征方法有更好的预测能力,其中EGFR的AUC为0.82,KRAS的AUC为0.83。
Kobayashi等[45]通过添加元素输入缩放使用基于深度学习(CNN和循环神经网络)的方法进行基因型-表型关联研究,选取950个NSCLC数据集,根据体细胞突变(即单核苷酸变异、插入和缺失)预测肺癌的组织学类型,发现了KRAS、EGFR、STK11和SETD2基因中的大多数似乎仅在肺腺癌中发生突变,而不是在肺鳞癌;STK11和KRAS突变在肺腺癌中的频率比肺鳞癌高得多,KRAS在肺腺癌中的突变频率是在肺鳞癌中的26倍,该模型实现了约80%的预测准确率。Wang等[46]通过深度学习无监督类型中的去噪自编码器来分析13个已发表数据库中的1 916个肺癌转录组数据,发现了35个基因特征(与一些癌症相关的KEGG术语显著相关,比如p53信号通路)可以作为肺腺癌的诊断、病理分型和预后的生物标志物,且这35个基因特征预后预测能力优于其它已发表的数百个预后基因[47-52]。
在临床治疗过程中,统一病理亚型的NSCLC在分子水平上可能有很大的表达差异,因此对治疗的反应也不同,其中EGFR基因突变或ALK基因重排等基因改变对NSCLC预后具有预测意义。例如,病变中不规则边界和毛玻璃样混浊的存在与肺癌中EGFR的表达相关,可通过放射基因组学鉴定肺癌中EGFR的表达以及其它转录因子[53]。随着靶向疗法的出现(例如,程序性死亡受体1、程序性死亡配体1等),由AI驱动的放射基因组学有助于患者的靶向精准治疗[54]。因此,放射组学有助于早期NSCLC的检测、评估治疗效果和预测治疗相关结果。
5
人工智能预测非小细胞肺癌预后
早期肺腺癌手术治疗后,ⅠB期或更晚期疾病患者通常接受辅助化疗,生存率提高5%~10%,而近一半的肺腺癌有复发和随后的疾病进展[38]。此外,HE 染色图像中的一些形态特征与病理诊断和预后显著相关,临床工作者不易识别。然而,通过CNN和递归神经网络(CNN和循环神经网络)等深度学习方法分析NSCLC患者的CT图像,进行多时间点研究来预测NSCLC患者的生存率、进展、转移和复发等相关临床结局[38]。Yu等[29]的研究从TCGA中获取2 186例肺腺癌和鳞癌患者HE 染色的组织病理学全幻灯片图像来预测鳞癌患者的存活率,结果显示在 TCGA队列中超过50%的Ⅰ期腺癌患者在初次诊断后5年内死亡,而约15%的患者存活超过10年。通过机器学习方法来分析9 879个定量图像特征选择顶级特征,在TCGA数据集中区分Ⅰ期腺癌(P<0.003)或鳞癌(P=0.023)的短期生存者和长期生存者。通过构建Cox比例风险模型,结合HE染色的显微镜病理图像计算出肿瘤患者的生存指数,也成功区分了Ⅰ期腺癌队列中的长期生存者和短期生存者。该项研究表明了基于定量特征的组织病理学图像分类器可以成功预测肺腺癌和肺鳞癌患者的生存结果,这种能力优于病理学家。
Lee等[55]提出了一种基于神经网络的危险函数和总生存时间预测模型,使用临床病理变量来预测术后NSCLC患者在时间序列间隔内的复发概率。该模型不需要一些假设,简单地解决CoxPH模型需满足比例风险假设和线性变量的问题[56-59]。该研究纳入了1 320例手术切除NSCLC患者的临床病理特征(训练队列1 022例,外部验证队列298例),结果发现使用监督分类时间生存分析(su-DeepBTS)模型作为选择器可以有效区分经手术切除的NSCLC患者中的低风险组和高风险组(P=1.86×10-11)和验证群组(P=1.04×10-10)。对每个模型进行最优特征集训练时,su-DeePBTS模型比传统模型能更好地预测NSCLC预后,特别是在Ⅰ期患者中;因此该模型可作为深度学习的应用来预测肿瘤复发。
Hosny等[16]对5家机构的7个独立数据集中1 194例NSCLC患者的CT成像进行综合分析,以发现和验证CNNs在接受放疗和手术治疗的患者中的预后能力。研究发现,CNN预测与放疗开始后的2年总生存率(AUC=0.70)和手术(AUC=0.71)显著相关。CNN还能够在放疗和手术数据集中显著地将患者分为低死亡风险组和高死亡风险组。该研究证明了肿瘤内部和外部的区域,特别是肿瘤间质界面对预后特征有最大的贡献,突出了肿瘤周围组织在患者分层中的重要性。Siah等[60]分析了美国食品药品监督管理局17个随机临床试验中的8 925例患者。该模型预测样本外数据的无进展生存期(progression-free survival,PFS)和总生存期 (overall survival,OS)的 C 指数分别为 0.67 和 0.73。PFS和OS的校准图表明实际和预测的生存率之间有很好的一致性。此外,Kaplan-Meier生存曲线显示,低风险组和高风险组之间的生存差异对于PFS和OS都是显著的(对数秩检验P<0.001)。在接受免疫检查点抑制剂和酪氨酸激酶抑制剂治疗的患者中,生物标志物检测呈阳性的患者比检测呈阴性或未检测的患者具有更高的OR和更有利的 PFS。对于OS而言,生物标志物程序性死亡配体1、EGFR或ALK的存在与生存率提高相关。该项研究反映了与基于这些生物标志物的抗癌疗法个性化相关的临床益处。
6
总结
综上所述,基于AI在NSCLC病理学和预后中的应用已经取得了显著的效果。然而,AI在实际的临床应用中面临着许多困难。
首先,AI仍然不能完全精准获取图像中所有数据,比如显微图像中的图像伪影;伪影会严重影响图像质量,使AI的自动计算结果出现错误,这也是AI面对的挑战之一。其次,AI软硬件设备的巨大成本投入,训练数据需要广泛且代表性样本的疾病数据集,耗时长且成本高,目前缺乏相关的标准数据库、权威机构制定的标准化原则和完备的国家政策法规支持,这使得AI的实际应用困难重重。前人的研究大多是由放射学、病理学和肿瘤学等专家互相独立进行的,并专注于各自的领域;整合不同学科的数据和新旧技术有助于研究人员建立预测模型,多学科的融合也是AI要克服的困难。另外,AI在临床中的应用同样也面对伦理学方面的问题,当发生医疗纠纷时,谁为此负责?同时AI技术如果不能达到预期的效果,出现医疗纠纷的概率也会明显增加。最后,随着AI的高速发展,数据安全也是一个不容忽视的问题,我们应重视提高数据安全性和降低数据传输风险性。
尽管存在上述挑战,AI在NSCLC上的应用是非常有前景的,AI将来可能会取代一些昂贵的分子检测技术,提供更精确的生物标志物和组织病理学信息,以提升个性化癌症治疗水平,最终改进治疗决策。因此,AI将会是临床医师在预测NSCLC病理学和预后过程中迈向精确医学的高效方法和工具。
利益冲突:无。
作者贡献:耿国军、姜杰负责论文设计和修改;王志林、朱晓雷负责主要撰写、修改论文和查阅文献;张潇文、冯义辉、潘剑云负责汇总部分文献和参与修改部分论文。
参考文献略。
作者介绍
通信作者 姜杰
主任医师、教授、博士、博士研究生导师、厦门市拔尖人才、国务院政府特殊津贴专家、中国医师奖获得者、中国医院优秀院长获得者。原厦门大学附属第一医院院长、厦门大学附属第一医院学术委员会主席、专家委员会执行主任。
学术任职:《中国微创外科杂志》、《中国胸心血管外科临床杂志》《现代医院管理》、《中华医院管理杂志》编委,《中国卫生标准管理》,《中国继续医学教育》副主编。亚洲腔镜学会委员、世界华人胸外科学会常务理事;中华医学会胸心外科分会全国委员、中国医师协会智慧医疗专业委员会副主任委员、中国医师协会常务理事、中国医师协会胸外科医师分会常委兼副总干事;海峡两岸医药卫生交流协会胸外科专业委员会主任委员、海峡两岸医药卫生交流协会医院管理专业委员会副主任委员;福建省医师协会副会长、福建省海峡医药卫生交流协会会长、厦门市医师协会会长、厦门市医学会胸心外科分会名誉主任委员。
科研成果:主持参与了多项临床科研课题,其中《电视胸腹腔镜手术多学科临床应用的研究》被评为1997年厦门市科技进步二等奖,《经电视胸腔镜、纤维支气管镜介入诊疗新技术系列研究》获2010年福建省医学二等奖,《VATS在胸外科手术中的系列应用研究》获2014年厦门市科技进步二等奖,《互联网医疗健康服务平台》获2018年厦门市科技进步奖二等奖。近年来,在国内、外医学刊物上发表论文60余篇,SCI收录十余篇。主编出版专著四部《健康中国蓝皮书:社区首诊与健康中国分析报告(2017)》、《从规模到精细化服务—大型公立医院转型的探索与实践》、《胸外科电子病历管理》、《肺结节交互印证式诊断100例分析》,参与编著《胸外科疾病标准化诊疗术语》。获十项国家专利,其中一项发明专利;三项实用新型专利;六项计算机软件著作权。
学术成果:作为国内有影响的胸外科专家,具有扎实专业理论和丰富的临床经验。承担所属专业领域复杂疾病的会诊和治疗工作,是福建省胸外科领域带头人之一。高质量完成大量肺、食管及纵隔等肿瘤外科手术治疗,并能出色完成乳腺癌的早期诊断,手术治疗和术后综合治疗以及各类乳腺疾病的诊断和治疗。由他所领导的厦门大学附属第一医院胸外科手术台数居福建省前列。在科研方面,姜杰教授一直从事肺癌及食管癌早期诊断、早期治疗、肺癌及食管癌的综合治疗等研究,近年来致力于胸外科信息一体化诊疗平台的建设与研究。2016年、2017年姜杰教授作为厦门首位参加国际腔镜手术大会的医生,高水平展示《3D胸腔镜在食管癌手术中的临床应用》等学术报告,赢得国内外同行的一致认可。
通信作者 耿国军
厦门大学附属第一医院 胸外二科,医学博士,副教授,硕士研究生导师。
海峡两岸医药卫生交流协会胸外科分会常委兼副总干事
中国医药教育协会胸外科专委会秘书
福建省海峡医药卫生交流协会闽赣胸外科协作组副主任委员
福建省医学会胸外科分会青年委员会副主任委员
福建省医学会胸心血管外科学分会青年委员会副主任委员
中国妇幼保健协会妇幼微创专委会小儿胸外微创学组委员
福建省抗癌协会肺癌专业委员会青年委员
福建省抗癌协会食管癌专业委员会委员
福建省医学会创伤学分会委员
《中国微创外科杂志》编委
《中国胸心血管外科临床杂志》青委
本文编辑:董敏,刘雪梅
审校:雷芳
排版:张洪雪
推荐阅读
ChatGPT 应用于医学临床实践及伦理探索
精彩回顾|人工智能专题:2022—2023年(一)
《中国胸心血管外科临床杂志》人工智能论文集
18F-FDG PET/CT联合CT三维重建鉴别肺结节良恶性的回顾性队列研究
基于有限元方法的K-Clip手术过程再现及分析
长按或扫描二维码关注我们!