Nature Cancer|深度学习模型ENLIGHT-DeepPT预测癌症疗法显成效

学术   2024-09-18 00:06   四川  
长期以来,组织病理学一直被认为是癌症临床诊断和预后的金标准。近年来,在临床中使用肿瘤分子分析可以实现更准确的癌症诊断。如今,数字病理学快速发展,通过应用机器学习和人工智能方法提取嵌入在肿瘤切片中的临床相关信息。用苏木精和伊红 (H&E) 染色的组织全切片图像 (WSI) 已被用于计算诊断肿瘤:如对癌症类型进行分类;区分突变负荷高或低的肿瘤;识别基因突变;预测患者生存率;检测 DNA 甲基化模式和有丝分裂;量化肿瘤免疫浸润、肿瘤浸润淋巴细胞 (TIL) 和空间免疫细胞浸润等。
这些直接监督学习方法,都需要预测的每种药物或治疗提供特定的队列以提供的匹配响应数据。然而,这样的大规模数据现实中却很难获得。临床亟需一种不需要匹配的 WSI 和反应数据集进行训练的通用方法,一种利用患者的WSI来直接预测肿瘤反应的方法。

7月3日,由澳大利亚国立大学与美国国家癌症研究所共同合作,在Nature Cancer上发表了题为“A deep-learning framework to predict cancer treatment response from histopathology images through imputed transcriptomics”的论文,提出了一种名为ENLIGHT-DeepPT的深度学习框架,该框架通过模拟转录组数据来预测癌症治疗反应。该方法的创新性在于它是一个两步间接方法,首先使用深度学习模型DeepPT从H&E染色的肿瘤切片中预测全基因组肿瘤mRNA表达,然后利用ENLIGHT模型根据推断出的表达值预测对靶向和免疫疗法的反应。这种方法的创新之处在于它不需要直接针对特定治疗的训练数据,而是通过预测肿瘤的基因表达模式来间接预测治疗反应

主要研究方法与结果:

一.计算框架与研究设计:研究者们构建了一个包含DeepPT和ENLIGHT两个主要组件的计算框架。DeepPT是一个深度学习模型,用于从H&E染色的全切片图像(WSIs)预测RNA基因表达。ENLIGHT则利用这些预测的基因表达数据来预测个体对靶向和免疫疗法的反应。研究设计包括使用来自TCGA的16种癌症类型的数据训练DeepPT模型,并通过五重交叉验证进行评估。然后,这些模型被应用于两个独立的数据集进行外部验证。最终,DeepPT预测的基因表达被用作ENLIGHT的输入,以预测五个不同临床试验数据集中的患者对治疗的反应。

二.从组织病理学图像预测基因表达:研究者们展示了DeepPT模型在预测基因表达方面的能力。他们针对十个广泛的TCGA癌症类别构建了模型,通过皮尔逊相关系数(R)评估预测和实际表达值之间的相关性。在测试数据集中,大多数基因(超过75%)显示出正相关,中位数相关性约为0.2。在重点关注的1,000个最相关基因中,跨16种癌症类型的平均中位数相关性为0.43。与现有表达预测方法相比,DeepPT在预测基因表达方面表现更优,其预测的基因表达与实际测量值的相关性显著高于其他方法。此外,DeepPT在两个未见过的独立数据集上也显示出良好的预测能力,证明了其泛化潜力。

三.免疫途径的表达与免疫细胞浸润密切相关:研究者发现DeepPT模型预测的免疫相关基因表达水平与肿瘤切片中肿瘤浸润性淋巴细胞(TILs)的丰度高度相关。通过基因集富集分析,他们发现预测表达水平与TILs丰度正相关的基因主要富集在免疫逃逸和肿瘤促进炎症等癌症标志物中。这表明DeepPT能够准确预测与免疫细胞浸润相关的基因表达,这对于理解肿瘤微环境和开发免疫疗法具有重要意义。

四.DeepPT 推断的预后特征水平与患者生存率相关:研究者们利用DeepPT模型预测的基因表达数据来评估与癌症进展和预后不良相关的三个增殖标志物。这些标志物包括Ki-67基因表达、增殖指数和上皮-间质转化(EMT)。通过计算TCGA队列中每位患者的签名得分,并将其与实际基因表达和患者生存数据进行比较,研究发现DeepPT预测的签名得分与实际得分在预后价值上具有显著的相关性。具体来说,EMT、增殖和Ki-67签名的预测表达与实际表达之间的相关系数分别为0.367、0.321和0.328。此外,基于预测表达计算的每个签名的风险比(HR)与实际表达计算的风险比之间的相关性非常高(0.75-0.88)。这证实了DeepPT在保留这些签名预后价值方面的有效性,并表明其预测结果可用于临床预后评估。

五.从DeepPT模拟的基因表达预测治疗反应:研究者们展示了ENLIGHT-DeepPT方法在预测五种不同临床队列患者对治疗反应方面的有效性。这些队列包括多种癌症类型和治疗方法,例如HER2+乳腺癌、BRCA+胰腺癌、ALK+非小细胞肺癌等。ENLIGHT-DeepPT在没有直接使用治疗数据训练的情况下,通过预测的基因表达数据,成功预测了真实反应者,显示出与直接从图像预测反应相当的准确性。总体比值比为2.28,预测反应者的反应率比基线率高出39.5%。此外,与直接监督学习方法相比,ENLIGHT-DeepPT显示出可比或更优的性能,证明了其在临床应用中的潜力,尤其是在缺乏大规模匹配治疗数据的情况下。


总结:ENLIGHT-DeepPT的一个显著创新点是它不需要特定治疗数据的训练DeepPT模型能够泛化到不同的数据集和癌症类型,这表明该模型具有很好的通用性和适用性。该研究的方法为临床医生提供了一种快速预测患者对治疗反应的工具,这可能有助于个性化医疗和更有效的治疗决策。

思考:如今深度学习在医疗领域的应用已非常广泛,除了应用于科研相关的基因组学、影像组学、病理组学外,在临床实践中也大放异彩:如制定放疗计划、手术导航与机器人辅助、患者监护与远程医疗服务……AI正在逐步改变医疗服务的提供方式,提高诊断和治疗的效率和准确性。随着技术的不断进步,了解并利用好这一强大工具,未来医疗将会以全新的面貌展现。

芒果师兄聊生信
1.生信技能和基因编辑。2.论文发表和基金写作。3. 健康管理和医学科研资讯。4.幸福之路,读书,音乐和娱乐。
 最新文章