张文祥,魏航,刘滨等 | 构建异构图神经网络识别和预测多类型RNA和疾病关联关系

文摘   科技   2024-08-09 12:00   中国  

研究团队

张文祥、吴昊、刘滨:北京理工大学

魏航:西安电子科技大学

张文静:深圳大学总医院


文章下载

Wenxiang ZHANG, Hang WEI, Wenjing ZHANG, Hao WU & Bin LIUMultiple types of disease-associated RNAs identification for disease prognosis and therapy using heterogeneous graph learning. Sci China Inf Sci, 2024, doi: 10.1007/s11432-024-4100-7



研究意义

疾病的产生涉及众多复杂的生物学过程,通常受到多种类型RNA的调控影响。当前的计算方法主要聚焦于单一类型的非编码RNA和疾病关联关系预测任务,忽视了识别多种类型的RNA和疾病关联关系。此外,最重要的一点是通过数据挖掘和分析方法进行RNA和疾病关联识别任务的最终目标是治愈疾病,但是,通过计算方法预测RNA和疾病关联关系在疾病预后过程中的作用机制尚未被充分探索。

本文工作

针对上述问题,本文提出基于异构图神经网络的方法识别与疾病相关的多种类型RNA(方法简称为iRNADis-PT),并设计下游的疾病预后分析方案,如图A1所示。该方法不仅通过异构图神经网络识别多种类型的RNA和疾病关联关系,还将预测与疾病相关的RNA应用于具体疾病预后分析任务中。

图A1. iRNADis-PT方法流程图
具体而言,iRNADis-PT方法构建一个包含多种节点(长非编码RNA、微小RNA、信使RNA、核仁小分子RNA和疾病)和边(RNA和疾病间关联、RNA间相互作用、疾病间相似关系、RNA间相似关系)的异构网络。然后,基于异构图神经网络识别多种不同类型的RNA与疾病之间的关联关系。接下来,将iRNADis-PT预测获得的疾病相关RNA应用于具体疾病预后分析任务中,以探索具体疾病的发病机制,并成功地鉴定出四种针对肝细胞癌的敏感药物。总的来说,本工作不仅为识别多种类型的RNA和疾病关联关系提供了一种有效的工具,而且有助于深入理解疾病发病机制。
本文的创新点如下:
(1) 本文提出方法具有较强的通用性,能够有效识别与疾病相关的多种类型RNA,包括长非编码RNA、核仁小分子RNA、微小RNA和信使RNA。
(2) 本文不仅能够识别与疾病相关的多种类型RNA,还设计了下游疾病预后分析方案,将预测结果应用于下游具体疾病的预后分析任务中,为临床实验提供更精细的指导信息。

实验结果

在本文中iRNADis-PT方法整合不同的RNA信息构建了5种不同类型的异构网络。基于这些异构网络,本文采用异构图学习识别对应单类别RNA和疾病关联关系,实验结果如图A2(a)所示,可以得出融合了多种RNA类型的网络及其相互作用构成的异构网络HetNet-All相较其它网络取得了较优的识别性能。图A2(b)展示了不同方法之间的性能比较结果,可以从中得出iRNADis-PT方法在各种单类型RNA与疾病关联识别任务中都优于其它的方法,表明iRNADis-PT方法具有强大的通用性,并且能够有效扩展到多种类型的RNA和疾病关联关系识别任务中

图A2 iRNADis-PT方法在不同异构网络上的表现以及与其他方法的比较


为了分析iRNADis-PT方法预测结果对下游疾病预后的影响,本文以高死亡率的肝细胞癌(HCC)为例,进行了一系列下游疾病预后应用实验。首先,分析了预测出的与HCC相关RNA在HCC样本和正常样本之间的差异表达水平,提取了220个显著差异表达的RNA,如图A3(a)所示。接下来,基于提取的显著差异表达的RNA,通过Lasso和多变量Cox回归分析,计算样本风险分数,并划分高低风险组,如图A3(b)所示。然后,为了评估高低风险组划分的质量进行了Kaplan-Meier曲线分析,如图A3(c)所示,发现低风险组的患者具有比高风险组更好的生存优势。借助高低风险组信息和一些临床病理特征,构建了生存曲线图来预测HCC患者在1年、3年和5年的生存率,结果如图A3(d)所示。最终,对HCC患者在198种药物上敏感性进行评估,计算不同药物在高低风险组之间的敏感性差异,结果如图A3e所示,推断出有4种药物在高低风险组中的敏感性上存在显著差异,以上发现有助于肝细胞癌症的临床个性化预后治疗。

图A3 预后分析






中国科学信息科学
《中国科学:信息科学》及其英文版《Science China Information Sciences》的宣传平台。
 最新文章