“ 2024年6月Frontiers in immunology 杂志发表了一篇题为Integrated analysis of single-cell RNA-seq, bulk RNA-seq, Mendelian randomization, and eQTL reveals T cell-related nomogram model and subtype classification in rheumatoid arthritis 的转录组分析文章 ” 文章借助单细胞转录组数据、芯片转录组数据以及eQTL遗传变异数据来筛选类风湿性关节炎中潜在的致病T细胞标志基因。
从基因表达综合(GEO)数据库中获取类风湿性关节炎的scRNA-seq和bulk-seq数据集。采用多种方法分析和表征类风湿性关节炎的T细胞异质性。利用孟德尔随机化(MR)和表达数量性状位点(eQTL)筛选类风湿性关节炎中潜在的致病T细胞标志基因。随后,通过比较九种机器学习方法对类风湿性关节炎的预测,选择最优机器学习方法识别T细胞相关诊断特征,构建列线图模型。采用共识聚类法将类风湿性关节炎患者分为不同的T细胞相关簇。最后,对T细胞相关诊断特征进行免疫细胞浸润和临床相关性分析。
01
—
数据准备
在文章分析中用到了eQTL数据,来源于IEU OpenGWAS数据库;
RA GWAS 数据,来源于FinnGen R10 数据库;
scRNA-seq(GSE159117)数据和bulk RNA-seq(GSE93272、GSE89408、GSE77298)数据,来源于NCBI的GEO数据库。
02
—
结果展示
01. 类风湿性关节炎细胞类型的鉴定
对RA GWAS 数据进行分析,RA数据集中包含10211个细胞,被分为18个簇。对数据进行注释,结果如下:(图A)cluster0、1、2、3、9、10、11、12为T细胞(图B),标记基因为CD3D和CD3E(图D),并且T细胞是在RA免疫微环境中最丰富的细胞(图C)。
02. RA微环境中细胞间相互作用分析
使用 cellchat 包分析了 RA 微环境中 T 细胞与其他免疫细胞之间的关系(图A、B)。
又已知 MIF 信号通路可调节免疫反应和炎症,在 RA 微环境中发挥重要作用,可能影响免疫调节和疾病进展。图C、D、E展示说明T细胞作为信号传递体,主要通过 MIF 信号通路及其相关的配体-受体对(MIF-CD74 + CXCR4 和 MIF-CD74 + CD44)与其他免疫细胞相互作用。
此外,MIF 诱导的配体 CD74 在这些免疫细胞群中高表达(图F),可能与 T 细胞的发育分化密切相关。
03. 细胞的轨迹
根据T细胞亚型的标记基因,文章将T细胞分为以下7类细胞亚型(图A),不同的T细胞亚型表达不同的标记基因(图B)。
文章通过拟时间轨迹分析将七种T细胞亚型分为三种分化状态。不同状态下T细胞亚型的数量不同。CD8_Naive和CD4_Naive细胞主要富集于T细胞发育早期,主要分化为第一细胞状态;CD8_EM、MAIT和CD8_TE细胞处于第二细胞状态;CD8_CM和CD4_TE细胞处于第三细胞状态(图C)。
同时将T细胞发育过程中的基因变化分为三类,分别与细胞质翻译、免疫应答和T细胞介导的细胞毒作用的正向调控相关(图E)。
图D显示MIF诱导的配体CD74的分布随着分化期的变化而逐渐增加,这表明在RA免疫微环境中,随着T细胞的发育,T细胞对其他免疫细胞的作用逐渐增强。
04. 识别与RA相关的风险基因
文章从eQTL数据集中识别出309 个与 RA 相关的遗传显著基因,其中,153 个基因表达增加与 RA 风险增加显著相关,而 156 个基因表达增加与 RA 风险降低显著相关(图A)。
05. T细胞相关诊断特征的筛选及列线图模型的构建
基于前面的分析,文章选择了 1639 个 T 细胞标记基因与 309 个与 RA 有因果关系的基因进行交集(图 B),总共获得了 26 个基因,用于构建九个机器学习模型(图C),其中XGB机器学习模型显示出最高的AUC。
我们从XGB结果中挑选前十个基因,看一下在 GSE93272 转录组数据集的健康个体和RA患者中这10个基因的表达(图D),根据表达结果其中8个基因被定义为 T 细胞相关的诊断特征。
之后为了评估 232 例患者罹患 RA 的风险,文章对 8 个 T 细胞相关诊断特征构建了列线图模型(图E),校准曲线显示列线图模型准确预测了 RA。
最后文章用另外两组bulk RNA-seq转录组数据验证了列线图模型,得到 GSE89408 和 GSE77298 的 AUC 分别为 0.958 和 0.875(图F),进一步证明我们的诊断模型在区分 RA 和健康个体方面是有效的。
06. T细胞模式识别和免疫细胞浸润分析
为了研究与 RA 中 T 细胞相关的不同模式,文章根据八种 T 细胞相关诊断特征对 RA 患者进行了聚类分析。将 RA 分为两个不同的 T 细胞簇(cluster 1 和cluster 2)(图A)
PCA 结果显示两种 T 细胞模式之间存在明显区别(图B)。结果显示,且cluster 2 的 T 细胞评分高于cluster 1(图 C)
之后做了差异表达分析(图D)、免疫浸润分析(图E)、8个T细胞相关诊断特征与免疫细胞之间的相关性热图(图F)、以及基因集变异分析GSVA分析(图G)。GSVA 结果显示,Cluster 2 主要与非小细胞肺癌、癌症通路和胰腺癌等癌症有关,而 Cluster 1 在核糖体、RNA 降解和基础转录因子等信号通路中富集
07. 临床相关性分析
文章做了临床相关性分析,以确定不同 T 细胞模式的 RA 患者之间是否存在年龄和性别差异,并评估 T 细胞相关诊断特征与患者年龄之间是否存在显著相关性。
结果表明,在8个诊断特性下两种不同 T 细胞模式之间的年龄分布没有显著差异,性别比例也没有显著差异。