文章标题:Identification of immune-related genes in diagnosing atherosclerosis with rheumatoid arthritis through bioinformatics analysis and machine learning
中文标题:通过生物信息学分析和机器学习鉴定免疫相关基因诊断动脉粥样硬化伴类风湿性关节炎
发表期刊:Frontiers in Immunology
发表时间:2023年3月
影响因子:5.7/Q1
越来越多的证据表明类风湿性关节炎 (RA) 可加重动脉粥样硬化 (AS),我们旨在探索 AS 和 RA 患者的潜在诊断基因。
研究方法
我们从包括基因表达综合 (GEO) 和 STRING 在内的公共数据库中获取数据,并通过 Limma 和加权基因共表达网络分析 (WGCNA) 获得差异表达基因 (DEGs) 和模块基因。京都基因与基因组百科全书 (KEGG) 和基因本体论 (GO) 富集分析、蛋白质-蛋白质相互作用 (PPI) 网络和机器学习算法 [最小绝对收缩和选择运算符 (LASSO) 回归和随机森林] 用于探索免疫相关枢纽基因。我们使用列线图和受试者工作特征 (ROC) 曲线来评估诊断效果,这已经通过 GSE55235 和 GSE73754 进行了验证。最后,在 AS 中发展了免疫浸润。
结果分析
1. 鉴定差异表达基因
从 RA 组合数据集中共鉴定出 2,705 个 DEGs,p 值< 0.05 ,火山图和热图说明了这些 DEG 的差异表达模式。
2. 加权基因共表达网络分析和关键模型鉴定
我们使用加权基因共表达网络分析 (WGCNA) 构建了一个无标度的共表达网络,以识别 RA 中最相关的模块。根据尺度独立性和平均连通性选择 7 的 “软” β阈值 7 。生成 RA 和对照的聚类树状图,并获得 26 个不同颜色的基因共表达模块,模块合并阈值为 0.25,最小大小为 50。
3. RA的功能富集分析
为了验证 GSE55457 的可靠程度,我们对 Limma 基因和模块基因的交集进行了富集分析。结果显示RA 的常见基因与免疫应答相关,免疫应答与 RA 的发病机制高度相关。
4. 通过机器学习鉴定候选枢纽基因
LASSO 回归分析确定了 22 个与疾病密切相关的基因。在 RF 算法中,我们根据平均降低准确率 (MDA) 和平均降低基尼系数 (MDG) 等指标评估了基因的重要性。计算 LASSO 回归中这些基因的 AUC 和 95% CI,以及 RF 机器学习算法中 MDA 和 MDG 的交集,并绘制 ROC 曲线。结果显示 LASSO 回归 (AUC 0.999, CI 0.971-1) 和 RF 机器学习算法 (AUC 0.995, CI 0.971-0.986) 的准确性很高。图 6E 显示了 RF 中前 15 个最重要的基因和 LASSO 中 22 个基因的交集,其中确定了 6 个基因 (NFIL3、EED、GRK2、MAP3K11、RMI1 和 TPST1) 作为最终验证的关键诊断基因。
5. 诊断价值评价
我们用六个关键诊断基因构建了列线图,如图 7B 所示。这些基因的 AUC 和 95% CI 是通过构建 ROC 曲线来计算的,以评估诊断效果。所有基因和列线图均显示 AS 伴 RA 的高诊断价值。
文章小结
这项研究中,我们使用生物信息学分析和机器学习算法成功鉴定了六个免疫相关枢纽基因 (NFIL3 、 EED 、 GRK2 、 MAP3K11 、 RMI1 和 TPST1 )。这些基因已显示出作为 RA 患者 AS 诊断候选基因的潜力。此外,我们的研究还强调了 AS 伴 RA 的免疫功能障碍。我们还构建了一个列线图,用于诊断 AS 伴 RA,这有助于临床决策。总的来说,我们的研究结果可能为 AS 伴 RA 的发病机制和诊断提供新的见解。需要进一步的验证研究以确认这些基因在 AS 与 RA 中的临床相关性。