文章标题:Identification of senescence related hub genes and potential therapeutic compounds for dilated cardiomyopathy via comprehensive transcriptome analysi
中文标题:通过综合转录组分析鉴定衰老相关的中枢基因和扩张型心肌病的潜在治疗化合物
发表期刊:Comput Biol Med.
发表时间:202409
影响因子:7.0/Q1
研究背景
扩张型心肌病(DCM)是心力衰竭的常见原因。然而,细胞衰老在 DCM 中的作用尚未完全阐明。在这里,我们的目的是研究 DCM 的衰老,鉴定衰老相关的特征基因,并探索用于治疗 DCM 的潜在小分子化合物。
研究方法
分别从GEO和CellAge数据库中获取DCM相关数据集和衰老相关基因。通过加权基因共表达网络分析(WGCNA)、最小绝对收缩和选择算子(LASSO)和随机森林等方法识别特征基因。特征基因的表达在小鼠DCM模型中得到验证。此外,应用CIBERSORT算法分析DCM的免疫特征。最后,通过CMap分析预测了几种治疗化合物,并通过分子对接和分子动力学模拟研究了绿原酸(CGA)的潜在机制。
研究结果
1. DCM中DEG的鉴定和富集分析
对训练数据集 GSE57338 进行主成分分析(PCA),结果显示对照组和 DCM 组之间存在明显差异(图2A)。共鉴定出 314 个 DEG,其中 154 个上调和 160 个下调(图2B)。采用层次聚类算法分析每个对照组的DEG,并以热图的形式可视化(图2C)。进行GO和KEGG富集分析,以探索与DEG相关的生物学功能和信号通路(图2D-G)。总的来说,富集分析表明 DCM 的发病机制涉及复杂的调控网络,如细胞衰老、炎症失调。将 314 个 DEG 与 866 个 SRG 相交后,总共识别出 25 个 DESRG(图2H)。Spearman 相关分析显示 DESRG 之间存在显着的相互作用(图2I)。GO分析显示,DESRGs在“复制衰老”、“活性氧代谢过程”、“细胞外刺激反应”、“衰老”、“心脏收缩调节”、“炎症反应调节”等BPs中显着富集(图2J)。KEGG分析显示DESRGs富集于“细胞周期”、“细胞衰老”、“TNF信号通路”、“p53信号通路”、“PI3K-Akt信号通路”、“Toll样受体信号通路”等通路(图2K)。上述结果表明,研究DCM中的细胞衰老对于探索DCM的发病机制和潜在的治疗方法具有重要意义。
2. 与 DCM 相关的基因模块的鉴定
3. 通过机器学习筛选具有诊断价值的中枢基因
进一步使用 LASSO 和 RF 两种机器学习算法从 25 个 DESRG 中识别 DCM 和衰老相关特征基因。在LASSO回归中,将参数族设置为二项式,生成用于交叉验证的基因系数图和二项式偏差图(图4A-B)。中心基因是从与最佳惩罚参数值相对应的变量中选择的。在此,确定了最佳 lambda 值(lambda.min = 0.014),ROC 曲线表明该模型表现出理想的诊断性能(图4C)。最后,LASSO回归确定了13个中心基因,包括BCL6、PLA2G2A、MME、STAT3、TEAD4、GNMT、MTHFD2、 JAK2、CRISPLD2、BCL3、NQO1、HOPX和SERPINE1。对于RF算法,将诊断错误可视化,并根据变量重要性对候选基因进行降序排列(图4D-E)。MeanDecreaseGini > 4 的基因被确定为重要基因,包括 BCL6、STAT3 、TEAD4、MME、 NAMPT 、PLA2G2A、GNMT 、SAMHD1和 MTHFD2。最终通过LASSO、RF、WGCNA关键基因交叉得到3个特征基因(PLA2G2A、MME、GNMT)(图4F)。此外,多变量逻辑回归表明,MME、PLA2G2A和GNMT这三个枢纽基因均升高(图4G)。
4. 特征基因单基因GSEA
为了进一步揭示与三个特征基因(PLA2G2A、MME和GNMT)相关的生物学功能和信号通路,利用单基因GSEA方法对每个基因进行GO和KEGG富集分析。GO 和 KEGG 中每个基因的前 10 个术语分别显示在图5A-C。我们发现特征基因参与细胞周期或增殖调节、氧化应激和活性氧代谢、细胞死亡、应激反应、免疫和炎症反应等生物过程;信号通路包括p53信号通路、PI3K-Akt信号通路、JAK-STAT信号通路、NF-kappa B信号通路、细胞衰老、坏死性凋亡、Toll样受体信号通路、HIF-1信号通路等。单基因GSEA结果表明,枢纽基因可能在细胞衰老、细胞存活、免疫浸润和代谢的调节中发挥重要作用。
5. DCM 诊断列线图的构建
使用“rms”包根据特征基因构建 DCM 诊断列线图。在列线图中,每个基因对应一个分数,3个基因的总分数用于预测DCM的风险(图6A)。校准曲线显示列线图的预测概率与理想模型的预测概率基本一致(图6B),决策曲线分析表明,根据列线图做出决策可能是有益的(图6C)。训练队列的表达分析显示,DCM 中 MME 的表达显着上调,PLA2G2A 和 GNMT 的表达显着下调(图6D);所有三个枢纽基因均表现出良好的诊断性能:ROC曲线的曲线下面积(AUC)值分别为PLA2G2A的0.88、MME的0.897和GNMT的0.857(图6E-G);基于三个hub基因的列线图显示出更好的诊断性能,AUC值为0.96(图6H)。
6. 特征基因和列线图的外部验证
三个特征基因的表达和诊断性能在三个外部数据集(GSE79962、GSE5406和GSE42955)中得到进一步验证。三个 hub 基因的表达在训练和验证队列中均一致,即 MME 显着上调,而 PLA2G2A 和 GNMT 下调(图7A、C 和 7E)。ROC曲线显示,这三个基因都具有理想的诊断效率:在GSE79962数据集中,ROC曲线的AUC值为PLA2G2A的0.949,MME的0.828,GNMT的0.838(图7B);在GSE5406数据集中,ROC曲线的AUC值为PLA2G2A的0.9,MME的0.719,GNMT的0.694(图7D);在GSE42955数据集中,ROC曲线的AUC值为PLA2G2A的0.717,MME的0.8,GNMT的0.8(图7F)。基于三个中心基因的列线图取得了更好的诊断性能,AUC值分别为1.0、0.925和0.9。还在小鼠中构建了 DOX 诱导的 DCM,然后进行 qRT-PCR 分析以进一步验证我们的发现。与生物信息学分析的结果一致,小鼠DCM中MME的表达显着上调;然而,GNMT 和 PLA2G2A 明显下调(图7G-I)。总的来说,在不同且独立的数据中获得的一致结果极大地突出了三个特征基因的诊断价值及其在 DCM 进展中的潜在作用。
7. 免疫细胞浸润分析
考虑到衰老可能诱发 SASP 并促进炎症失调 ,接下来使用CIBERSORT算法来评估DCM中免疫细胞浸润的特征。图8A显示每个样本中22种免疫细胞的比例。与对照组相比,DCM中静息肥大细胞、浆细胞、T细胞CD8的比例较高;然而,巨噬细胞 M2 、单核细胞、CD4 记忆静息 T 细胞和调节性 T 细胞(Treg)的比例较低(图8B).相关性分析显示T细胞调节性(Tregs)、B细胞和T细胞CD4记忆静息之间显着正相关;浆细胞、巨噬细胞 M2 和单核细胞之间显着负相关(图8C)。我们进一步探讨了免疫细胞与三个诊断生物标志物之间的相关性,与三个中心基因中任何一个显着相关的免疫细胞都包含在热图中(图8D)。有趣的是,巨噬细胞M2和T细胞CD8在心肌组织中所占比例很大,并且都与三个特征基因显着相关(图8E-J),表明这两种免疫细胞可能在 DCM 的进展中发挥更重要的作用。
8. CGA和MME之间的分子对接和MD模拟
小分子化合物可以与蛋白质的活性口袋结合并有效抑制其活性,为开发新的治疗药物提供思路。既往研究表明CGA具有抗衰老和多种心血管保护作用。此外,据报道MME 可介导各种细胞的衰老],而心脏中MME的上调会加速心脏功能的恶化。相反,MME 抑制可以改善心力衰竭的进展,并改善蒽环类药物引起的心脏毒性。但CGA与MME之间的关系尚未见报道。在这里,分子对接分析表明配体和蛋白质受体之间的对接分数较低(-8.9 kcal/mol),表明CGA和MME之间具有很强的结合亲和力。如图所示图9A,观察到 CGA 和 MME 蛋白活性口袋之间的结合相互作用。具体而言,CGA与MME蛋白A链上的TYR-545、GLU-584、ILE-641、VAL-710和HIS-711形成氢键。OIR是先前文献报道的MME共结晶配体和抑制剂,可以与MME的活性口袋结合。因此被用作分子对接的参考。分子对接分析成功检测到参考化合物OIR与蛋白质MME在同一口袋处具有高结合亲和力(对接得分:-7.9 kcal/mol),表明对接方案是可靠的(补充图2).
文章小结
该研究提出三个特征基因(MME、PLA2G2A 和 GNMT)和一种新型的基于衰老的诊断列线图,讨论了潜在的治疗化合物,为 DCM 的诊断和治疗提供了新的见解。