生信分析是指利用生物信息学工具、方法和技术对生命科学数据进行分析和研究的一个领域。主要包括两大类:一类是对DNA、RNA、蛋白质和代谢物进行定量和定性分析;另一类是对复杂的生物信息数据进行图形化展示、可视化分析以及机器学习方面的应用。目前对大量生命科学数据的有效处理、分析以及可视化呈现这一手段也得到了越来越广泛的应用,也是如此,“生信分析+热门疾病”申请国基金仍是不错的一个策略。
今天分享一篇生信分析:hub基因相关的研究思路,准确说是生信分析研究食管癌相关的研究:“Exploring the hub genes and mechanisms of Daphne altaica treating esophageal squamous cell carcinoma based on network pharmacology and bioinformatics analysis”,这篇论文于2023年4月23日发表在Journal of Cancer Research and Clinical Oncology(IF:4.32)。
原文链接:https://link.springer.com/article/10.1007/s00432-023-04797-w
背景介绍
食管癌(EC)是一种常见的消化道恶性癌,病死率高,也是第七大侵袭性恶性肿瘤,由于早期检测的生物标志物缺乏,其治疗仍然是一个挑战。阿尔泰瑞香(Daphne altaica)是一种分布在阿尔泰山脉的稀有药用植物,在哈萨克传统医学中经常使用,它的药用部位是茎皮,用于治疗癌症和呼吸系统疾病。尽管具体的作用机制尚不清楚,但初步研究表明阿尔泰瑞香可能通过上调细胞内PPARγ基因表达诱导细胞凋亡,导致细胞周期停滞。因此作者使用网络药理学结合生物信息学分析和分子对接,探讨哈萨克族传统药物阿尔泰瑞香治疗ESCC的hub基因和机制,并期望将为ESCC的治疗做出贡献。
研究思路总结
作者通过TCMSP、BATMAN–TCM等数据库筛选得到阿尔泰瑞香的活性化合物和靶点,ESCC靶标则是通过GeneCards数据库,进而构建复合靶标网络和PPI网络。同时,分析GEO数据库(GSE100942,GPL570)中组织和邻近非癌组织之间的数据集,分析获得127个DEGs(上调82个,下调45个)。作者筛选了TOP2A、NUF2、CDKN2A、BCHE和NEK2等hub基因,并使用Kaplan-Meier绘图仪数据库、TIMER2.0和GEPIA2数据库对hub基因进行验证。最后,利用AutoDock软件通过分子对接来预测结合位点,分子对接结果显示5个hub基因和活性化合物的连接更稳定。
图1.研究思路图
研究步骤
Step1:构建化合物靶标网络和PPI网络
作者通过TCMSP、BATMAN–TCM等数据库筛选得到阿尔泰瑞香的活性化合物靶点,基于13种活性药物化合物和830个靶标,作者使用Cytoscape 3.9.1构建了化合物靶标网络(图2a)。该网络由一种药物、13种化合物和830个化合物靶标组成,化合物按度值排序。程度值越高,它所涉及的生物功能就越多,其生物重要性就越强。同时,作者通过Venn图得到了409个药物疾病的重叠基因(图2b)。然后,使用STRING数据库来获取PPI信息。之后,作者将其放入Cytoscape 3.9.1中,以获得PPI网络图(图2c),并根据Degree值设置蛋白质大小。
图2.化合物靶标网络与PPI网络图
Step2:差异表达基因的获取
作者通过GEO数据库获得了ESCC患者癌症和癌旁组织的RNA提取和杂交数据,并使用R Studio获得了微RNA数据的DEGs,一共获得127个DEG,包括82个上升和45个下降(补充表1)。生成火山图(图3a)、热图(图3b)和主成分分析图(图3c,d),以显示DEG的分布。GSEA图(图3e,f)显示,DEG与真核生物中的DNA复制、Fanconi贫血途径、糖氨基聚糖生物合成-硫酸keratan、同源重组、错配修复、细胞周期、核质运输、蛋白酶体和核糖体生物发生密切相关。
图3.差异表达基因相关图
Step3:获得hub基因
作者筛选了用于阿尔泰瑞香治疗ESCC的基因,并获得了12个重叠基因作为治疗的hub基因,包括BCHE、CDC20、CDKN2A、CXCR2、IL6、MMP1、MMP3、MMP12、NEK2、NUF2、PTGS2和TOP2A。
图4. 阿尔泰瑞香治疗ESCC的基因筛选
Step4:预后分析筛选hub基因
作者通过Kaplan–Meier绘图仪数据库对12个重叠基因(BCHE、CDC20、CDKN2A、CXCR2、IL6、MMP1、MMP3、MMP12、NEK2、NUF2、PTGS2和TOP2A)进行了生存分析,获得了5个显著基因(p < 0.05),并将其用作hub基因,包括TOP2A、NUF2、CDKN2A、BCHE和NEK2(图第5a)。
图5.预后分析筛选hub基因
Step5. 分子对接验证
作者使用五个枢纽基因NEK2(PDB:6SGH)、CDKN2A(PDB:1DC2)、BCHE(PDB:4AQD)、TOP2A(PDB:4R1F)和NUF2(PDB:2VE7)与阿尔泰瑞香的两种最具活性的化合物进行分子对接,使用AutoDock 4.2.6。发现NEK2-Apigenin (PubChem CID: 5280443),CDKN2A-Apigenin,BCHE-Apigenin, TOP2A-Apigenin, NUF2-Apigenin,,NEK2-Luteolin (PubChem CID: 5280445), CDKN2A-Luteolin, BCHE-Luteolin, TOP2A-Luteolin和NUF2-Luteolin 都具有良好的结合亲和力。最后,使用PyMOL2.5软件对分子对接图进行可视化,可视化结果如图6所示。
图6. hub基因与活性化合物的分子对接可视化结果
仅用于文献解读和分享,不作为商业使用。版权归文章原作者所有,若有侵权请联系删除
2024年度国自然医学部50大科研热点的中标数统计如下:
往期精彩文章