近十年以来,系统生物学的分析方法为中医药现代化相关研究注入了新的动力,诸如网络药理学等相关研究报道的数量日益增多。然而,当前单纯的网络药理学分析已经很难在主流SCI期刊上发表。本研究以源自中药丹参的生物活性单体丹参酮IIA为研究对象,通过网络药理学和临床数据挖掘等方法探索了丹参酮IIA在治疗肝细胞癌(Hepatocellular Carcinoma, HCC)方面潜在的分子机制,并通过一系列体外药理学验证,发现丹参酮IIA可通过抑制SRC/MAPK/ERK信号通路治疗HCC,为中药丹参治疗HCC提供了全新的参考。
哈喽大家好!今天分享的是2024年10月31日发表于Frontiers in Immunology(IF=5.7)上的一篇中药生物信息学研究。下面我们就一起来看看作者究竟是如何将网络药理学、临床数据挖掘和机器学习“玩出新花样”,最终组成一篇高质量中药生信论文,还发了JCR一区、5分以上SCI的呢?
添加微信
精彩推送不错过
肝细胞癌(Hepatocellular Carcinoma, HCC)是临床上一类预后极差的恶性肿瘤,而丹参酮IIA因其较强的抗肿瘤活性,在HCC辅助治疗方面具有巨大的应用潜力。然而,由于丹参酮IIA抗肿瘤的分子机制尚不明确,这导致其应用受到一定限制,故亟需相关研究。那么,我们该从哪方面切入呢?
研究者首先进行了基于网络药理学的药物靶点预测,其原理是根据小分子结构计算可能与之结合的蛋白质。研究者首先收集了丹参酮IIA的SMILES号,通过TCMSP
(https://tcmsp-e.com/)、Herb(http://herb.ac.cn/)、STITCH(http://stitch.embl.de/)和HIT (http://hit2.badd-cao.net)数据库计算丹参酮IIA可能作用的196个靶点。而后在GeneCards(https://www.genecards.org)等数据库收集与HCC相关的7169个基因。将上述二者取交集,总共得到64个靶点,即丹参酮IIA可能通过作用于这64个交集靶点治疗HCC。
我们知道人体由最基本的20种氨基酸构成了数万种蛋白质,占人体全部质量的18%。而每一种蛋白质都不是孤立存在的,为了发挥正常的生物学功能,蛋白与蛋白之间往往存在着错综复杂的蛋白互作,并涉及到信号转导、代谢调控、基因表达调控等诸多方面。而蛋白互作分析和网络构建正是研究这一过程的有利手段。
研究者进一步将得到的64个交集靶点导入STRING (https://www.string-db.org/)数据库以构建蛋白互作网络,并通过Cytoscape软件对互作网络的拓扑学参数进行计算,筛选那些degree value更高的交集靶点,因为degree value越高,往往意味着靶点在蛋白互作网络中越重要、互作越频繁,也就是更有可能介导丹参酮IIA抗HCC作用了。
在筛选后64个交集靶点还剩余40个,其中degree value排名前八的分别是ALB, JUN, MYC,SRC, ESR1, MMP9, PTGS2和FOS,这些都是大家“耳熟能详”的基因,丹参酮IIA很有可能作用于这些靶点发挥作用哦!
图1:通过网络药理学筛选丹参酮IIA抗HCC可能的靶点,并构建蛋白互作网络
生物富集分析是一种能够将输入靶点快速map到某些特定的信号通路/生物途径/细胞组分/分子功能上的便捷研究手段,如果大多数输入靶点富集在某一特定的通路(如本文的SRC/MAPK/ERK)上,则很有可能是这个通路在起作用。研究者利用R包“clusterProfiler”,将上一步得到的40个交集靶点导入并进行生物富集分析,将所得到的通路按照p值从小到大排序,发现这些靶点高度富集在MAPK信号通路和癌症相关转录失调途径上;同时,这些靶点也富集在类固醇代谢、ERK1/ERK2级联反应等生物途径上。
做到这里,大家是否觉得SRC/MAPK/ERK通路已经呼之欲出了?但这似乎还不够,在进行药理学验证之前,研究者还通过临床数据挖掘与分子对接寻找了更多证据,来选择重点关注的靶点和通路。
研究者利用GEPIA2 (http://gepia2.cancer-pku.cn/)数据库进行KM和COX分析,在上述40个交集靶点中筛选与HCC患者手术预后相关的基因,结果显示ALB、JUN、SRC、ESR1和MMP9与HCC患者术后总生存期(Overall survival, OS)预后显著相关。
进一步,研究者倒过来推,从HCC能筛到这5个基因,那么从这5个基因出发,能否回对到HCC临床队列上呢?研究者采用机器学习的方法,从TCGA数据库中选取LIHC队列作为训练集,得到以下风险评分公式:
风险评分=(-0.0324)×ALB表达+(0.0519)×JUN表达+(0.0524)×SRC表达+(-0.1366)×ESR1表达+(0.0588)×MMP9表达
有了这个公式,研究者则可以按照风险评分将TCGA数据库中的HCC患者分为低危组和高危组,并绘制ROC曲线,计算曲线下面积。结果在1、3、5年的生存时间下,AUC值均高于0.62(显然,AUC的值越大,预测模型的准确度越高,这个成绩马马虎虎,勉强是能用的)。研究者进一步进行KM分析,发现低危组患者的预后显著好于高危组患者。总之,这些数据无疑增强了交集靶点中关键基因ALB、JUN、SRC、ESR1和MMP9值得往下做分子机制的说服力。
此外,研究者还结合Sorafenib药物敏感性分析和免疫细胞浸润分析进一步说明上述5个靶点对于HCC治疗的重要性,这些分析用到了GDSC (https://www.cancerrxgene.org/)数据库和R包GSVA、ESTIMATE,此处就不再赘述了。
由于已经通过网络药理学和临床数据挖掘明确了要验证的靶点,研究者在通过湿实验验证之前,使用SYBYL-X软件对丹参酮IIA和ALB、ESR1、SRC靶点进行分子对接,计算丹参酮IIA作为配体如何结合到蛋白质的某一特定活性口袋,与其中的一些氨基酸残基形成氢键等。经计算丹参酮IIA与上述3个靶点均能实现较好的结合,即CSCORE>4。与之类似的,AutoDock等软件也可以开展分子对接实验,并主要使用binding energy等参数评估小分子与蛋白结合形成复合物的稳定性。
最后对预测结果进行药理学验证。简单来说,首先做出表型,即通过CCK-8检测确认丹参酮IIA干预可显著抑制肝癌细胞系Hep3B和HepG2的细胞活力,并且有剂量依赖性。同时通过流式细胞术检测细胞凋亡,发现丹参酮IIA可以剂量依赖的形式促进细胞系凋亡,这点通过Western Blot检测凋亡相关蛋白Bax和Bcl-2时也得到确证。此外,研究者也通过Transwell实验证实丹参酮IIA可显著抑制肝癌细胞系Hep3B和HepG2的细胞侵袭能力。这些结果都说明了丹参酮IIA可能具有显著的抗HCC作用。
接下来是一个初步的分子机制研究,即对于上述预测结果的验证。研究发现丹参酮IIA可显著上调Hep3B和HepG2细胞系ALB和ESR1的水平、下调SRC和磷酸化ERK1/2的水平,至此完成了体外药理学验证部分。
总的来说,这篇文章对源自中药丹参的生物活性单体丹参酮IIA抗HCC活性进行了研究,从小分子结构入手预测靶蛋白,通过一系列临床数据挖掘、机器学习和分子对接的手段确认所预测靶蛋白的可靠性,最终通过在体外完成药理学验证,发现丹参酮IIA可能通过作用于SRC/MAPK/ERK信号通路发挥抗HCC作用,为丹参酮IIA及中药丹参的临床应用和基础研究提供诸多参考。
图6:本研究整体的实验框架,从机制预测到模型构建,最后完成药理学验证
参考文献
Qian, L., Xu, Z., Luo, T., Gao, Z., Cheng, K., He, X., Zhang, Z., Ren, S., & Zhu, Y. (2024). In silico identification and verification of Tanshinone IIA-related prognostic genes in hepatocellular carcinoma. Frontiers in immunology, 15, 1482914. https://doi.org/10.3389/fimmu.2024.1482914
概普生物 让科研丰富