当今,高通量组学测序技术可谓是高分文章的宠儿,科研工作者的宝器,尤其是在绘制疾病图谱、发现关键靶点、揭示疾病机制、找寻生物标志物以及推动个性化医疗等领域。Bulk RNA-seq就像是基础实验中的Western Blot(WB),是一项必备的核心生物信息学分析技能。现在开始学习,永远不算晚。跟随我们一起,重新启程,深入探索bulk RNA-seq的无限可能!
01 Science丨The gut microbiota reprograms intestinal lipid metabolism through long noncoding RNA Snhg9. (IF=44.8)
浙江大学王宇浩博士和美国德克萨斯大学西南医学中心的Lora Hooper教授团队长期致力于探索肠道微生物和宿主间的相互影响,于 CNS 发表多篇文章。让我们看看大神团队是如何应用bulk RNA-seq邂逅自己的“天命靶点”的吧~
▶ 运用bulk组学的目的:bulk RNA-seq比较了常规饲养小鼠与无菌小鼠(各2例)小肠上皮细胞中的基因表达差异,发现42个差异表达的lncRNA编码基因,其中Snhg9在无菌小鼠中高表达,表明微生物群在抑制Snhg9的表达方面发挥着重要作用。qPCR进一步证实了微生物群的存在会降低Snhg9在小肠上皮细胞中的表达水平。
▶ 分析方法:还记得上一期的图谱绘制中,主要用到的分析方法有什么嘛?(链接)是层次聚类、主成分分析(PCA)和差异表达基因(DEG)。那么,在得到了数万个DEG后,我们又可以做什么呢?海量DEG真的都有用吗?
【火山图,Fig 1B】根据Log2FoldChange和adjusted P value可以确定有统计学意义的差异表达分子,并对其进行排序。火山图将差异表达最为显著的分子直观呈现出来,便于后续研究。
▶ Bulk组学对下一步分析的意义:差异表达的Snhg9存在于哪类细胞,可能提示其作用机制。结合公共scRNA-seq数据,发现Snhg9转录本主要来自小肠中的干细胞、肠上皮细胞和肠内分泌细胞等特化的上皮细胞群体。由于肠道上皮细胞是肠道吸收和加工食物中长链脂肪酸的主要细胞类型,这个发现让研究团队猜测Snhg9在无菌小鼠肠道上皮细胞中的高表达很可能是导致无菌小鼠脂质吸收缺陷的重要原因。小肠上皮细胞中运用pull-down实验+质谱分析,发现与Snhg9最强结合的蛋白质是细胞周期和凋亡蛋白2(CCAR2),后者是SIRT1的内源性抑制因子。简言之,Snhg9通过与去乙酰化酶SIRT1的抑制蛋白CCAR2相结合使其丧失与SIRT1的结合能力,从而使SIRT1活性升高,引起SIRT1下游脂质调控核心转录因子PPARγ的活性及表达降低,最终导致CD36等脂质吸收关键蛋白表达下降,脂质吸收受到抑制。
💜 研究思路小结:小样本自测bulk转录组 → 筛选差异最为明显的基因(火山图)→ 结合公共scRNA-seq将该基因定位到细胞 → 基于分子细胞实验确定该基因的功能
02 Adv Sci.丨Medium-Dose Formoterol Attenuated Abdominal Aortic Aneurysm Induced by EPO via β2AR/cAMP/SIRT1 Pathway. (IF = 14.3)
关键词:
abdominal aortic aneurysm
bioinformatics
erythropoietin
formoterol;senescence
▶ 运用bulk组学的目的:从GEO数据库获得主动脉组织RNA测序数据,通过差异表达基因分析与功能富集分析显示EPO诱导的AAA存在的分子变化。
▶ 分析方法:
【热图,Fig 2B】相较于火山图,热图可以更好地体现不同分组不同样本间的差异表达基因。
【火山图,Fig 2C】火山图可以更好地凸显出Log2FoldChange绝对值较大,和/或adjusted P value更显著的差异表达基因
【GO基因通路富集,Fig 2E】通过对数据库的差异分析得到了2382个DEGs之后,还可以通过功能富集分析找到这些差异表达基因主要发挥作用的通路。GO数据库是最广泛使用的基因通路注释系统之一,其原理是通过计算差异表达基因是否在三个层面上(细胞组分CC、分子功能MF和生物过程BP)显著聚集来进行注释。
【KEGG基因通路,Fig 2F】KEGG是系统分析基因产物在细胞中的代谢途径以及这些基因产物功能的数据库,其实现过程与GO富集类似。
▶ Bulk组学对下一步分析的意义:虽然进行了差异分析,但是面对2000多个差异基因,也仿佛大海捞针,如何进一步缩小范围,找出核心靶基因呢?Phenopedia是一个数据库,基于疾病关联研究文章,进行基因关键词的频次统计,总结了与特定疾病相关的基因研究信息。作者将筛选到的差异基因与从Phenopedia预测到的AAA相关基因crosstalk,将2000多个差异基因范围缩小至121个基因。此外,还可以对121个基因进行蛋白-蛋白互作网络分析,进一步挖掘核心靶基因。最终将目光锁定到与细胞外基质稳态和炎症相关的一些核心靶基因在EPO诱导的AAA中的作用。
💜 研究思路小结:基于公共bulk转录组数据明确差异表达基因 →火山图、热图、通路富集图宏观呈现差异表达的基因和通路→ 基于Phenopedia筛选与疾病密切相关的基因list → PPI分析挖掘核心基因 → 深入的基因功能与机制研究
✦
期待已久 R语言与组学交流群!
✦
请添加下方微信,备注:“R语言与组学_互助交流群” 将拉入群中。
图文:仓观、静观
审核:定观
编辑:仓观
责编:静观