如何从单细胞数据海洋中寻找调控基因?

学术   2024-12-11 18:03   广东  

单细胞转录组庞大的数据量使得其数据挖掘难度要远高于普通转录组,正因如此,越来越多的单细胞转录组分析点也应运而生。在先前我们专门介绍了4个单细胞转录组的个性化分析点,分别是:1)scWGCNA;2)拟时分析;3)细胞通讯分析;4)细胞周期分析。我们可以简单总结这些分析点的侧重点:


1.scWGCNA:研究基因与基因之间的共表达特征;

2.拟时分析:研究细胞与细胞之间的分化关系;

3.细胞通讯:研究细胞与细胞之间的互作关系;

4.细胞周期:研究细胞自身的细胞分裂情况;


以上分析的侧重点基本落在细胞上,如果要研究细胞内部的分子机制从而解释特定生物学现象,不可避免的需要研究细胞中的基因表达情况。基因的表达模式可以分为3类:1)稳健表达的管家基因;2)共表达的基因;3)相互调控的基因。其中第2类的基因表达模式可以通过scWGCNA进行研究,而第3类基因之间的调控关系可以用今天要介绍的转录因子分析进行。


图一:转录因子的作用机制

转录因子分析概述

转录因子是一类能直接与靶基因DNA序列结合从而调控其转录过程的蛋白质,我们可以通过计算单细胞数据中基因的表达信息并结合靶基因结合位点序列信息(也就是motif)来研究转录因子与靶基因之间的调控关系,这就是转录因子分析的概念。单细胞研究中转录因子分析通过scenic这一软件进行[1],在之前的推送中我们详细的介绍过scenic的流程(详细流程的推送请点这里),在这我们就简单总结这几个过程:


1.共表达网络构建:输入单细胞转录组表达矩阵,识别其中的转录因子,寻找与转录因子存在共表达的基因计算相关性,构建共表达网络。


2.Motif预测靶基因:基于第1步的共表达网络,通过转录因子motif数据库,验证共表达网络中转录因子与基因的关系,最终确定1个包含转录因子与受其调控的靶基因的regulons(调控模块)。


3.regulons活性定量:这一步本质上是一个基因集的打分,用于预测regulons在细胞中的活性,如果打分越高,说明regulons在细胞中的表达活性越高。


图二:scenic的基本流程


转录因子的应用情景

转录因子分析虽然是对细胞内部分子机制的研究,但是不同思路下转录因子的分析结果的解释是十分自由的,因此转录因子的应用思路是比较丰富的。接下来我将结合案例来为大家梳理3种较为常见的转录因子分析在单细胞研究中的应用思路。

图三:转录因子应用思路的归纳


应用一

细胞亚群表型研究



基于单细胞转录组数据进行的分析都是深入细胞水平的结果,因此我们可以通过转录因子分析中得到的regulons活性以及regulons中基因的功能来推测细胞中的表型特征,从而解析其表型差异。在Kai Chen等人[2]关于胰腺导管腺癌(PDAC)的单细胞研究中,作者通过scenic对PDAC患者残留病灶中的肿瘤细胞亚群进行分析,发现其中的亚群6里参与细胞增殖和DNA修复的regulons存在高活性,因此推测残留病灶中的亚群6可能是后续肿瘤复发和产生耐药的原因。


图四:增殖相关regulons在亚群6具有高活性


应用二

基因调控网络构建


基因调控网络的构建是转录因子分析最主要的应用方向。从转录因子分析中得到的regulons本质上是基因的集合,因此我们可以进一步对这个基因的集合进行可视化,构建regulons之间、regulons之内的调控网络图,实现不同regulons的关联从而挖掘核心调控网络。比如Yuling Tang等[3]对退行性椎管狭窄症的研究中,作者对创伤性韧带和退行性韧带进行单细胞转录组分析并对其中5种基质细胞亚群进行scenic分析来构建调控网络,发现其中ATF3这个转录因子在与韧带退化相关的软骨细胞亚群C02中起到核心调控作用,表明ATF3是与韧带退化相关的关键转录因子。


图五:基质细胞亚群的regulons调控网络


应用三

scATAC关联


转录因子发挥作用的过程本质上是蛋白质与DNA的互作,因此仅仅通过转录组学数据可能难以全面的表征这个过程。scATAC所研究的是单细胞水平中染色体的开放水平,而染色体开放水平直接影响到转录因子与DNA中的motif的结合。通过将二个组学进行关联,可以从多个组学角度研究、验证转录调控分析的结果。比如Cuicui Cai等人[4]在关于牛骨骼肌的发育的研究中,结合了单细胞转录组和单细胞ATAC,结合单细胞转录组的scenic结果和单细胞ATAC的motif富集分析结果,预测出一批可能与肌肉发育相关的特异性表达的转录因子集合。


图六:特异性表达的转录因子和motif富集


小 结

转录因子分析在单细胞研究中已成为基因层面研究的主流方法,它不仅能够解析细胞表型,还能通过调控网络和多组学关联,实现多层次、多维度的分子机制研究。今天,我们详细介绍了单细胞转录组中转录因子分析的主要步骤和应用思路,希望能为各位老师的研究提供新的思路。作为行业内首家推出单细胞转录组云分析平台的公司,基迪奥已将细胞通讯、拟时分析、转录因子分析等个性化分析点整合到omicsmart云分析平台中。如果您希望快速掌握单细胞分析技术,欢迎联系基迪奥的当地销售团队,获取omicsmart的体验资格,开启您的单细胞分析之旅!


参考文献



[1] Aibar S., González-Blas C.B., Moerman T., et al. SCENIC: single-cell regulatory network inference and clustering [J]. Nat Methods, 2017, 14(11): 1083-6.

[2] Chen K., Ma Y., Liu X., et al. Single-cell RNA-seq reveals characteristics in tumor microenvironment of PDAC with MSI-H following neoadjuvant chemotherapy with anti-PD-1 therapy [J]. Cancer Lett, 2023, 576: 216421.

[3] Tang Y., Zhuo D., Yu Y., et al. Single-cell RNA sequencing reveals the CRTAC1(+) population actively contributes to the pathogenesis of spinal ligament degeneration by SPP1(+) macrophage [J]. Aging Cell, 2024: e14320.

[4] Cai C., Wan P., Wang H., et al. Transcriptional and open chromatin analysis of bovine skeletal muscle development by single-cell sequencing [J]. Cell Prolif, 2023, 56(9): e13430.



READ MORE


延伸阅读





*未经许可,不得以任何方式复制或抄袭本篇文章之部分或全部内容。版权所有,侵权必究。


基迪奥生物|专业定制测序服务
联系方式:020-39341079;service@genedenovo.com



基迪奥生物
广州基迪奥生物官方公众号,小奥每天分享前沿组学知识、实用生信软件技巧、酷炫绘图技能。我们的目标是,助您达到更高的科研领域。
 最新文章