scATAC|如何描述基因表达与染色质开放的相关性

文摘   2024-07-01 15:33   江苏  

🔗scRNA-seq🔗scRNA-seq高级分析🔗scATAC-seq🔗R包开发🔗源码拆解🔗测试🔗RNA-seq🔗其它生信分析🔗R语言🔗Python🔗环境配置🔗文献分享🔗一只羊的碎碎念

scRNA-seq描述了细胞的转录组特征,而scATAC-seq则描述了细胞基染色质开放性状态,显然这两种组学特征之间存在着某种相关性:我们期望的是某一个基因越开放,则通常它的表达量就越高。那么如何描述这种关系呢?

为了描述基因表达和染色质开放的相关性,说到相关性很自然的想到两个组学的相关性散点图,对于scATAC-seq等表观组的数据,我们通常使用peak来表征其在某一个位点上的强弱。尽管我们可以提取基因坐标向上游拓展然后统计peak数量,将cell × peak矩阵转换成基因表达活性矩阵(cell × gene),然后去做相关性,但是这样做的结果相关性不太好:

本篇文章示例代码的原理,简单来说是根据scRNA-seq数据中基因的表达量,分为了N组(最下面一条线表示在scRNA-seq中表达量为0的基因,越往上表达量越高),然后去作图:

我们根据这张图可以描述,基因表达和染色质开放的相关性。完整代码如下所示:

计算每个基因的表达量

你好我是一只羊
个人号,内容主要涉及种质资源、分子标记开发及遗传多样性分析,表观遗传、编程语言在生物信息学中的应用、转录组、基因组、单细胞测序多组学数据分析等;其它更新平台:B站&小红书-一只羊做生信/捡羊毛的咩/生信小羊🐑
 最新文章