🔗scRNA-seq 、🔗scRNA-seq高级分析、🔗scATAC-seq、 🔗R包开发、🔗源码拆解、 🔗测试、🔗RNA-seq 、🔗其它生信分析、 🔗R语言 、🔗Python 、🔗环境配置 、🔗文献分享 、 🔗一只羊的碎碎念
scRNA-seq描述了细胞的转录组特征,而scATAC-seq则描述了细胞基染色质开放性状态,显然这两种组学特征之间存在着某种相关性:我们期望的是某一个基因越开放,则通常它的表达量就越高。那么如何描述这种关系呢?
为了描述基因表达和染色质开放的相关性,说到相关性很自然的想到两个组学的相关性散点图,对于scATAC-seq等表观组的数据,我们通常使用peak来表征其在某一个位点上的强弱。尽管我们可以提取基因坐标向上游拓展然后统计peak数量,将cell × peak矩阵转换成基因表达活性矩阵(cell × gene),然后去做相关性,但是这样做的结果相关性不太好:
本篇文章示例代码的原理,简单来说是根据scRNA-seq数据中基因的表达量,分为了N组(最下面一条线表示在scRNA-seq中表达量为0的基因,越往上表达量越高),然后去作图:
我们根据这张图可以描述,基因表达和染色质开放的相关性。完整代码如下所示: