环境配置 | MACS2简介

文摘   2024-10-16 16:43   江苏  

MACS2工作原理

MACS2是2008年最早提出,当时主要用于分析TF的ChIP-seq数据。后来证实对于broad peaks也是适用的。MACS2既可以用于没有Control的ChIP-seq数据,也可以用于有Control的ChIP-seq数据(增加了peak的特异性)。

双峰模型

由于NGS的2个特点(单端,较短),会得到两个峰,分别代表了正负链的峰。但是,TF应该是在这个峰的中间,而非在这两个峰上,所以,我们需要将这两个峰向3'端进行移动。

具体移动多少个bp呢,应该根据DNA fragments的长度。MACS2的方法是,随机找1000个Peaks,然后将每个peak中的Reads分到正负链上,然后计算从正链到负链的距离di,最后对这1000个值取平均值视为DNA fragments的长度。然后我们就可以通过将所有的Reads向3'方向移动d/2距离,从而知道Peaks所在位置。 

宽峰和窄峰

这里需要提到2个概念:broad peaks和narrow peaks。一般来说,所谓的broad peaks是指这些区域的peaks信号范围非常的广,看上去很平,不是很sharp。与之对应的是narrow peaks,这些则是peaks信号范围很窄,看上去非常sharp。根据TF和组蛋白的性质,我们一般认为:broad peaks主要是组蛋白的信号;narrow peaks主要是TF的信号

END


#

付费视频

#

推荐阅读

🔗单细胞测序🔗scRNA-seq高级分析🔗scATAC-seq🔗R包开发🔗源码拆解🔗测试🔗RNA-seq🔗其它生信分析🔗R语言🔗Python🔗环境配置🔗文献分享🔗一只羊的碎碎念

#

关于我

分享内容:分子标记开发及种质资源鉴定、单细胞多组学数据分析、生信编程、算法原理、文献分享与复现等...

点个赞再走!


你好我是一只羊
个人号,内容主要涉及种质资源、分子标记开发及遗传多样性分析,表观遗传、编程语言在生物信息学中的应用、转录组、基因组、单细胞测序多组学数据分析等;其它更新平台:B站&小红书-一只羊做生信/捡羊毛的咩/生信小羊🐑
 最新文章