MACS2工作原理
MACS2是2008年最早提出,当时主要用于分析TF的ChIP-seq数据。后来证实对于broad peaks也是适用的。MACS2既可以用于没有Control的ChIP-seq数据,也可以用于有Control的ChIP-seq数据(增加了peak的特异性)。
双峰模型
由于NGS的2个特点(单端,较短),会得到两个峰,分别代表了正负链的峰。但是,TF应该是在这个峰的中间,而非在这两个峰上,所以,我们需要将这两个峰向3'端进行移动。
具体移动多少个bp呢,应该根据DNA fragments的长度。MACS2的方法是,随机找1000个Peaks,然后将每个peak中的Reads分到正负链上,然后计算从正链到负链的距离di,最后对这1000个值取平均值视为DNA fragments的长度。然后我们就可以通过将所有的Reads向3'方向移动d/2距离,从而知道Peaks所在位置。
宽峰和窄峰
这里需要提到2个概念:broad peaks和narrow peaks。一般来说,所谓的broad peaks是指这些区域的peaks信号范围非常的广,看上去很平,不是很sharp。与之对应的是narrow peaks,这些则是peaks信号范围很窄,看上去非常sharp。根据TF和组蛋白的性质,我们一般认为:broad peaks主要是组蛋白的信号;narrow peaks主要是TF的信号。
🔗单细胞测序 、🔗scRNA-seq高级分析、🔗scATAC-seq、 🔗R包开发、🔗源码拆解、 🔗测试、🔗RNA-seq 、🔗其它生信分析、 🔗R语言 、🔗Python 、🔗环境配置 、🔗文献分享 、 🔗一只羊的碎碎念
分享内容:分子标记开发及种质资源鉴定、单细胞多组学数据分析、生信编程、算法原理、文献分享与复现等...
点个赞再走!