大家好,我是邓飞。
今天聊一下,GWAS分析后,如何评价结果的好坏。我们知道GWAS分析有两个可视化的图:R语言如何绘制GWAS的曼哈顿图和QQ图
什么是QQ图?
QQ图,全称quantile-quantile plot
,又称为「分位图」它是判断模型假阳性、假阴性的重要指标。
理想的QQ图:刚开始的位点,比如-log10在3之前,都是和均匀分布是一致的,是随机漂变导致的。在大于3之后,均匀分布还是在直线上,但是由于随机漂变+真实位点的存在,开始偏离直线,并且上翘,这些上翘的位点就是我们关注的位点。
所以,好的GWAS分析,有结果的QQ图,都是前期在直线上,后面上翘。有点翘的QQ图才是好的QQ图。
什么是曼哈顿图?
首先,曼哈顿是一个地名,是这样的:
因为建筑高低错落有致,我们将GWAS中不同染色体表示不同的位置,将不同SNP的P值比作不同的建筑,就会有种曼哈顿夜景的感觉:
理想的曼哈顿图:
GWAS分析中,原理就是SNP位点和控制性状的基因存在LD状态,即SNP的分型可以代表基因的不同分型,所以,真实的显著位点应该是在基因两侧分布的,有一个上升和下降的趋势,比如这样的图:
GWAS分析效果好坏重点是看QQ图
如果数据量比较少的GWAS项目,用了不同的GWAS模型,比如GLM、MLM、BLINK、FarmCPU等,这个时候就可以根据QQ图去判断哪个模型更合适你的数据。
比如星球上有老师分享了他的结果,用不同的模型跑了同一套数据,QQ图如下:
上图用到了7个模型,用的软件是GAPIT(GWAS软件包:GAPIT3它来啦),我们可以看到,根据最好的QQ图的特点,前面应该在一条直线上,后面翘起来。首先可以排除第一个和第二个图,刚开始偏离直线,假阳性较高。第三个图不错,第四个有点飘,第五个不错,第六个后面太高了,第七个不错。综上所述,第3、5,7比较好,最好的应该是第5个,简直可以说是完美。
推荐阅读:
想要更好的学习和交流,快来加入飞哥的知识星球,这是一个生物统计+数量遗传学+GWAS+GS的社区,在这里你可以向飞哥提问、帮你制定学习计划、跟着飞哥一起做实战项目,冲冲冲。点击这里加入吧:飞哥的学习圈子