GWAS分析QQ图挺好，曼哈顿图没有显著性，如何调整阈值

科技科学 2024-10-15 22:10 河南

大家好，我是邓飞。

在GWAS项目分析时，QQ图和曼哈顿图是我们最常见的两个图，QQ图可以判断模型是否理想（GWAS分析效果好坏重点是看QQ图），曼哈顿图可以看是否有显著性位点（R语言如何绘制GWAS的曼哈顿图和QQ图）

下面是QQ图和曼哈顿图的结果，右边是QQ图，左边是曼哈顿图，每一个曼哈顿图都有一个阈值线，超过阈值线的位点就是显著性位点，这些显著性位点可以进一步注释基因（GWAS分析中显著位点如何注释基因：excel？？？，显著SNP的基因注释教程！，批量对显著性SNP进行注释：bedtools）

问题是，如果QQ图显示比较理想，而曼哈顿图没有显著位点，确实很忧伤，比如星球的小伙伴的结果：

他的结果如下：

上图中，用的是CMLM模型的GWAS分析，QQ图很理想，1-3基本在一条直线上，而4以后翘起来了，符合我们对QQ图的理想预期（GWAS分析效果好坏重点是看QQ图），但是曼哈顿图就没有显著性位点，这里阈值是5，可以看到都没有显著性。其实单独看位点的话，3号染色体、6号染色体和10号染色体还是有潜在显著性为点的，这种情况下，可以调整一下阈值，往下降一点，这样GWAS分析就有显著性位点，就可以进行后续的基因注释了。

问题是，调整阈值，需要科学的依据，不是人为想调整就调整的。

我们首先，介绍一下现在GWAS分析中，阈值是如何确定。确定阈值分为了不同的流派。

第一种方法，Bonferroni矫正

这种方法应用最多，一般是N表示参与分析的SNP的个数，阈值可以是：

* 1/N

* 0.05/N

* 0.01/N

文章中前两种用得较多，这种方法比较严格，有时候1/N也没有显著性位点，这时候，可以考虑降低N的个数。

第二种方法，降低N的个数

由于SNP之间有连锁，可以通过LD筛选，用剩余SNP作为N，从而达到降低阈值的目的，比如使用plink命令 --indep-pairwise 50 10 0.2筛选LD，用剩余的位点作为N，来计算阈值。

第三种方法，置换检验（permutation）

该方法通过置换检验，比如1000次置换检验，然后将最小值排序，选择5%的值作为阈值，该方法从数学角度应该是更合理的方法，具体操作：

a1 正常进行GWAS分析，得到P值结果

a2 将表型数据随机排列，比如排列1000次，得到1000个数据集

a3 对1000个数据集进行gwas分析，得到P值

a4 对P值提取最小的值，得到1000个值，选择5%的值作为阈值

所以，可以通过第二种解决问题，也是比较简单的方法。

注意：上面的这些方法，不会改变原始P值的排名，如果你是要挖掘数据，直接根据原始的P值筛选，进行后面的验证也可以，但是没有显著性的话，可靠性较差。

想要更好的学习和交流，快来加入飞哥的知识星球，这是一个生物统计+数量遗传学+GWAS+GS的社区，在这里你可以向飞哥提问、帮你制定学习计划、跟着飞哥一起做实战项目，冲冲冲。点击这里加入吧：飞哥的学习圈子

分割线

大家好，我是邓飞，一个持续分享的农业数据分析师，这里我将自己公众号的干货内容挑重点罗列一下，方便大家阅读和使用。

1，GWAS学习教程（快来领取 | 飞哥的GWAS分析教程更新啦），这个pdf是我将公众号的内容进行了汇总，更方便从头学习GWAS分析，里面配套了数据、代码和讲解，属于干货推荐的Number 1。

2，农学人如何入门数据分析资料汇总（飞哥汇总 | 入门数据分析资源推荐），里面推荐了免费的教程，包括编程、统计和专业书籍。

3，数量遗传学电子书下载（数量遗传学，分享几本书的电子版）

4，R语言电子书线上书籍推荐（学习R语言这几本电子书就够了！）

http://mp.weixin.qq.com/s?__biz=MzI0MTIzNjYwNQ==&mid=2247496396&idx=1&sn=5f4b519c12c79cc94890d3fd5d03bc77

育种数据分析之放飞自我

本公众号主要介绍动植物育种数据分析中的相关问题, 算法及程序代码.

最新文章

GWAS分析中曼哈顿图如何添加基因信息

GWAS分析神器：GAPIT3.5安装教程

GWAS分析先做后学

基因组学再创新高，农业领域迎来颠覆性进展，解决育种历史科研难题

孟德尔随机化分析直接上手！

《Genome-Wide Association Studies》第六章：GWAS中多年多点表型数据处理

《Genome-Wide Association Studies》第五章：GWAS结果解读

多性状或者多个模型的QQ和曼哈顿重叠图

基因型数据进行PCA分组

R语言免费电子书，一看就会一用就废不看白不看系列

对统计学“又爱又怕”，到底如何学统计？

两天搞定育种中常用的遗传评估和GS

《Genome-Wide Association Studies》第四章：GWAS中的统计模型

GWAS的曼哈顿图和QQ图diamante

多基因平分（PRS）与全基因组关联分析（GWAS）有什么关系？

一行代码对100个性状进行gwas分析

GWAS分析QQ图挺好，曼哈顿图没有显著性，如何调整阈值

孟德尔随机化R包TwoSampleMR安装教程并设置token

孟德尔随机化分析：代码实战

GWAS分析效果好坏重点是看QQ图

遗传力计算 | 随机区组RCBD计算广义遗传力

基因型数据的聚类分析和PCA分析

十一在家把GWAS分析学会吧！

GWAS分析中PCA分层不明显怎么办？你秀什么优越感？

GWAS分析中显著位点如何注释基因：excel？？？

数量遗传学：加性效应、显性效应、替换效应和GWAS的effect效应值

一文搞定R语言箱线图添加显著性的方法

R语言导出数据和统计结果三线表到Word文档中（一文搞定）

从入门到出家：单倍型Haploview分析（万字详解）

中秋推荐书：《动物育种和遗传学》翻译纸质版

撞脸：为何两个路人会长得一样？

配合力和育种值BLUP为啥为负值，几个意思？

孟德尔随机化分析和GWAS分析有什么区别？

R语言实操：使用TwoSampleMR包进行孟德尔随机化分析

从一篇孟德尔随机化文章看MR常见结果形式

孟德尔随机化：工具变量三大假设

IBS和IBD的区别和计算方法介绍

孟德尔随机化的术语理解

GWAS中的分析模型介绍和注意要点

真心建议数据人冲一冲新兴领域，收入还在涨！

GWAS检测的显著性SNP哪个分型是优势基因型？哪个SNP影响大？

obsidian使用初体验

关于遗传力常见的误解

再见了，手机搜索引擎，再见了百度

《Genome-Wide Association Studies》第三章：基因分型平台介绍

一文解决R语言安装包报错的问题

《Genome-Wide Association Studies》第二章：表型数据的准备和管理

《Genome-Wide Association Studies》第一章：GWAS分析的主要步骤和关键要点

用BLUE值作表型进行GWAS分析

plink对100个性状进行gwas分析

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉