首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

GWAS分析中PCA分层不明显怎么办？你秀什么优越感？

科技 2024-09-27 21:57 河南

大家好，我是邓飞。

今天星球小伙伴问了一个问题，直击灵魂：

飞哥 pca图群体分层不是特别明显原因是啥呢这个结果图可用吗？

为何会有这个问题呢，因为很多GWAS分析中都会给出PCA结果，有时候PCA分得很开，有时候还用不同颜色分组，类似：

分得很开，好像才算正常的结果！

PC1和PC2解释百分比很高，好像才算正常的结果！

不是这样的，PCA分得很开，说明群体有分层，不适合统一放在一起进行GWAS分析，因为不是一个整体。

但是，因为样本量很小，勉强将这些群体放在一起，但是这些分层的群体，分层之间的效应一定要去除，这和试验设计中设置区组，然后分解出区组效应是一样一样的，都是为了降低外在因素的影响，降低系统性误差！

回到最初的问题，GWAS分析中，PCA结果没有分开，怎么办？

太好了，说明群体没有分层，理论上不用将PCA放到模型中进行矫正了，如果你不放心，也可以把pca放进去做协变量，对结果影响不大。

如果你的群体分层严重，但是你没有考虑PCA，没有将PCA放到模型中，那就惨啦，模型结果不靠谱，你看到的显著性位点大都是假阳性，都是由于群体分层导致的，考虑PCA效果会好一点。

讲真，GWAS分析中，群体结构分层明显的群体，真不如没有分层的群体，毕竟，好好的群体本来就在一起，不是挺好吗。

一个牛人说过：所有的模型都是错误的，但有些是有用的。

All models are wrong, but some are useful.）这句话出自统计学家George E. P. Box的口中，简洁地概括了数学建模的本质。

套用到GWAS分析中：群体分层的群体，做GWAS是不太合适的，但是经过PCA矫正之后，是有用的。没有群体分层的群体，你秀什么优越感？

推荐阅读：

想要更好的学习和交流，快来加入飞哥的知识星球，这是一个生物统计+数量遗传学+GWAS+GS的社区，在这里你可以向飞哥提问、帮你指定学习计划、跟着飞哥一起做实战项目，冲冲冲。点击这里加入吧：飞哥的学习圈子

1，快来领取 | 飞哥的GWAS分析教程

2，飞哥汇总 | 入门数据分析资源推荐

3，数量遗传学，分享几本书的电子版

4，R语言学习看最新版的电子书不香嘛？

5，书籍及配套代码领取--统计遗传分析导论

http://mp.weixin.qq.com/s?__biz=MzI0MTIzNjYwNQ==&mid=2247496331&idx=1&sn=6d096ed3f0e00f480517f85cef1db069

育种数据分析之放飞自我

本公众号主要介绍动植物育种数据分析中的相关问题, 算法及程序代码.

最新文章

GWAS分析中曼哈顿图如何添加基因信息

GWAS分析神器：GAPIT3.5安装教程

GWAS分析先做后学

基因组学再创新高，农业领域迎来颠覆性进展，解决育种历史科研难题

孟德尔随机化分析直接上手！

《Genome-Wide Association Studies》第六章：GWAS中多年多点表型数据处理

《Genome-Wide Association Studies》第五章：GWAS结果解读

多性状或者多个模型的QQ和曼哈顿重叠图

基因型数据进行PCA分组

R语言免费电子书，一看就会一用就废不看白不看系列

对统计学“又爱又怕”，到底如何学统计？

两天搞定育种中常用的遗传评估和GS

《Genome-Wide Association Studies》第四章：GWAS中的统计模型

GWAS的曼哈顿图和QQ图diamante

多基因平分（PRS）与全基因组关联分析（GWAS）有什么关系？

一行代码对100个性状进行gwas分析

GWAS分析QQ图挺好，曼哈顿图没有显著性，如何调整阈值

孟德尔随机化R包TwoSampleMR安装教程并设置token

孟德尔随机化分析：代码实战

GWAS分析效果好坏重点是看QQ图

遗传力计算 | 随机区组RCBD计算广义遗传力

基因型数据的聚类分析和PCA分析

十一在家把GWAS分析学会吧！

GWAS分析中PCA分层不明显怎么办？你秀什么优越感？

GWAS分析中显著位点如何注释基因：excel？？？

数量遗传学：加性效应、显性效应、替换效应和GWAS的effect效应值

一文搞定R语言箱线图添加显著性的方法

R语言导出数据和统计结果三线表到Word文档中（一文搞定）

从入门到出家：单倍型Haploview分析（万字详解）

中秋推荐书：《动物育种和遗传学》翻译纸质版

撞脸：为何两个路人会长得一样？

配合力和育种值BLUP为啥为负值，几个意思？

孟德尔随机化分析和GWAS分析有什么区别？

R语言实操：使用TwoSampleMR包进行孟德尔随机化分析

从一篇孟德尔随机化文章看MR常见结果形式

孟德尔随机化：工具变量三大假设

IBS和IBD的区别和计算方法介绍

孟德尔随机化的术语理解

GWAS中的分析模型介绍和注意要点

真心建议数据人冲一冲新兴领域，收入还在涨！

GWAS检测的显著性SNP哪个分型是优势基因型？哪个SNP影响大？

obsidian使用初体验

关于遗传力常见的误解

再见了，手机搜索引擎，再见了百度

《Genome-Wide Association Studies》第三章：基因分型平台介绍

一文解决R语言安装包报错的问题

《Genome-Wide Association Studies》第二章：表型数据的准备和管理

《Genome-Wide Association Studies》第一章：GWAS分析的主要步骤和关键要点

用BLUE值作表型进行GWAS分析

plink对100个性状进行gwas分析

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉