plink分析二分类性状的GWAS

科技   2024-07-03 21:59   英国  

大家好,我是邓飞。

二分类性状的logistics可以使用plink软件进行分析。这里介绍一下数据的整理和命令的应用。

plink的语境叫“case and control”,其中0和-9都表示缺失。可以选择的方法有卡方检验和逻辑斯蒂回归(X2关联分析和logistic分析)。

「--assoc」,不允许有协变量;

「--logistic」,允许有协变量,如果考虑协变量,速度变慢。比assoc速度慢。

文件准备:

基因型文件:plink的文本文件或者二进制文件

协变量:pca,plink的pca文件即可

plink --file ../geno/c --pca 3

表型数据:FID,IID,y,没有行头,二分类,1和2两种。1是case(有表型),2是control。

注意事项:

1,如果没有性别信息,在代码中加上:

--allow-no-sex

2,如果有协变量,不想输出结果

--hide-covar

完整代码:

plink --file ../geno/d     --logistic     --pheno ../pheno/clean_phe.txt     --out result_logistic     --allow-no-sex     --covar ../covar/plink.eigenvec --hide-covar


推荐阅读:


想要更好的学习和交流,快来加入飞哥的知识星球,这是一个生物统计+数量遗传学+GWAS+GS的社区,在这里你可以向飞哥提问、帮你制定学习计划、跟着飞哥一起做实战项目,冲冲冲。点击这里加入吧:飞哥的学习圈子


1,快来领取 | 飞哥的GWAS分析教程


2,飞哥汇总 | 入门数据分析资源推荐


3,数量遗传学,分享几本书的电子版


4,R语言学习看最新版的电子书不香嘛?


5,书籍及配套代码领取--统计遗传分析导论

育种数据分析之放飞自我
本公众号主要介绍动植物育种数据分析中的相关问题, 算法及程序代码.
 最新文章