大家好,我是邓飞。
二分类性状的logistics可以使用plink软件进行分析。这里介绍一下数据的整理和命令的应用。
plink的语境叫“case and control”,其中0和-9都表示缺失。可以选择的方法有卡方检验和逻辑斯蒂回归(X2关联分析和logistic分析)。
「--assoc」,不允许有协变量;
「--logistic」,允许有协变量,如果考虑协变量,速度变慢。比assoc速度慢。
文件准备:
基因型文件:plink的文本文件或者二进制文件
协变量:pca,plink的pca文件即可
plink --file ../geno/c --pca 3
表型数据:FID,IID,y,没有行头,二分类,1和2两种。1是case(有表型),2是control。
注意事项:
1,如果没有性别信息,在代码中加上:
--allow-no-sex
2,如果有协变量,不想输出结果
--hide-covar
完整代码:
plink --file ../geno/d
--logistic
--pheno ../pheno/clean_phe.txt
--out result_logistic
--allow-no-sex
--covar ../covar/plink.eigenvec --hide-covar
推荐阅读:
想要更好的学习和交流,快来加入飞哥的知识星球,这是一个生物统计+数量遗传学+GWAS+GS的社区,在这里你可以向飞哥提问、帮你制定学习计划、跟着飞哥一起做实战项目,冲冲冲。点击这里加入吧:飞哥的学习圈子