FUSION
前文中我们简单的介绍了TWAS分析原理,并且分享了两款常见的TWAS分析工具
“了解一下TWAS分析”
浮浮无事,公众号:生信课堂TWAS分析的原理和工具
今天给大家分享FUSION做TWAS分析的教程,软件文章发表在Nature Genetic杂志上,地址如下:https://www.nature.com/articles/ng.3506
软件的使用帮助手册可以在这个网站查看:http://gusevlab.org/projects/fusion/
FUSION做TWAS分析
首先需要做一些数据准备工作:
准备vcf格式的变异数据,然后将vcf文件转换成bed格式,这里我们使用plink:
plink --make-bed --vcf filtered_snp.vcf.gz --recode --out plink --double-id
for i in {01..12}; do
plink --bfile plink --make-bed --chr chr$i --out plink.chr$i
done
trait.txt
然后就可以计算遗传力:
###计算遗传力
#计算亲缘关系矩阵
gcta --bfile plink --autosome --maf 0.01 --make-grm --out H2 --thread-num 10 --make-grm-gz
#去掉有亲缘关系的个体(有可能去掉很多的样本,省略)
#/share/work/biosoft/gcta/latest/gcta --grm H2 --grm-cutoff 0.025 --make-grm --out H2_0025
#计算SNP遗传力
gcta --grm H2 --pheno trait.txt --reml --out H2_PH --thread-num 10
计算位点权重模型(非人物种,人基因组可以使用软件提供的位点权重表达库):
FUSION做TWAS分析的第一步,计算位点与表型的权重矩阵,shell脚本可以在github上面下载到,根据上文提到的帮助手册中的指导对脚本进行修改即可。
https://github.com/gusevlab/fusion_twas/tree/master/examples
修改好后即可运行代码
#计算位点表达权重模型(需要注意两点,1.需要提前预设一个遗传力值;2.如果使用blup和blssm需要把所有的内容链接过去然后在output文件夹内运行GEUV.compute_weights.sh)
nohup sh GEUV.compute_weights.sh > GEUV.compute_weights.sh.o
运行TWAS分析代码:
准备个体水平的GWAS summary statistic数据,第一列为SNP位点id,第二列为ref基因型,第三列为alt基因型,第四列为位点的Z score值,文件有表头:
GWAS结果文件
准备基因位置文件,其中第一列为计算出的基因型权重文件地址,第二列为基因ID,后面分别为基因的染色体、起始、终止位置:
基因位置和权重文件路径
然后就可以做TWAS分析了,需要指定计算的染色体:
##进行TWAS分析
Rscript FUSION.assoc_test.R \
--sumstats Plant_height_all_snp.sumstats.fusion.txt \
--weights ./Plant_height.pos \
--weights_dir ./WEIGHTS \
--ref_ld_chr ./plink. \
--chr chr01 \
--out outfile