FUSION做TWAS分析

文摘   科学   2024-11-21 15:52   北京  

FUSION

前文中我们简单的介绍了TWAS分析原理,并且分享了两款常见的TWAS分析工具

“了解一下TWAS分析”

浮浮无事,公众号:生信课堂TWAS分析的原理和工具


大家分享FUSION做TWAS分析的教程,软件文章发表在Nature Genetic杂志上,地址如下:https://www.nature.com/articles/ng.3506


软件的使用帮助手册可以在这个网站查看:http://gusevlab.org/projects/fusion/

FUSION做TWAS分析

首先需要做一些数据准备工作:

准备表达量数据,第一列、第二列为基因的id,第三列、第四列、第五列为基因所在染色体ID、基因在染色体上的起始位置、基因在染色体上的终止位置,从第六列开始,每一列为一个样本的表达量数据    :

表达量数据文件

准备vcf格式的变异数据,然后将vcf文件转换成bed格式,这里我们使用plink:

#将vcf文件转换成bed格式plink --make-bed --vcf filtered_snp.vcf.gz --recode --out plink --double-id#按照染色体编号拆分for i in {01..12}; doplink --bfile plink --make-bed --chr chr$i --out plink.chr$idone

计算遗传力,在后面的分析中会需要提供,首先准备表型数据文件,第一、二列为样本id,第三列为表型值,不用表头:

trait.txt

然后就可以计算遗传力:

###计算遗传力#计算亲缘关系矩阵gcta --bfile plink --autosome --maf 0.01 --make-grm --out H2 --thread-num 10 --make-grm-gz#去掉有亲缘关系的个体(有可能去掉很多的样本,省略)#/share/work/biosoft/gcta/latest/gcta --grm H2 --grm-cutoff 0.025 --make-grm --out H2_0025#计算SNP遗传力gcta --grm H2 --pheno trait.txt --reml --out H2_PH --thread-num 10


计算位点权重模型(非人物种,人基因组可以使用软件提供的位点权重表达库):

FUSION做TWAS分析的第一步,计算位点与表型的权重矩阵,shell脚本可以在github上面下载到,根据上文提到的帮助手册中的指导对脚本进行修改即可。

https://github.com/gusevlab/fusion_twas/tree/master/examples

修改好后即可运行代码

#计算位点表达权重模型(需要注意两点,1.需要提前预设一个遗传力值;2.如果使用blupblssm需要把所有的内容链接过去然后在output文件夹内运行GEUV.compute_weights.shnohup sh GEUV.compute_weights.sh > GEUV.compute_weights.sh.o

运行TWAS分析代码:

准备个体水平的GWAS summary statistic数据,第一列为SNP位点id,第二列为ref基因型,第三列为alt基因型,第四列为位点的Z score值,文件有表头:

GWAS结果文件

准备基因位置文件,其中第一列为计算出的基因型权重文件地址,第二列为基因ID,后面分别为基因的染色体、起始、终止位置:

基因位置和权重文件路径

然后就可以做TWAS分析了,需要指定计算的染色体:

##进行TWAS分析Rscript FUSION.assoc_test.R \--sumstats Plant_height_all_snp.sumstats.fusion.txt \--weights ./Plant_height.pos \--weights_dir ./WEIGHTS \--ref_ld_chr ./plink. \--chr chr01 \--out outfile


生信课堂
生信笔记
 最新文章