Reads比对工具Bowtie2软件的使用

学术   科学   2024-08-02 08:59   上海  

1.Bowtie2软件的适用范围和应用场景

Bowtie2 是将测序后的 reads 与长参考组的比对工具 (适用于将长度大约为50~1000bpreads与相对较长的基因组, 如哺乳动物,进行比对)

Bowtie2使用FM索引(基于Burrows-Wheeler Transform BWT)对基因组进行索引,以此来保持其占用较小内存。对于人类基因组来说,内存占用在3.2G左右。Bowtie2 支持间隔,局部和双端对齐模式。可以同时使用多个处理器来极大的提升比对速度。

通常是比较基因组学(包括 variation callingChIP-seqRNA-seqBS-seq)管道的第一步,可以处理非常长的 Reads(即10~100kb)。


2.Bowtie2软件的下载与安装

方法一:使用源码安装

# 下载安装包

wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.5.4/bowtie2-2.5.4-sra-linux-x86_64.zip/download

# 解压安装包

unzip bowtie2-2.5.4-sra-linux-x86_64.zip

# 跳转到解压后目录,并获取其路径

cd bowtie2-2.5.4-sra-linux-x86_64 && pwd

# 将前一步获取的路径追加到 ~/.bashrc 文件的末尾(使用此步骤前建议备份~/.bashrc

echo PATH=$PATH:/path/to/software/bowtie/bowtie2-2.5.4-sra-linux-x86_64 >> ~/.bashrc

# 重新加载 ~/.bashrc 文件

source ~/.bashrc

# 验证文件是否正确添加(若输出的是 bowtie2 的路径,则表示设置成功)

which bowtie2

方法二:使用conda安装

conda install bowtie2 -y


3.Bowtie2软件的参数解读和使用建议

3.1 参数解读

# 查看帮助信息

bowtie2 -h

# 参数说明

# 常用参数:

  • -x bowtie2-build所生成的索引文件的前缀,需要指定路径及其共用文件名

  •  -1 质控后与read2配对(paired)的read1。可以为多个文件,并用逗号分开;多个文件必须和 -2中指定的文件一一对应

  •  -2 质控后与read1配对的read2

  •  -U 质控后未配对(unpaired)的reads

  •  -S 所生成的SAM格式的文件前缀。默认是输入到标准输出

  •  -p 线程数

# 可选输入参数

  •  -q 输入的文件为FASTQ格式文件,此项为默认值

  •  -f 输入的文件为FASTA格式文件

  •  -5/--trim5 剪掉5'端长度的碱基,再用于比对(default: 0)

  •  -3/--trim3 剪掉3'端长度的碱基,再用于比对(default: 0)

  •  --phred33 输入的碱基质量等于ASCII+33

# 可选Paired-end参数

  •  --no-mixed 默认设置下, 一对reads不能成对比对到参考序列上, 则单独对每个read进行比对. 该选项则阻止此行为

  •  --no-discordant 默认设置下, 一对reads不能合理比对(concordant alignment,即满足-I, -X, --fr/--rf/--ff的条件)到参考序列上, 则搜寻其不合理比对(disconcordant alignment, 即两条reads都能独一无二地比对到参考序列上, 但是不满足-I,-X,--fr/--rf/--ff的条件)。该选项阻止此行为

# 可选–end-to-end模式下的预设参数

  •  --end-to-end 比对是将整个read和参考序列进行比对,该模式--ma的值为0,该模式为默认模式,--local模式冲突

  •  --local 在这种模式下,Bowtie 2不要求整个读取从一端到另一端对齐。相反,为了达到最大可能的对齐分数,可以从末端省略一些字符(“软裁剪”)

  •  --very-fast Same as: -D 5 -R 1 -N 0 -L 22 -i S,0,2.50

  •  --fast Same as: -D 10 -R 2 -N 0 -L 22 -i S,0,2.50

  •  --sensitive Same as: -D 15 -R 2 -N 0 -L 22 -i S,1,1.15 (default in --end-to-end mode)

  •  --very-sensitive Same as: -D 20 -R 3 -N 0 -L 20 -i S,1,0.50

# 可选报告参数

  •  -k  默认设置下, bowtie2搜索出了一个read不同的比对结果, 并报告其中最好的比对结果(如果好几个最好的比对结果得分一致, 则随机挑选出其中一个),该模式下, bowtie2最多搜索出一个read个比对结果, 并将这些结果按得分降序报告出来

  •  -a  -k参数一样, 不过不限制搜索的结果数目. 并将所有的比对结果都按降序报告出来. 此参数和-k参数冲突. 值得注意的是: 如果基因组含有很多重复序列时, 该参数会导致程序运行极其缓慢

# 可选Sam文件使用的参数

  •  --no-unal 不记录没比对上的reads

  •  --no-hd 不记录SAM header lines(以@开头)

  •  --no-sq 不记录@SQSAM header lines

  •  --rg-id 设定read group Id

  •  --rg增加作为一行@RG

# 可选输出参数

  •  --un  将未对其序列写入到指定路径

  •  --no-unal不能mapGENOMEreads,不保留sam记录

  •  --un-conc  不能mapGENOMEreadsfasta格式

  •  --un-conc-gz mapGENOMEreadsfasta格式, gzip压缩

  •  --al-conc mapGENOMEreadsfasta格式

  •  --al-conc-gz  mapGENOMEreadsfasta格式, gzip压缩

3.2 bowtie2使用方法

# 查看参考序列(此处以bowtie2自带示例数据为例)

head lambda_virus.fa

# 使用参考序列构建索引,index为索引前缀

bowtie2-build lambda_virus.fa index

# 目标序列与参考数据库进行比对

# 对双端序列比对

bowtie2 -x index -1 reads_1.fq -2 reads_2.fq -p 32 -S example_pair.sam

# 对单端序列比对

bowtie2 -x index -U reads_1.fq -p 32 -S example_single.sam

# 使用samtoolssam文件转换为bam文件以供后续分析使用

# 需提前安装和配置samtools

samtools sort example_pair.sam > example_pair.bam

samtools sort example_single.sam > example_single.bam


推荐课程

【课程】微生物比较基因组精品系列课——全套自学必入的系统课程

课程链接:微生物比较基因组精品系列课【全套】


【课程】微生物比较基因组与群体进化——基因组变异专题研究

课程链接:微生物比较基因组与群体进化


【课程】密码子偏好性分析——全套(含理论、软件、脚本、方法)

课程链接:遗传密码子偏好性研究课程


【课程】微生物分子分型-MLST课程——分型全套(含理论、软件、方法)

课程链接:微生物分子分型-MLST课程


【课程】R语言入门与高通量测序数据实战处理

课程链接:R语言入门与测序数据实战课程


【课程】肺炎克雷伯菌基因组学研究综合指南

课程链接:肺炎克雷伯菌基因组学研究综合指南


【课程】铜绿假单胞菌基因组研究和分子分型实战

课程链接:绿假单胞菌基因组研究和分子实战


【课程】可移动元件研究实战指南——从理论机制到分析实操

课程链接:可移动元件研究实战指南


【课程】基因组结构分析神器Easyfig实操精品课

课程链接:基因组结构分析神器Easyfig实操精品课


【课程】BRIG绘图——结构比较专题2

课程链接:走进比较基因组,BRIG软件带你轻松玩绘图


【课程】微生物基因组生信必学课程

课程链接:微生物基因组生信分析必学课程


【课程】微生物生防菌研究

课程链接:生防菌的系统化研究



专题材料

【资料】耐药专题材料

【资料】生防专题材料

扫码添加唯那生物技术客服小唯的微信二维码,备注“耐药专题”或“生防专题”,立马获取

客服小唯二维码


更多专题推荐

CORPORATE CULTURE

1、信技能课专辑

2、耐药毒力专题 

3、肺炎克雷伯菌专题

4、密码子偏好性专题

5、Easyfig相关问答

6、MLST-cgMLST

7、软件脚本分享

8微生物基因组研究文章

9、知识干货

10、分泌系统

11、软件下载

12、书籍下载

密码子实验室
我们一直坚持认为,让知识更有价值,让科学研究更简单,让实验室管理更智能化,让每一个热爱学习的人更有效率,是我们的使命。生物信息学实操、实验操作技能、科研绘图技巧、行业动态播报,这里只有干货。
 最新文章