1.Bowtie2软件的适用范围和应用场景
2.Bowtie2软件的下载与安装
方法一:使用源码安装
# 下载安装包
wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.5.4/bowtie2-2.5.4-sra-linux-x86_64.zip/download
# 解压安装包
unzip bowtie2-2.5.4-sra-linux-x86_64.zip
# 跳转到解压后目录,并获取其路径
cd bowtie2-2.5.4-sra-linux-x86_64 && pwd
# 将前一步获取的路径追加到 ~/.bashrc 文件的末尾(使用此步骤前建议备份~/.bashrc)
echo PATH=$PATH:/path/to/software/bowtie/bowtie2-2.5.4-sra-linux-x86_64 >> ~/.bashrc
# 重新加载 ~/.bashrc 文件
source ~/.bashrc
# 验证文件是否正确添加(若输出的是 bowtie2 的路径,则表示设置成功)
which bowtie2
3.Bowtie2软件的参数解读和使用建议
3.1 参数解读
# 查看帮助信息
bowtie2 -h
# 参数说明
# 常用参数:
-x 由bowtie2-build所生成的索引文件的前缀,需要指定路径及其共用文件名
-1 质控后与read2配对(paired)的read1。可以为多个文件,并用逗号分开;多个文件必须和 -2中指定的文件一一对应
-2 质控后与read1配对的read2
-U 质控后未配对(unpaired)的reads
-S 所生成的SAM格式的文件前缀。默认是输入到标准输出
-p 线程数
# 可选输入参数
-q 输入的文件为FASTQ格式文件,此项为默认值
-f 输入的文件为FASTA格式文件
-5/--trim5 剪掉5'端长度的碱基,再用于比对(default: 0)
-3/--trim3 剪掉3'端长度的碱基,再用于比对(default: 0)
--phred33 输入的碱基质量等于ASCII+33
# 可选Paired-end参数
--no-mixed 默认设置下, 一对reads不能成对比对到参考序列上, 则单独对每个read进行比对. 该选项则阻止此行为
--no-discordant 默认设置下, 一对reads不能合理比对(concordant alignment,即满足-I, -X, --fr/--rf/--ff的条件)到参考序列上, 则搜寻其不合理比对(disconcordant alignment, 即两条reads都能独一无二地比对到参考序列上, 但是不满足-I,-X,--fr/--rf/--ff的条件)。该选项阻止此行为
# 可选–end-to-end模式下的预设参数
--end-to-end 比对是将整个read和参考序列进行比对,该模式--ma的值为0,该模式为默认模式,--local模式冲突
--local 在这种模式下,Bowtie 2不要求整个读取从一端到另一端对齐。相反,为了达到最大可能的对齐分数,可以从末端省略一些字符(“软裁剪”)
--very-fast Same as: -D 5 -R 1 -N 0 -L 22 -i S,0,2.50
--fast Same as: -D 10 -R 2 -N 0 -L 22 -i S,0,2.50
--sensitive Same as: -D 15 -R 2 -N 0 -L 22 -i S,1,1.15 (default in --end-to-end mode)
--very-sensitive Same as: -D 20 -R 3 -N 0 -L 20 -i S,1,0.50
# 可选报告参数
-k 默认设置下, bowtie2搜索出了一个read不同的比对结果, 并报告其中最好的比对结果(如果好几个最好的比对结果得分一致, 则随机挑选出其中一个),该模式下, bowtie2最多搜索出一个read个比对结果, 并将这些结果按得分降序报告出来
-a 和-k参数一样, 不过不限制搜索的结果数目. 并将所有的比对结果都按降序报告出来. 此参数和-k参数冲突. 值得注意的是: 如果基因组含有很多重复序列时, 该参数会导致程序运行极其缓慢
# 可选Sam文件使用的参数
--no-unal 不记录没比对上的reads
--no-hd 不记录SAM header lines(以@开头)
--no-sq 不记录@SQ的SAM header lines
--rg-id 设定read group Id到
--rg增加作为一行@RG
# 可选输出参数
--un 将未对其序列写入到指定路径
--no-unal不能map到GENOME的reads,不保留sam记录
--un-conc 不能map到GENOME的reads,fasta格式
--un-conc-gz 能map到GENOME的reads,fasta格式, gzip压缩
--al-conc 能map到GENOME的reads,fasta格式
--al-conc-gz 能map到GENOME的reads,fasta格式, gzip压缩
3.2 bowtie2使用方法
# 查看参考序列(此处以bowtie2自带示例数据为例)
head lambda_virus.fa
# 使用参考序列构建索引,index为索引前缀
bowtie2-build lambda_virus.fa index
# 目标序列与参考数据库进行比对
# 对双端序列比对
bowtie2 -x index -1 reads_1.fq -2 reads_2.fq -p 32 -S example_pair.sam
# 对单端序列比对
bowtie2 -x index -U reads_1.fq -p 32 -S example_single.sam
# 使用samtools将sam文件转换为bam文件以供后续分析使用
# 需提前安装和配置samtools
samtools sort example_pair.sam > example_pair.bam
samtools sort example_single.sam > example_single.bam
【课程】微生物比较基因组精品系列课——全套自学必入的系统课程
课程链接:微生物比较基因组精品系列课【全套】
【课程】微生物比较基因组与群体进化——基因组变异专题研究
课程链接:微生物比较基因组与群体进化
【课程】密码子偏好性分析——全套(含理论、软件、脚本、方法)
课程链接:遗传密码子偏好性研究课程
【课程】微生物分子分型-MLST课程——分型全套(含理论、软件、方法)
课程链接:微生物分子分型-MLST课程
【课程】R语言入门与高通量测序数据实战处理
课程链接:R语言入门与测序数据实战课程
【课程】肺炎克雷伯菌基因组学研究综合指南
课程链接:肺炎克雷伯菌基因组学研究综合指南
【课程】铜绿假单胞菌基因组研究和分子分型实战
课程链接:铜绿假单胞菌基因组研究和分子分型实战
【课程】可移动元件研究实战指南——从理论机制到分析实操
课程链接:可移动元件研究实战指南
【课程】基因组结构分析神器Easyfig实操精品课
【课程】BRIG绘图——结构比较专题2
【课程】微生物基因组生信必学课程
课程链接:微生物基因组生信分析必学课程
【课程】微生物生防菌研究
课程链接:生防菌的系统化研究
【资料】耐药专题材料
【资料】生防专题材料
扫码添加唯那生物技术客服小唯的微信二维码,备注“耐药专题”或“生防专题”,立马获取
客服小唯二维码
1、生信技能课专辑
2、耐药毒力专题
3、肺炎克雷伯菌专题
4、密码子偏好性专题
7、软件脚本分享
9、知识干货
10、分泌系统
11、软件下载
12、书籍下载