quarTeT|鉴定基因组中的端粒(1)

文摘   科学   2024-07-09 17:07   广东  
T2T(telomere-to-telomere,端粒至端粒)是一种最新的基因组组装标准。它要求基因组每条染色体从一端端粒至另一端端粒中的所有复杂结构、高度重复序列等都能被完整组装,内部没有或仅有少数缺口。
端粒是染色体末端的特殊结构,它的DNA序列更加保守。在动物中是(TTAGGG)n,而在植物中的重复单元是(TTTAGGG)n。quarTeT( Telomere-to-telomere Toolkit)工具包中的TeloExplorer模块,可以帮助我们在新组装的基因组中查找端粒。

软件作者提供的说明:

软件安装与测试

conda create -n quartet --channel conda-forge --channel bioconda Python Minimap2 MUMmer4 trf CD-hit BLAST tidk R R-RIdeogram R-ggplot2 gnuplot  # 安装相关依赖git clone https://github.com/aaranyue/quarTeT.git  # 克隆该工具仓库到本地(软件本体,无需安装)cd quarTeT  # 进入quarTeT目录ls  # 该文件夹中的python文件quartet_teloexplorer.py,便可用来鉴定端粒。python quartet_teloexplorer.py -h  # 查看quartet_teloexplorer模块的用法。
Usage: python3 quartet.py TeloExplorer <parameters>  -h, --help            show this help message and exit  -i GENOME             (*Required) Genome file to be identified, FASTA format.  -c {plant,animal,other}Specify clade of this genome. Plant will search TTTAGGG, animal will search TTAGGG, other will use tidk explore's suggestion, default: other  -m MIN_REPEAT_TIMES   The min repeat times to be reported, default: 100  -p PREFIX             The prefix used on generated files, default: quarTeT  --noplot              Skip all ploting.

运行程序

python3 quarTeT_pathway/quartet_teloexplorer.py -i genome_pathway/genome.fasta -c plant -p genome # -i 需要以fasta格式的基因组文件作为输入。# -p 可以跟想要的输出文件名,默认是quarTeT

运行结果

{prefix}.telo.info  | The statistic of telomere, including monomer, repeat times on both end of each chromosome.{prefix}.telo.png   | The figure draws telomere location, alongside relative length of chromosomes and gap locations for assembly.

运行错误

如果遇到以上报错,表明系统中缺少一个软件tidk ,而且它没有被安装、没有添加到环境变量 $PATH 中,或者没有被授权为可执行文件。解决方法如下
conda install tidk=0.2.1 -c conda-forge -y# 通过conda-forge渠道,安装低版本的tidk。

如果遇到以上报错,表明系统中缺少一个R包中的绘图软件RIdeogram ,而导致绘图停止了。解决方法如下
conda install r-rideogram -c conda-forge -y# 通过conda-forge渠道,安装r-rideogram。
如果还不能顺利安装RIdeogram ,可运行以下代码:
在命令行中运行以下命令,将 conda-forge 添加到渠道列表中:conda config --add channels conda-forgeconda config --set channel_priority strictconda install r-rideogram

植信矿工
专注于分享植物方向的最新学术成果、前沿知识和技术进步,以及实践优化过的生信软件、脚本和流程。
 最新文章