点击蓝字 关注我们
安徽农业大学园艺学院、安徽农业大学信息与计算机学院和四川大学生命科学学院联合通讯,在Horticulture Research上发表了研究成果,开发了一个用户友好的网络工具:quarTeT,专门用于T2T基因组组装和表征。
文章题目
quarTeT: a telomere-to-telomere toolkit for gap-free genome assembly and centromeric repeat identification
第一作者:Yunzhi Lin, Chen Ye
通讯作者:Yi Yue, Yongsheng Liu, Junyang Yu
通讯单位:安徽农业大学园艺学院、安徽农业大学信息与计算机学院和四川大学生命科学学院联合通讯
杂志:Horticulture Research
影响因子:8.7/Q1
文章链接:
https://doi.org/10.1093/hr/uhad127
工具链接:
http://www.atcgn.com:8080/quarTeT/home.html
研究背景
高质量的基因组是功能、进化和比较基因组学研究的基础。随着一个新的“端粒-端粒组装”时代的出现,复杂染色体结构和高度重复序列问题的解决持续被广泛关注。然而,用于自动构建/表征T2T基因组的生物信息学工具是有限的。
▲quarTeT工作流程,包括四个子工具
研究开发了一个专门为T2T基因组组装和表征设计的用户友好的网络工具,包括参考基因组组装、基于超长序列的间隙填充、端粒鉴定和着丝粒预测。quarTeT以缩写“Telomere To Telomere Toolkit”(TTTT)命名,代表四个模块的组合。除先前着丝粒研究之外,它是第一个用以预测着丝粒候选物的工具。
quarTeT的工作流程如上图所示,包括四个子工具:
1. AssemblyMapper:基于参考基因组将contigs组装到染色体水平;
2. GapFiller:利用long reads填补染色体gap;
3. TeloExplorer:鉴定端粒结构特征;
4. CentroMiner:鉴定着丝粒结构特征。
这四个子工具可以单独使用,也可以相互组合使用。quarTeT工具还支持命令行界面,使用时可在多个进程中运行以提高cluster计算速度等,对泛基因组等其他多基因组研究也提供了便利。
▲quarTeT的CentroMiner模块识别中心区域位置
为了评估quarTeT工具的准确性,基于已发布的猕猴桃T2T参考基因组测序数据,研究人员将HY4Q与同人工组装和注释的基因组(HY4P组装)进行了比较。在29条染色体中,HY4Q有17条染色体与HY4P相同,其余12条染色体的同源性>99.97%,表明quarTeT能够以较高的准确度组装T2T基因组。HY4P的BUSCO完整性和LAI分别为99.3%和16.38,仅略优于HY4Q,表明通过quarTeT组装的基因组几乎可以达到人工组装基因组的质量。在HY4P中定义的所有29个着丝粒中,有23个被CentroMiner确定为前5个候选,只有Chr15上鉴定的着丝粒与HY4P不一致,证明quarTeT能够识别T2T基因组中的着丝粒。
CentroMiner作为预测着丝粒候选物的工具,研究人员通过鉴定拟南芥和水稻基因组中着丝粒来检验其有效性和准确性,发现拟南芥基因组中鉴定的着丝粒与先前研究报道的区域完全匹配;水稻基因组中发现的着丝粒区域比之前研究定义的稍宽,但核心区域一致,表明在大多数情况下CentroMiner子工具能够准确识别着丝粒,且能够在尚未进行着丝粒研究报道的物种中识别。
▲quarTeT工具页面
佰艾基因Bioeditas
暑期送福利!超划算!
点击上方链接跳转△
往期阅读
SPL基因家族分析就这么来!两篇文章带你理顺流程
点击了解详情 ▶
经典案例 | 基因组等多种技术分析揭示甘蓝型油菜黄籽性状的遗传基础
点击了解详情 ▶
经典案例 | 马齿苋染色体水平高质量基因组揭示C4和CAM起源、进化以及代谢整合
点击了解详情 ▶
欢迎投稿
欢迎您及相关广大科研工作者分享我们的努力,您的分享就是我们的澎湃动力!
“佰艾基因”公众号平台尊重知识产权
我们欢迎原创作者及时供稿,并对首发作者支付报酬
若涉及版权问题,烦请作者联系我们及时处理
凡转载或运用本公众号内容,请注明来源于佰艾基因
谢谢!
佰艾基因
/Bioeditas/
提供领先的基因科技解决方案
长按关注服务号
长按关注订阅号
点击“在看”给我一朵小黄花
点击“阅读原文”即可跳转原文献