T2T(telomere-to-telomere,端粒至端粒)是一种最新的基因组组装标准。它要求基因组每条染色体从一端端粒至另一端端粒中的所有复杂结构、高度重复序列等都能被完整组装,内部没有或仅有少数缺口。T2T基因组的组装不仅对端粒、着丝粒等高度重复序列的研究具有重要意义,而且能够获得基因组的完整遗传信息。
该研究开发了一款名为quarTeT的T2T基因组组装与端粒/着丝粒鉴定工具包,包含AssemblyMapper、GapFiller、TeloExplorer和CentroMiner四个子工具。
1. AssemblyMapper:基于参考基因组将重叠群(contigs)挂载到染色体水平的工具。
2. GapFiller:利用长读长序列(long reads)填补基因组中染色体缺口(gap)的工具。
3. TeloExplorer:鉴定基因组中端粒结构特征的工具。
4. CentroMiner:鉴定基因组中着丝粒结构特征的工具。
基于已发布的猕猴桃T2T参考基因组Hongyang v4.0的原始测序数据,quarTeT开发者使用AssemblyMapper和GapFiller两个子工具进行基因组从头组装,得到了与发表文章组装水平相当的结果。开发者接着使用CentroMiner子工具分别对拟南芥(Arabidopsis thaliana)和水稻(Oryza sativa)基因组中的着丝粒结构进行了鉴定,分析结果与两篇文章所用实验得到的数据基本一致。
quarTeT同时提供了在线分析平台和本地使用源码(图1)。在线平台通过网页访问,基于图形交互使用,操作简单,上手容易,输出结果直观易懂;而本地版则要下载安装,运行效率高,不受网络限制,但需要具备一定的Linux和Python基础。此外,quarTeT还开发了首个从头鉴定着丝粒结构的工具CentroMiner,有助于对一直以来被称为“基因组黑洞”的着丝粒区域进行大规模研究,进一步降低T2T基因组研究的门槛,推动基因组研究全面进入“T2T时代”。
quarTeT在线平台和本地源码访问网址:
四川大学生命科学学院硕士研究生林云志和安徽农业大学信息与计算机学院硕士研究生叶晨为该论文的共同第一作者,安徽农业大学园艺学院岳俊阳副教授、园艺学院刘永胜特聘教授和信息与计算机学院乐毅副教授为论文的共同通讯作者,合作单位的多位老师和学生参与了本项目的相关工作。该研究获得了安徽农业大学高层次人才启动经费、国家自然科学基金(31972474和31471157)、安徽农业大学茶树生物学与资源利用国家重点实验室开放基金(SKLTOF20150103)等项目的资助。
通讯作者介绍
刘永胜 教授
乐毅 副教授
文章链接:
https://doi.org/10.1093/hr/uhad127
加入作者交流群
About Horticulture Research
南京农业大学英文期刊
欢迎转载,留言开白。