第66卷10期封面故事
菠萝参考基因组:T2T 组装与“铂金级”基因结构注释
JIPB 2024年66卷第10期封面故事来自中国热带农业科学院热带作物品种资源研究所团队全员参与完成的科研成果:“The Pineapple Reference Genome: Telomere-to-Telomere Assembly, Manually Curated Annotation, and Comparative Analysis” (https://doi.org/10.1111/jipb.13748)。该工作完成了菠萝三个新材料的基因组测定和组装,发布了首个菠萝“端粒到端粒”参考基因组序列组装和“铂金级”菠萝基因结构注释信息,并搭建了菠萝基因组信息数据库,提供资源共享接口。此外,通过比较基因组分析和转录组数据联合分析,筛选鉴定了一个菠萝叶色调控基因。这些成果,为下一步菠萝分子辅助下的远缘杂交育种和高抗食赏两用新品种选育提供给了更为全面和扎实的基础。
整合比较,构建菠萝 T2T 参考基因组组装版本
研究者分别对三个材料进行基因组组装和组装质量比较分析,选定一套最好的染色体集合,组成每条染色体都有完整着丝粒和端粒的组装集合 (其中 Chr24 未检测到端粒,可能是近端着丝粒导致)。通过各类组装指标的评估,包括BUSCO,QV,LAI,CRAQ 均一致显示当前版本的高度完整性 (详细可参考论文附件)。
为了进一步确定组装完整度,团队对不同染色体序列进行了分析,筛选并鉴定菠萝端粒和着丝粒的复制单元。参考审稿人的建议,设计探针并开展了 FISH 实验。结果图片完整展示了菠萝 25 对染色体 (共50条) 上的端粒位置和着丝粒位置,印证了复制单元序列的可靠性,进一步支持当前的菠萝基因组组装版本达到真正意义上的“T2T”级别,是良好的菠萝生物育种的资料参考。
“铂金级”基因结构注释,提供扎实功能基因组研究基础
伴随长读段测序技术的发展,如 Pacbio HiFi、Nanopore等,高质量基因组序列组装已逐步趋于常规。较多物种已经存在一系列组装优化版本,其中不乏‘T2T’级别组装。但在日常科研工作中,作者发现更多人仍然倾向于使用早期基因组组装版本而非优化后版本,其原因不在组装,而在注释。错误或者不全面的基因结构注释会严重阻碍甚至误导科研方向。功能基因组研究人员,需要高质量基因组序列,但同时也极度需要对应的高质量基因结构注释信息。为此,该团队同步提供了菠萝首个“铂金级”基因结构注释。
在完成这一项目过程中,研究团队同步完善了GSAman软件 (未发表),并基于这一软件,调动团队所有成员,耗时近一个月时间,对菠萝每一个基因进行人工查看、对照和校准,最终完成了菠萝高质量基因结构注释,BUSCO完成度从初始注释的 94.5% 提升到 99.2%。
菠萝基因组基因结构注释中,不同位置的基因存在不同的错误注释问题。得到人工校准的基因,在每条染色体中相对均匀地分布 (多数>100个基因/CDS)。其中新增16个基因,而绝大多数均为电子注释不完善导致,尤其体现在基因结构或者CDS注释区域有误,与功能基因组研究直接关联。
系列基因组组装和注释比较分析,进一步确定‘Ref’为最优菠萝参考基因组
尽管在基因组组装和结构注释的统计指标上,作者得到的参考基因组‘Ref’质量高。但仍然需要做比较分析以确定是否当前质量取得明显提升。为此,研究人员做了BUSCO指标分析。其中发现第一个菠萝组装版本 F153 尽管组装序列未完整,但注释却是在‘Ref’之前的最优版本,这些结果对应了前述说法,也是2015年发布的 F153 组装和注释版本仍然被广泛使用的原因。Ref 的评估结果则已经接近饱和。得益于测序技术的发展和应用以及GSAman软件的开发,在序列完整度和注释完成度上,‘Ref’远超 F153,是目前最优的菠萝参考基因组。
研究团队也进行了与其他菠萝基因组组装版本的比较,详细可见论文附件。
比较基因组联合转录组分析,鉴定 LY 全株红色基因控制位点
品资所菠萝团队长期致力于食赏两用菠萝新品种选育,对菠萝观赏性状尤为关注。当前项目中,LY 为菠萝变种中的特殊材料之一,叶片直立,全株深红,极具观赏性。叶片呈现红色的主要原因在前述发表工作中已经确认为花青素的持续积累。为此,团队通过对不同菠萝组装序列进行比较分析,鉴定存在的基因结构变异 (SV),同步鉴定了菠萝花青素合成通路相关基因,合并早期在菠萝花青素合成调控通路的家族成员鉴定结果,筛选出 30 个在 SV 附近的花青素合成和调控相关基因。通过进一步转录组分析,锚定 MYB528 (Lcfv2_02528) 为获选菠萝叶色调控基因。
在编辑和审稿人的建议下,该团队进一步对该基因相关变异 (~1.9kb) 进行了多基因组比较分析,并明确在 MYB528 附近的 SV 是一个插入而非缺失,该插入仅在LY中存在。这段插入具有明显提升基因表达量的作用。同步,团队也做了 MYB528 的本体超表达植株,从表型和生理指标均可确认该基因可以直接提升菠萝叶片花青素合成量。
小结
团队介绍
工作由中国热带农业科学院热带作物品种资源研究所 (热带作物生物育种全国重点实验室) 主导完成 (第一通讯单位)。热科院品资所菠萝课题组栾爱萍副研究员和贺军虎研究员为论文通讯作者。冯筠庭助理研究员、张伟博士、陈程杰副研究员为论文共同第一作者。华南农业大学何业华教授为工作提供了重要资料基础和开展建议。梁茵龙、李塘秀、吴亚、刘慧、吴竞、林文秋和李嘉威等学生和老师参与了相关工作,尤其在基因结构注释的人工校正方面。研究团队感谢国家热带植物种质资源库的项目和材料支持,以及华南农业大学廖毅教授和吴锋琦博士提供的宝贵建议和技术支持。
文章引用:
Feng, J., Zhang, W., Chen, C., Liang, Y., Li, T., Wu, Y., Liu, H., Wu, J., Lin, W., Li, J. et al. (2024). The pineapple reference genome: Telomere-to-telomere assembly, manually curated annotation, and comparative analysis. J. Integr. Plant Biol. 66: 2208–2225.
#茎叶发育
#光合作用
#光信号
#叶片衰老
#JIPB热点论文 | 植物的“金属考验”:毒性与解毒之战——植物与微量金属相互作用的挑战、机制与未来展望#
往期合集:
物种研究合集:
长按二维码
关注JIPB