自1970年Susumu Ohno发表了其具有深远影响的著作《Evolution by Gene Duplication》以来,基因重复在生命演化过程中所扮演的重要角色逐渐被广泛认知。基因重复是新基因的主要起源机制之一,贡献了真核生物基因组中约一半的基因。近20年来,组学技术的进步使得领域内对重复基因的演化问题进行了更为广泛而深入的探讨。全面总结50年来围绕基因重复这一主题展开的研究,有助于进一步理解一系列演化生物学中的基础问题,如基因重复的机制,重复基因的演化历程,重复基因是如何被整合到现有的基因表达网络中并最终贡献物种特异性表型演化,以及技术发展如何推动基因重复领域研究的范式转换。
2024年10月21日,中国科学院动物研究所张勇团队在《遗传》杂志上发表题为“基因重复驱动的演化:基因组学时代的回顾与展望”综述文章,全面介绍了基因重复的机制、重复基因的命运及演化模型,最后展望了三代测序技术、基因编辑等各种高通量技术对于进一步解析重复基因在遗传-发育-演化网络中角色的可能性。
该综述主要包括4部分的内容:
(1)重复基因的类型及其差异:不同基因重复过程所涉及的分子机制迥异,所产生的重复基因类型也不尽相同。对于小规模重复,作者总结了与串联重复、片段重复、逆转录转座等机制相关的重复基因的结构与功能特点,以及这些基因的进化意义;对于全基因组重复,作者系统概括了脊椎动物祖先的多倍化历史,以及现生真核生物中多倍化事件,并突出介绍了全基因组重复与脊椎动物表型创新之间的关系。
(2)重复基因的命运:在演化长河中,重复基因的丢失与留存在不同物种谱系中动态变化,这也是全文的核心章节。对全基因组重复而言,重复基因的丢失是基因组逐渐二倍化的过程,而这个过程一般被认为是近中性的,反映了物种在不同环境适应下的放松选择。而对于目前留存于现生动物基因组中的重复基因,它们或与祖先基因之间因序列或表达模式的相似性而具有功能冗余性,可能参与生物体稳定性维持;或通过新功能化与亚功能化,实现与祖先基因的功能分歧,进而实现物种的表型创新等(如图所示)。
(3)重复基因的演化模型与演化动力:自20世纪70年代起,不同的重复基因演化模型和对应的演化力量被提出以描述重复基因的演化过程。作者系统性地介绍了包括新功能化、亚功能化、剂量正选择、剂量平衡、功能补偿等经典模型的基本思想与假设,同时对重复基因起源后各个命运分支的时间节点所发生的变化动力进行了总结。
(4)总结与展望。作者首先总结了重复基因对于适应性演化的重要意义,随后,作者阐述了长读长测序、基因编辑等高通量技术如何帮助研究者更加深入、全面地认识重复基因,并总结了重复基因理论及重复基因研究所具有的潜在应用价值。
中国科学院动物研究所张勇研究员与谭生军副研究员为文章共同通讯作者,博士研究生沈洁宇、苏天晗为文章共同第一作者。余大奇博士在文章写作等方面提供了大力支持。张勇课题组深耕新重复基因研究,在转座子介导的基因重复机制、重复机制对新重复基因功能演化的影响、转座子驱动的生物技术开发等方面有较深的积累。课题组相关研究得到国家自然科学基金、国家重点研发计划项目以及中科院基础前沿科学研究计划的资助。
文章录用版链接:沈洁宇, 苏天晗, 余大奇, 谭生军, 张勇. 基因重复驱动的演化:基因组学时代的回顾与展望. 遗传, 2024.
DOI:10.16288/j.yczz.24-215