背景导读
枝瑚菌属(Ramaria)的物种通常被称为珊瑚真菌,属于钉菇目(Gomphales)和Phallomycetidae科,具有丰富的细枝孢子果,是与针叶树相关的明显的外生菌根真菌,广泛分布于北半球。枝瑚菌属物种在高等担子菌门中占据独特的系统发育位置,然而不准确的分类限制了枝瑚菌属物种的发现和利用。同时,枝瑚菌属线粒体基因组的特征仍然未知,这限制了人们对枝瑚菌属物种线粒体进化模式和遗传学的认识。线粒体基因组被称为真核生物的“第二基因组”,被认为是通过内共生从细菌中获得的。独立起源、单亲遗传和一些可用的分子标记使线粒体基因组成为推断物种系统发育关系的有效工具。此外,线粒体基因排列、保守基因变异、内含子动态变化、tRNA结构变异、密码子使用等也为物种变异和进化分析提供了丰富的遗传信息。然后真菌线粒体基因组含量和结构的巨大差异使得获得完整的真菌线粒体基因组非常困难。迄今为止,已发表的担子菌有丝分裂基因组不到150个,限制了人们对这一多样真菌群(担子菌门)遗传和进化的理解。在本研究中,作者收集并分析了两种枝瑚菌属物种(Ramaria cfr. rubripermanens和R. rubella)的线粒体基因组,促进我们对枝瑚菌属物种和密切相关属的起源、进化和遗传学的理解。
论文ID
材料方法
1、研究对象
使用SRA公共数据库中已有的数据(SRR5801920和SRR3747475),通过NOVOPlasty软件组装了R. cfr. rubripermanens和R. rubella的完整线粒体基因组,并进行注释。
2、研究方法
与Phallomycetidae其他物种线粒体基因组进行了比较基因组分析,内含子以及进化树构建分析。
研究目的
1、揭示两种枝瑚菌属线粒体基因组的特征;
2、通过线粒体比较基因组分析揭示枝瑚菌属和其他Phallomycetidae物种线粒体基因组之间的变异或保守性;
3、揭示Phallomycetidae物种线粒体基因组的内含子动态;
4、了解担子菌门枝瑚菌属的系统发育状况。
研究结果
1、两个枝瑚菌属线粒体基因组中的PCGs
在本研究中,作者组装了R. cfr. rubripermanens和R. rubella两个枝瑚菌属线粒体基因组,均被环化,大小分别为126497bp和143271bp(图1),GC含量分别为28.92%和31.69%。两个物种线粒体基因组中分别检测到18个和20个PCGs。枝瑚菌属线粒体基因组都包含一整套核心PCGs,包括atp6、atp8、atp9、cob、cox1、cox2、cox3、nad1、nad2、nad3、nad4、nad4L、nad5、nad6和rp3。R. cfr. rubripermanens和R. rubella线粒体基因组分别含有38和37个内含子,它们分布在atp6、cob、cox1、cox2、cox3、nad1、nad2、nad4、nad4L、nad5、rns和rnl基因中。R. cfr. rubripermanens线粒体基因组38个内含子中,有两个group II,32个属于group I,4个属于未知类型。R. rubella的线粒体基因组包含3个group II内含子、30个group I内含子和4个未知内含子。两个物种线粒体基因组中分别含有40和38个ORF,推测其功能编码LAGLIDADG归巢核酸内切酶、GIY-YIG归巢核酸酶、逆转录酶/成熟酶和功能未知的蛋白质。
图1 两个枝瑚菌属线粒体基因组图谱。
基因由不同的色块表示。外部彩色块每个环表示基因位于正向链上,而环内的色块表示基因位于反向链上。内部灰度条形图显示了线粒体序列的GC含量,GC含量图中的圆圈标记50%阈值。
2、枝瑚菌属线粒体基因组中的RNA基因
在枝瑚菌属线粒体基因组中检测到两个rRNA基因,其中包括小亚基核糖体RNA(rns)和大亚基核糖体RNA(rnl)。rns和rnl基因的平均长度分别为1687 bp和3778 bp。R. rubella的rns和rnl基因分别比R. cfr. rubripermanens长29bp和117bp。两个枝瑚菌属线粒体基因组都包含25个tRNA基因,被折叠成经典的三叶草结构(图2)。这两个线粒体基因组包含2个tRNA,它们具有编码精氨酸、丝氨酸和亮氨酸的不同反密码子,而3个tRNAs具有编码蛋氨酸的相同反密码子。每个tRNA的大小是71-88bp。大小>85bp的tRNA基因包括trnS(tga)和trnL(tag),包含比其他tRNA更大的额外臂,表明tRNA的大小变化主要是由于瑚菌属线粒体单体中额外臂的大小变化。在两个枝瑚菌属线粒体基因组之间的25个tRNA基因中共检测到83个突变位点,其中24.10%的可变位点位于额外臂上,其次是D臂。
图2 两个枝瑚菌属线粒体基因组中鉴定的tRNA基因的二级结构。保守的残基以绿色显示,而可变位点以红色显示。
3、线粒体基因组组成分析
R. cfr. rubripermanens和R. rubella线粒体都含有一个重叠的核苷酸,位于相邻基因nad4L和nad5之间(− 1 bp)。两个枝瑚菌属线粒体基因间序列长度为1至4480bp,最长的基因间顺序位于R. cfr. rubripermanens的cox3和atp8之间。内含子区占线粒体基因组的比例很大,分别占R. cfr. rubripermanens和R. rubella线粒体基因组的47.26%和46.85%(图3)。基因间区占第二大比例,分别占整个线粒体基因组的33.80%和34.31%,这表明两个枝瑚菌属线粒体基因组具有相对宽松的结构。蛋白质编码区占两个线粒体基因组的13.20–13.67%。RNA编码区占两个有丝分裂基因组的最小比例(5.17–5.74%)。R. rubella线粒体基因组比R. cfr. rubripermanens大16774bp,内含子区对R. rubella线粒体基因组的大小扩展贡献最大,贡献率为43.74%。基因间区占大小变异的38.17%,蛋白质编码区占R. rubella线粒体基因组扩增的17.23%。
图3 两个枝瑚菌属线粒体基因组组成。下图显示了不同基因区对Ramaria rubella线粒体基因组扩增的贡献。y轴表示不同区域对整个线粒体基因组大小变化的贡献率,通过以下公式计算:区域大小差异/整个有丝基因组大小差异*100%。
4、密码子使用分析
6个Phallomycetidae科线粒体基因组中的大多数核心PCG使用ATG作为起始密码子,除了Sphaerobolus stellatus的cox2基因使用GTG,R. cfr. rubripermanens的nad3基因使用TTG,S. stellatus的nad6基因使用TTG作为起始密码子。TAA是6个Phallomycetidae科线粒体基因组的核心PCG中最常用的终止密码子,其次是TAG。两种枝瑚菌属物种的起始密码子和终止密码子差异很大。密码子使用分析表明,两个枝瑚菌属线粒体基因组中最常用的密码子是AAA(赖氨酸;Lys)、TTT(苯丙氨酸;Phe)、TTA(亮氨酸;Leu)、AAT(天冬酰胺;Asn)、ATT(异亮氨酸;Ile)和TAT(酪氨酸;Tyr)(图4)。密码子中A和T的频繁使用导致两个枝瑚菌属线粒体基因组中AT含量相对较高(平均:69.70%)。
图4 两个枝瑚菌属线粒体基因组的密码子使用频率。
5、重复序列分析
作者对两个枝瑚菌属线粒体基因组进行了针对自身的BlastN搜索,在R. cfr. rubripermanens和R. rubella线粒体基因组中分别鉴定到142和74个重复元件,分别占9.28%和3.25%。这些重复序列的长度为50-413 bp,成对核苷酸相似性为76.47至100%。最大的重复位于R. cfr. rubripermanens线粒体基因组中atp9和cox1基因之间的基因间区域。R. rubella线粒体基因组中最大的重复位于trnM和trnE之间的基因间区域,以及trnE和trnT基因之间的基因区,每个重复长度为100bp。R. cfr. rubripermanens和R. rubella线粒体基因组共检测到37和58个串联重复序列,分别占R.cfr的1.49%和1.98%。在R. cfr. rubripermanens最长的串联重复序列包含48个bp,位于cox3和atp8之间的基因间区域。作者进一步针对两个枝瑚菌属线粒体基因组的核基因组进行了BLAST搜索,以确定核基因组和线粒体基因组之间的重复事件。在R. cfr. rubripermanens和R. rubella线粒体基因组中共检测到18个和22个排列的片段,长度为100-1702 bp,序列同源性为76.82-100%。最大的比对片段位于R. rubella线粒体基因组中rnl基因的第三内含子。R. cfr. rubripermanens中最大的对齐片段在nad2的第一个外显子中(972bp)。
6、核心PCG的演变和变化
线粒体基因组15个核心PCG中的12个显示出序列长度变化,但atp9、cox3和nad4L除外,它们在6个Phallomycetidae物种中具有相同的基因长度(图5)。在检测到的15个核心PCG中,rps3基因的长度变异最大,达到1545bp。atp9的平均GC含量最高(39.04%),其次是cox1基因(35.57%),atp8基因的GC含量最低(平均22.29%)。6种Phallomycetidae物种的核心PCG的GC含量不同,表明Phallomycetidae物种的核心PCG存在频繁的序列突变。15个核心PCG中的14个含有负AT偏斜,在6个Phallomycetidae物种中只有rps3基因含有正AT偏斜,这表明大多数核心PCG倾向于在核心PCG的前导链中向富含T的方向而不是富含A的方向进化。不同Phallomycetidae物种的核心PCG的GC偏斜不同,表明核心PCG中的G/C突变频繁。
图5 6种Phallomycetidae核心蛋白编码基因的序列信息
研究发现rps3基因在检测到的15个核心PCG中的6个Phallomycetidae物种之间具有最大的平均Kimura-2参数(K2P)遗传距离,其次是nad3基因,这表明这些基因在进化过程中差异很大(图6)。nad4L基因在6个Phallomycetidae物种之间具有最小的平均K2P遗传距离,表明该基因高度保守。rps3基因在15个核心PCG中具有最大的非同义替换率(Ka),其次是nad2和nad3基因。而nad4L基因的Ka值最小。在15个核心PCG中,nad3基因的平均同义替换率(Ks)最大,而nad2基因的同义替换率最小。所有15个核心PCG的Ka/Ks值均<1,这表明这些基因都被用于纯化选择。
图6 6种Phallomycetidae中15个核心蛋白编码基因的遗传分析。
7、Phallomycetidae cox1基因的内含子动态
在6个Phallomycetidae线粒体基因组中共检测到156个内含子,它们分布在atp6、cob、cox1、cox2、cox3、nad1、nad2、nad4、nad4L、nad5、rns和rnl基因中(图7)。156个内含子中有6个属于II组,其余属于I组。这些内含子在宿主基因中分布不均。cox1基因含有最多的内含子,占总内含子的31.41%,其次是cob和rnl基因,分别占总内含的16.03%和13.46%。研究发现,内含子偏爱特定的宿主基因,例如,cox1基因往往富含内含子。atp8、atp9、nad3和nad6在6个Phallomycetidae线粒体基因组中不含任何内含子。cox1基因的内含子动态可以显著影响Phallomycetidae线粒体基因组的组成和大小。
作者进一步将6种Phallomycetidae线粒体基因组的cox1基因中的内含子分为不同的位置分类(Pcls),使用药用真菌Ganoderma calidophilum的cox1蛋白作为参考。属于同一Pcl的内含子被认为是同源内含子,并且具有相似的内含子序列或结构。6个Phallomycetidae线粒体基因组的cox1基因中的49个内含子可分为27个Pcls,显示出Phallomycetidae内含子类型的丰富多样性,并且在R. rubella线粒体基因组中发现了一个新的内含子P44。不同的Phallomycetidae物种中内含子的种类和数量各不相同,表明在Phallomycetidae科进化中可能发生内含子丢失/增加事件。P612、P706和P821是Phallomycetidae中分布最广的内含子(属于I组),分布在4种Phallomycetidae物种中。内含子P209、P273、P717、P731和P1057是第二个常见的内含子(属于I组),可以在3个Phallomycetidae线粒体基因组中检测到。然而,一些罕见的Pcl只能在1种物种中检测到,这表明可能的内含子转移事件可能发生在Phallomycetidae进化中。
图7 6种Phallomycetidae物种中cox1基因内含子的位置分类(Pcl)信息
8、基因排列和比较线粒体基因组分析
研究进一步比较了6种Phallomycetidae物种的线粒体基因排列,包括PCG、rRNA基因和tRNA基因。结果表明,有五个Phallomycetidae物种具有相同的PCG和rRNA基因排列(图8)。6个Phallomyceidae物种线粒体基因组的大小从50098-152722 bp不等,平均大小为112345 bp。这两个枝瑚菌属线粒体基因组比其他物种大。6种Phallomycetidae线粒体基因组的GC含量在24.3-31.69%之间,平均GC含量为27.46%。两个枝瑚菌属线粒体基因组的GC含量高于平均值。此外,两个枝瑚菌属线粒体基因组GC含量存在较大差距(2.77%)。每个线粒体基因组包含16–58个PCG,两个枝瑚菌属线粒体基因组包含PCG最多。6种Phallomycetidae物种的线粒体基因组中含有4–38个内含子,其中两个枝瑚菌属线粒体基因中含有最多的内含子。所有6个Phallomyceidae线粒体基因组都含有两个rRNA基因。此外,在6个Phallomycetidae线粒体基因组中检测到24–26个tRNA基因。
图8 6种Phallomycetidae物种的线粒体基因排列分析。绿色色块中的基因表明,来自所有六个物种的基因具有相同的排列;黄色色块中的基因表明,六个物种中的五个物种的基因具有相同的排列;红色块中的基因表示该基因已被转移;紫色区域的基因表明该基因已加倍。
9、进化树分析
本研究基于线粒体基因组合数据集,评估了84种物种的系统发育状况。通过使用贝叶斯(BI)和最大似然(ML)方法,获得了拓扑结构相同且支持良好的系统发育树(图9)。根据系统发育树,84个担子菌门物种可分为18个主要分支,对应于伞菌目、牛肝菌目、鸡油菌目、丝黑粉菌目、地星目、钉菇目、锈革孔菌目、微球黑粉菌目、Microstromatales、鬼笔目、多孔菌目、柄锈菌目、红菇目、锁掷酵母目等。系统发育分析表明,R. cfr. rubripermanens和T. floccosus是姐妹种,亲缘关系密切。该结果与先前的研究一致,表明线粒体基因组是分析担子菌系统发育关系的有效分子标记。
图9 84种担子菌门物种线粒体基因组基于贝叶斯(BI)和14个蛋白质编码基因的最大似然(ML)法的分子系统发育树。
研究结果
本研究从枝瑚菌属获得了R. cfr. rubripermanens和R. rubella两个新的完整线粒体基因组。两个物种线粒体基因组大小变化较大,其中内含子区域对线粒体基因组的大小变化贡献最大(贡献率为43.74%)。作者进一步检测到两个枝瑚菌属线粒体基因组的基因含量、基因长度、tRNA和密码子用法的巨大差异。比较基因组分析检测到Phallomyceidae科物种线粒体基因组之间存在大规模基因重排,包括基因置换和tRNA加倍。研究首先发现了两种枝瑚菌属物种线粒体和核基因组之间可能的基因转移事件。在进化过程中,Phallomycetidae物种线粒体基因组经历了频繁的内含子丢失/增加和潜在的内含子转移事件,并且在R. rubella线粒体基因组中发现了一个新的内含子P44。系统发育分析表明,R. cfr. rubripermanens和T. floccosus物种之间的距离比两种枝瑚菌属物种之间更近。本研究首次记录了该属的线粒体基因组,从而为研究这一重要属和相关真菌群的进化、遗传学和分类学提供了基础。
温馨说明
1、惠通生物针对叶绿体、线粒体测序项目组装结果准确,可以提供定制化高级分析,欢迎联系我们获取小基因组文章专业解决方案,助力文章发表。
2、惠通生物小基因组服务电话:18926264030
欢迎关注物种分类及进化研究
深圳市惠通生物科技有限公司,成立于2016年,技术成员在生物信息方面均有五年以上分析经验,在小基因组项目(叶绿体、线粒体、病毒)上形成强劲技术优势并可提供定制化高级分析内容。成立至今已服务客户单位200余家包括中国科学院植物研究所、中国科学院昆明植物研究所、华南农业大学、浙江大学、中国人民解放军疾病预防控制中心、武汉水生生物研究所等科研单位。合作老师发表小基因组SCI文章逾200篇,发表在《forests》、《 Frontiers in Plant Science》、《Frontiers in Microbiology》、《molecules》、《International Journal of Biological Macromolecules》、《Plant Genome》、《International Journal of Molecular Sciences》、《Infectious Diseases of Poverty》、《peerJ》、《genes》、《frontiers in Veterinary Science》《Frontiers in Immunology》等杂志。