摘要
拟盘多毛孢属(Neopestalotiopsis)包括一些专性寄生物,能够引起高等植物的环斑病、疮痂病和叶枯病。我们组装了三个完整的番石榴果实环斑病病原体Neopestalotiopsis cubana的线粒体基因组,线粒体基因组是环状的,大小分别为38,666 bp、33,846 bp和32,593 bp。与无花果拟盘多毛孢(Pestalotiopsis fici)的线粒体比较分析显示,N. cubana在线粒体基因组长度和内含子数量上与P. fici有很大差异。此外,它们在基因内容和tRNA上也表现出显著差异。两个属在核心蛋白编码基因(PCGs)的基因偏斜和密码子偏好上差异较小。我们比较了炭角菌目(Xylariales)中线粒体基因组的基因序列,发现了大规模的基因重排事件,如基因易位和tRNA的重复。N. cubana在系统发育分析中显示出在子囊菌门(Ascomycota)中的独特进化位置。我们还发现,与其他物种相比,Neopestalotiopsis的PCGs在子囊菌门中受到的选择压力较小,并且受到净化选择。这项研究探讨了Neopestalotiopsis线粒体基因组的进化动态,为该菌的遗传学和分类学研究提供了重要支持。
研究方法
主要结果
图1 代表来自不同地区的N. cubana完整线粒体基因组的三个环状图。不同的基因用不同颜色的块表示。环外的颜色块表示所有基因都朝同一方向定向。从内到外的环分别代表不同区域的线粒体基因组:中国海南省保亭区(32,593 bp)、中国海南省乐东区(33,846 bp)和中国海南省五指山区(38,666 bp)。
此外,我们证明蛋白质编码区占各菌株线粒体基因组区域的最高比例(分别为40.80%、40.80%和56.92%)(图2)。核糖体RNA(rRNA)序列(tRNA和rRNA)占线粒体基因组区域的最低比例(6.94%-19.30%)。在线粒体基因组中鉴定的内含子序列的比例在各菌株之间差异显著。在N. cubana和P. fici W106-1菌株的线粒体基因组中,N. cubana内含子序列百分比为0%(N. cubana WZS16和N. cubana BT03),而P. fici W106-1的内含子百分比达到28.77%(图2)。仅在乐东分离株中鉴定到的单个内含子区域占其线粒体基因组的3.60%。通过将来自海南省的三个线粒体基因组与P. fici W106-1进行比较,很明显内含子的数量是决定线粒体基因组大小的一个重要因素。此外,四个线粒体基因组的基因间序列的比例惊人地相似,在23.49%到25.92%之间,表明它们的线粒体基因组具有松散的结构。
图2. 三个N. cubana和一个P. fici线粒体基因组的组成。饼图显示了不同基因区域对这四个线粒体基因组扩展的贡献。(A)为N. cubana WZS16,(B)为N. cubana BT03,(C)为N. cubana LD08,(D)为P. fici W106-1。
分析了这四个线粒体基因组中的密码子使用和相对同义密码子使用偏好(RSCU)。结果显示,N. cubana和P. fici W106-1在密码子使用模式上具有高度相似性。AGA(编码Arg2)和UUA(编码Leu2)是使用最频繁的密码子(图3a-d),这两种氨基酸也是最丰富的。此外,在分析的62个密码子中,有26个RSCU值大于1.0,其中A和U特别常见。
图3. 三个N. cubana和P. fici的线粒体基因组密码子使用情况。密码子使用频率绘制在y轴上。(a) N. cubana WZS16;(b) N. cubana LD08;(c) N. cubanaBT03;(d) P. fici W106-1。
图4. 三个N. cubana和P. fici物种线粒体基因组中30个tRNA基因的推测二级结构。保守序列用绿色表示。可变位点分别用红色、蓝色和橙色表示BT03、LD08和W106-1。黑色箭头表示核苷酸替换,红色箭头表示核苷酸添加,圆圈表示核苷酸缺失。所有基因按在线粒体基因组中出现的顺序显示,从trnY开始。
图5. 用紫色线条表示N. cubana LD08散布重复序列的定位。箭头表示核心PCGs,灰色矩形是内含子,蓝色矩形是开放阅读框,绿色矩形是rrns和rrnL序列,所有基因都朝同一方向定向。
图6. N. cubana分离株和P. fici线粒体基因组中基因定向的比较。所有物种中的核心PCGs为蓝色;tRNA基因为绿色;基因组重复为黄色;rns和rnl序列为红色,物种单独拥有的tRNA基因用空白框中的数字表示。
同时,我们发现N. cubana和P. fici W106-1线粒体基因组之间trnC基因的重复模式差异以及trnG基因数量的差异。例如,除了trnC基因重复模式的差异外,与P. fici W106-1相比,N. cubana线粒体基因组中缺少一个trnG基因。在Annulohypoxylon stygium的线粒体基因组中发现了倒位(trnS和trnR基因)、缺失和重复(trnK和trnC基因)的情况。然而,这些倒位、缺失和重复的模式与在N. cubana线粒体基因组中观察到的模式不同。另一方面,Nemania diffusa和Arthrinium arundinis的线粒体基因组经历了显著的基因重排,表明炭角菌目物种在进化过程中发生了频繁的基因重排事件。
使用Mauve软件分析了7个线粒体基因组共线性,发现N. cabana的线粒体基因组与炭角菌目其他真菌有5个同源区域(图7)。这些同源区域的位置在不同的线粒体基因组之间显示出显著的变异。这与前面提到的基因顺序比较一致,进一步支持了炭角菌目线粒体基因组在进化过程中发生基因重排的观点。虽然不同线粒体基因组中同源区域的大小差异很大,但N. cubana的线粒体基因组在这些区域的差异很小,与其线粒体基因组的长度一致。这可能归因于相应位置的基因间区域。
图7. 炭角菌目7个线粒体基因组的共线性分析。不同线粒体基因组之间的同源区域用同色块表示,用线条连接。NCW, N. cubana WZS16; NCL,N. cubana LD08; NCB,N. cubana BT03; PFW,P. fici W106-1; AS, Annulohypoxylon stygium; AA, Arthrinium arundinis; ND, Nemania diffusa。
图8. 三个N. cubana和一个P. fici物种核心PCGs的序列信息。(A) 基因长度;(B) GC含量;(C) AT偏移;(D) GC偏移。
图9. 根据最大似然(ML)方法从169个子囊菌门真菌的串联线粒体基因组核心PCGs推断的系统发育树。相应的颜色表示树节点的bootstrap值。包含≥3个物种的属被赋予相同的颜色。饼图表示不同物种线粒体基因组的总长度,通过比较不同物种线粒体基因组的长度获得。
此外,我们观察到同一进化支系内的分类群具有平行的线粒体基因组长度。三个N. cubana的线粒体基因组聚集在一起,与P. fici W106-1密切相关。这一发现支持了之前关于P. fici系统发育关系的研究结论。这项研究进一步证明了线粒体基因组作为分类标记的有效性。它可用于分析子囊菌门内物种之间的系统发育关系。
对Sporocadaceae科中的两个Neopestalotiopsis物种N. cubana和Pestalotiopsis fici进行进一步的种内评估,发现N. cubana的dN和dS值范围为(0-0.03),而P. fici为(0.12-0.43)。最高dN/dS值为0.03,对应于nad5基因,而atp8、atp9、nad1、nad3和nad4L的dN/dS值为0。这些结果表明,N. cubana和Pestalotiopsis fici W106-1的核心PCGs在进化过程中经历了强烈的净化选择(图10B)。在评估dN和dS值方面,Lecanora的大多数PCGs在所有属中具有最高的dN或dS值。此外,Bipolaris、Ceratocystis、Chrysoporthe、Cladonia、Cladosporium、Clonostachys、Epichloe、Erysiphe、Fusarium、Neopestalotiopsis和Rhynchosporium共包含36个核心PCGs,它们的dN值均为0。这表明,这些物种所受的环境进化压力在很大程度上偏向于净化选择作用。然而,也有一些物种具有稍高的dN值,如Chrysoporthe的atp8和nad3,以及Penicillium的nad6,其值在0.07到0.16之间,表明它们在特定核心蛋白编码基因上受到的环境压力略高于其他属。同时,15个属中各个物种的dS值都大于0,其中Epichloe的nad5基因的dS值最低为0.002。Colletotrichum、Penicillium和Lecanora的大多数基因的dS值高于0.5,Lecanora的atp6和nad4趋向于具有2.0的dS值,这意味着它们的基因具有较高的突变率,但不会显著改变氨基酸序列。值得一提的是,Chrysoporthe的nad3基因具有较高的dN和dS值,这可能表明该属的nad3基因在不同环境中发挥不同的作用,受到复杂的环境选择压力。同时,从15个属中采集的物种的PCGs的dN、dS和dN/dS值评估结果显示,Bipolaris的nad4L以及cox3和cob基因的dN/dS值是所有PCGs中最高的,其基因的dN/dS值也高于其他属,表明它们在真菌属中进化较快。但没有任何菌群的dN/dS值超过1,最大的为Bipolaris的nad4L,表明它们经历了净化选择效应。总的来说,这些基因在进化上是稳定的,表明它们在线粒体基因组中发挥着重要且保守的功能作用。
图10. 子囊菌门169个物种真菌核心PCGs的基因替换分析;仅选择了3个或更多的物种。(A) dN/dS值的属特异性分布。水平轴表示dN/dS值,垂直轴表示对数正态分布。(B) 热图显示了各个基因的dN、dS和dN/dS值。
讨论
总的来说,密切相关的物种线粒体基因组的基因组成、tRNA的二级结构、密码子使用偏好、重复序列的位置和数量、基因重排现象、核心蛋白编码基因以及进化过程中施加的选择压力,对于理解相关物种的进化起源和系统发育关系很重要。与植物和动物相比,真菌的线粒体基因组研究有限,尤其是子囊菌门内的物种。然而,尽管近年来真菌线粒体基因组的数据大幅增加,但尚未对N. cubana的线粒体基因组进行研究。在本研究之前,Sporocadaceae科仅有一个物种P. fici W106-1的线粒体基因组可用。我们为三个N. cubana田间分离株组装了首个线粒体基因组,也是Sporocadaceae科第二个发表的线粒体基因组。
我们从中国海南省五指山、乐东和保亭组装了三个N. cubana线粒体基因组,长度分别为38,666 bp、33,846 bp和32,593 bp。我们发现,N. cubana的线粒体基因组小于大多数其他真菌,我们推测主要原因是线粒体基因组内含子太少,每个线粒体基因组只有一个内含子。研究结果表明,Pestalotiopsis和Neopestalotiopsis关系非常密切,因为Neopestalotiopsis以前被认为是一个独立于Pestalotiopsis的属,它们的进化方向和发生的变化必须非常相似,这项研究进一步证实了这一点。在N. cubana和P. fici W106-1的比较中,主要差异在于内含子的数量和线粒体基因组本身的长度,P. fici W106-1远大于N. cubana。这些结果与之前的建议一致,即内含子构成了决定线粒体基因组大小的关键因素。这些是之前研究发现影响线粒体基因组大小的一些最重要的因素。这四个线粒体基因组中ORF的数量不同,尤其是在五指山地区,N. cubana的线粒体基因组比其他两个地区大得多,而P. fici W106-1的ORF数量与P. fici W106-1相似;因此,我们推测ORF的数量不是决定线粒体基因组大小差异的关键因素。此外,这四个线粒体基因组之间的基因间序列也存在很大差异,基因间序列的百分比在一定程度上与线粒体基因组的长度呈正相关,这与之前研究的结论一致,即基因间序列也是影响线粒体基因组大小的一个因素。
密码子使用偏好在蛋白质功能和翻译准确性中起着至关重要的作用,密码子使用分析有助于研究不同物种的进化和环境适应。我们评估了N. cubana和P. fici W106-1线粒体基因组中的密码子使用偏好,发现两个物种线粒体基因组中的密码子偏好几乎相同。四个线粒体基因组核心蛋白编码基因的起始密码子也完全相同,而终止密码子的使用略有不同。在62个密码子中,有26个的RSCU值大于1.0,特别是AGA(编码Arg2)和UUA(编码Leu2),这可能是由于环境胁迫的影响。
tRNA作为运输体发挥着蛋白质翻译的关键作用。研究结果表明,额外臂数量的变化会导致密切相关物种线粒体基因组间tRNA长度的变化。与之前的观察一致,本研究发现,在四个线粒体基因组共有的30个tRNA中,有4个tRNA具有比其他tRNA长得多的额外臂。tRNA二级结构中的可变位点部分反映了物种之间的主导进化差异,但对tRNA自身的运输功能没有影响。有趣的是,我们在这30个共有的tRNA中鉴定出56个可变位点,分布在15个tRNA中,其中trnG(tcc)最为丰富,有30个可变位点。从这些观察结果来看,我们推测,由于环境胁迫,N. cubana和P. fici W106-1中甘氨酸的使用经历了相对不同的进化过程,导致其相应tRNA的水平变异频繁。
在早期的研究中,真菌线粒体基因组中基因的顺序相对保守,因为它们都来自同一个祖先α-变形杆菌。然而,随着真菌线粒体基因组资源的不断增加,关于基因重排等关键线粒体基因组特征的详细见解开始浮现。研究表明,真菌线粒体基因组中重复序列的积累导致基因组结构在进化过程中发生动态变化,从而导致基因顺序重排。我们检测到了N. cubana线粒体基因组中不同的重复序列,分析了它们在基因组中的长度、大小和位置。三个线粒体基因组中重复序列的分布在位置和长度上是相同的。以乐东N. cubana线粒体基因组的环状图为例,可以看到大部分散布重复序列(≥22 bp)位于基因间序列上,这可以与N. cubana和P. fici W106-1的基因重排现象相印证。同样,串联重复和SSR主要位于基因间序列。与炭角菌目其他物种线粒体基因组的基因序列比较,它们的基因重排变得更加多样,这表明线粒体基因组中的基因重排在进化过程中非常频繁地发生,在一定程度上反映了物种的系统发育关系。
核心蛋白编码基因在线粒体基因组中高度保守,在进化初期表现出轻微的变异。随着时间和环境的变化,它们倾向于经历正选择或净化选择,不同线粒体基因组中核心PCGs的差异也可能反映了进化速率。通过比较N. cubana和P. fici W106-1的核心PCGs,我们发现两个物种线粒体基因组之间长度、GC含量、AT偏移和GC偏移的差异最小,我们推测科级以下物种的核心PCG进化速率相同。N. cubana和P. fici W106-1核心PCGs的dN值、dS值和dN/dS分析也反映,它们的PCGs在进化过程中经历了强烈的净化选择效应。169个子囊菌物种的核心PCGs随时间推移表现出不同的进化方向,dN/dS分布主要分为分类和狭窄的峰值以及平坦的分布。N. cubana的dN/dS在子囊菌门中几乎最小,表明其进化速率在整个子囊菌门系统中相对较慢,这可能与中国海南省Neopestalotiopsis属的环境状况有关。
Neopestalotiopsis最初被归入Pestalotiopsis属,但目前Neopestalotiopsis、Pseudopestalotiopsis和Pestalotiopsis都归入Sporocadaceae科,自成立以来经历了众多分类学变化。这种现象可能解释了仅凭形态特征难以准确分类Neopestalotiopsis真菌的困难。线粒体基因组正成为分析真菌系统发育关系的重要因素。尽管基于核基因组的系统发育分析提供了更丰富的遗传信息,但核基因组的获取成本太高,所需的人力和资源远高于线粒体基因组,在短时间内大规模大量获取真菌核基因组很困难。为进一步验证Neopestalotiopsis在真菌系统发育关系中的位置,我们在子囊菌门169个物种的线粒体基因组中组装了14个核心蛋白编码基因,用最大似然(ML)法构建了系统发育树。可以看到,来自三个N. cubana地区的真菌在同一分支上聚集,支持度很高。另一方面,P. fici与N. cubana关系密切,是炭角菌目其他真菌最近的。这些结果与之前对子囊菌门内系统发育关系的研究一致,进一步证明线粒体基因组是分析真菌群落系统发育关系的强大工具。
在本研究中,我们组装了N. cubana的线粒体基因组,并通过与其他密切相关物种的比较,进一步了解了真菌线粒体基因组。然而,获取炭角菌目和Sporocadaceae科真菌的线粒体基因组的途径有限,无法支持大规模的线粒体基因组系统发育组学分析。未来,随着更多线粒体基因组的出现,这些分析在真菌种群遗传学、分类学和进化生物学研究中将变得更有价值。
温馨说明
1、惠通生物针对叶绿体、线粒体测序项目组装结果准确,可以提供定制化高级分析,欢迎联系我们获取小基因组文章专业解决方案,助力文章发表。
2、惠通生物小基因组服务电话:18926264030
欢迎关注物种分类及进化研究
深圳市惠通生物科技有限公司,成立于2016年,技术成员在生物信息方面均有10年以上分析经验,在小基因组项目(叶绿体、线粒体、病毒)上形成强劲技术优势并可提供定制化高级分析内容。成立至今已服务客户单位200余家包括中国科学院植物研究所、中国科学院昆明植物研究所、华南农业大学、浙江大学、中国人民解放军疾病预防控制中心、武汉水生生物研究所等科研单位。合作老师发表小基因组SCI文章逾200篇,发表在《BMC Plant Biology》、《forests》、《 Frontiers in Plant Science》、《Frontiers in Microbiology》、《molecules》、《International Journal of Biological Macromolecules》、《Plant Genome》、《International Journal of Molecular Sciences》、《Infectious Diseases of Poverty》、《Insect Science》、《genes》、《frontiers in Veterinary Science》《Frontiers in Immunology》等杂志。