比较线粒体基因组学分析揭示了Neopestalotiopsis 属物种复合体(真菌:炭角菌目)的进化分歧

文摘   2024-07-04 09:02   湖南  

摘要

拟盘多毛孢属(Neopestalotiopsis)包括一些专性寄生物,能够引起高等植物的环斑病、疮痂病和叶枯病。我们组装了三个完整的番石榴果实环斑病病原Neopestalotiopsis cubana的线粒体基因组,线粒体基因组是环状的,大小分别为38666 bp33846 bp32593 bp与无花果拟盘多毛孢(Pestalotiopsis fici)的线粒体比较分析显示,N. cubana在线粒体基因组长度和内含子数量上与P. fici有很大差异。此外,它们在基因内容和tRNA上也表现出显著差异。两个属在核心蛋白编码基因(PCGs)的基因偏斜和密码子偏好上差异较小。我们比较了炭角菌目(Xylariales)中线粒体基因组的基因序列,发现了大规模的基因重排事件,如基因易位和tRNA的重复。N. cubana在系统发育分析中显示出在子囊菌门(Ascomycota)中的独特进化位置。我们还发现,与其他物种相比,NeopestalotiopsisPCGs在子囊菌门中受到的选择压力较小,并且受到净化选择。这项研究探讨了Neopestalotiopsis线粒体基因组的进化动态,为该菌的遗传学和分类学研究提供了重要支持。

比较线粒体基因组学分析揭示了Neopestalotiopsis 属物种复合体(真菌:炭角菌目)的进化分歧
Comparative Mitogenomics Analysis Revealed Evolutionary Divergence among Neopestalotiopsis Species Complex (Fungi: Xylariales)
时间:2024 杂志:International Journal of Molecular Sciences 影响因子:4.9 分区1/2区

研究方法

1、样本采集和DNA提取

从中国海南省的五指山(109.29°E, 18.56°N)、乐东(108.51°E, 18.32°N)和保亭(109.32°E, 18.35°N)的果园中采集了引起番石榴果实环斑病的病原菌田间分离株。将这些菌株从田间采集后进行分离和培养,并通过单孢分离法确定其致病性。然后,我们观察了这些真菌的分生孢子形态,最终通过对三个核基因(internal transcribed space, tubulin-β, and transcription elongation factor)的PCR和在NCBI数据库中的BLAST比对,确认这些真菌的三个基因都属于同一物种,从而获得了共同鉴定的结果。该真菌被分离并鉴定为N. cubana,菌株编号分别为WZS016、LD08和BT03。样本保存在海南大学热带农业与林业学院的保存设施中。培养3天后,我们从液体马铃薯葡萄糖培养基中收集菌丝体。使用DNA提取试剂盒(CW3030 # CWBIO 江苏,中国)从分离的真菌样本中提取DNA。


2 、测序、组装和注释
使用NexteraXT DNA文库制备试剂盒构建平均长度为350 bp的文库。使用Illumina Novaseq 6000测序平台生成读段,生成的读段平均长度为150 bp。使用NGS QC Tool Kit v2.3.3对基于Illumina的原始读段进行编辑。当测序数据质量合格时,构建完整的线粒体环状组装图,并通过使用SPAdes 3.14.1软件组装的GFA图文件的可视化(例如Bandage)进一步提取。我们使用MITOS(http://mitos.bioinf.uni-leipzig.de/index.py)和MFannot(https://megasun.bch.umontreal.ca/cgi-bin/mfannot/mfannotInterface.pl)基于遗传密码4对基因进行注释。结合两种注释方法的结果,手动校正起始和终止密码,并使用BLASTn进行二次校正。随后进行了N. cubana与近缘属物种之间的比较线粒体基因组分析。
3、真菌线粒体比较基因组分析

选择了N. cubana的三个线粒体基因组和真菌Pestalotiopsis fici W106-1线粒体基因组进行分析,比较基因组大小和结构。计算了AT偏斜(=A−T/A + T)和GC偏斜(=G−C/G + C)以确定碱基含量的偏斜。使用MITOS Web Server(http://mitos.bioinf.uni-leipzig.de/index.py)预测tRNA编码基因的二级结构。使用codonW软件进行密码子使用分析。使用MISA在线工具(https://webblast.ipk-gatersleben.de/misa/index.php?action=1)确定简单重复序列(SSRS),并使用Tandem Repeats Finder(http://www.repeatmasker.org/)识别串联重复序列。使用REPuter(https://bibiserv.cebitec.uni-bielefeld.de/reputer)识别正向、反向、互补和回文散在重复序列,并使用Tbtools生成circos图。选择Mauve 2.4.0软件分析基因重排以进行共线性分析。


4、系统发育分析
为了确定N. cubana与其他丝状子囊菌之间的进化关系,从NCBI数据库中检索了选定丝状子囊菌的线粒体基因组序列和注释数据,以致病疫霉(Phytophthora infestans,NC_009905.1)作为外群。使用MAFFT分别对这些真菌的14个核心PCGs(apt6、atp8、atp9、nad1、nad2、nad3、nad4、nad4L、nad5、nad6、cox1、cox2、cox3和cob)进行比对。将蛋白质编码基因(PCGs)的比对结果使用SequenceMatrix合并,然后使用ModelFinder确定每个PCG的最佳模型拟合。使用最大似然(ML)方法构建系统发育树。使用IQ-Tree 进行1000次重复的自举评估ML分析。使用iTOL软件修剪和美化系统发育树。

5、数据可用性

N. cubana的线粒体基因组序列已上传GenBank数据库,登录号为NC071220.1、OQ707026.1和OQ707025.1,相关的BioProject、SRA和Bio-Sample编号分别为PRJNA857506;SRR20075021、SRR23999140和SRR23998960;以及SAMN29628486、SAMN33958487和SAMN33958289。

主要结果

1、 N. cubana线粒体基因组的结构和组织

我们为从海南省三个主要番石榴种植区(五指山、乐东和保亭)获得的三个N. cubana田间分离株,组装获得了三个真菌线粒体基因组。这三个分离株的线粒体基因组显示出高度相似性,长度分别为WZS16(38,666 bp)、LD08(33,846 bp)和BT03(32,593 bp)(图1)。线粒体基因组都呈环状结构,每个都包含14个核心蛋白编码基因(PCGs)和1个核糖体蛋白S3(rps3)基因。所有基因都位于J链上,然而开放阅读框(ORFs)的数量存在差异。将Pestalotiopsis fici W106-1的线粒体基因组与炭角菌目中确定的四个生物体的线粒体基因组进行比较,显然这些基因组表现出相当的GC含量(27.48-28.45)和tRNA数量(31-34)。此外,我们发现N. cubana和P. fici W106-1的GC偏斜值范围从0.107到0.118,而AT偏斜值范围从-0.040到0.007。这些值表现出显著的相似性。同时,我们在N. cubana和P. fici W106-1的线粒体基因组中发现了到相邻基因nad4L和nad5的核苷酸位置重叠(-1 bp)。

图1 代表来自不同地区的N. cubana完整线粒体基因组的三个环状图。不同的基因用不同颜色的块表示。环外的颜色块表示所有基因都朝同一方向定向。从内到外的环分别代表不同区域的线粒体基因组:中国海南省保亭区(32,593 bp)、中国海南省乐东区(33,846 bp)和中国海南省五指山区(38,666 bp)。

此外,我们证明蛋白质编码区占各菌株线粒体基因组区域的最高比例(分别为40.80%、40.80%和56.92%)(图2)。核糖体RNA(rRNA)序列(tRNA和rRNA)占线粒体基因组区域的最低比例(6.94%-19.30%)。在线粒体基因组中鉴定的内含子序列的比例在各菌株之间差异显著。在N. cubana和P. fici W106-1菌株的线粒体基因组中,N. cubana内含子序列百分比为0%(N. cubana WZS16和N. cubana BT03),而P. fici W106-1的内含子百分比达到28.77%(图2)。仅在乐东分离株中鉴定到的单个内含子区域占其线粒体基因组的3.60%。通过将来自海南省的三个线粒体基因组与P. fici W106-1进行比较,很明显内含子的数量是决定线粒体基因组大小的一个重要因素。此外,四个线粒体基因组的基因间序列的比例惊人地相似,在23.49%到25.92%之间,表明它们的线粒体基因组具有松散的结构。

图2. 三个N. cubana和一个P. fici线粒体基因组的组成。饼图显示了不同基因区域对这四个线粒体基因组扩展的贡献。(A)为N. cubana WZS16,(B)为N. cubana BT03,(C)为N. cubana LD08,(D)为P. fici W106-1。

2、密码子使用分析

在这四个线粒体基因组的蛋白质编码基因(PCGs)中,ATG作为起始密码子,除cob、nad4和nad5基因使用TAG作为终止密码子外,大多数终止密码子为TAA。此外,三个N. cubana田间分离株的线粒体基因组中cob基因具有TAA型终止密码子,而P. fici W106-1线粒体基因组中的nad5基因也使用TAA作为其终止密码子。

分析了这四个线粒体基因组中的密码子使用和相对同义密码子使用偏好(RSCU)。结果显示,N. cubana和P. fici W106-1在密码子使用模式上具有高度相似性。AGA(编码Arg2)和UUA(编码Leu2)是使用最频繁的密码子(图3a-d),这两种氨基酸也是最丰富的。此外,在分析的62个密码子中,有26个RSCU值大于1.0,其中A和U特别常见。

图3. 三个N. cubana和P. fici的线粒体基因组密码子使用情况。密码子使用频率绘制在y轴上。(a) N. cubana WZS16;(b) N. cubana LD08;(c) N. cubanaBT03;(d) P. fici W106-1。

3、N. cubana线粒体基因组中的RNA基因

我们在三个N. cubana分离株和P. fici W106-1菌株的线粒体基因组中鉴定出了编码大亚基核糖体RNA(rnl)和小亚基核糖体RNA(rns)的基因序列。本研究分析的所有线粒体基因组包含31到34个tRNA编码基因。所有线粒体基因组tRNA基因都被压缩成传统的三叶草结构(图4)。这些tRNA编码20种标准氨基酸。每个线粒体基因组都包含特定的tRNA,它们使用不同的反密码子来编码精氨酸、亮氨酸、丝氨酸和甘氨酸。此外,每个线粒体基因组中都有三个编码甲硫氨酸的tRNA,它们具有相同的反密码子。在N. cubana分离株和P. fici W106-1菌株共享的30个tRNA中,有4个tRNA具有比其他tRNA长得多的额外臂。这些结果表明,由于四个线粒体基因组tRNA的额外臂的大小和长度的变化,tRNA的大小也发生了变化。在这30个共享的tRNA中,共有56个可变位点,分布在15个tRNA中。出现频率最高的是trnG(tcc),共鉴定出30个可变位点。

图4. 三个N. cubana和P. fici物种线粒体基因组中30个tRNA基因的推测二级结构。保守序列用绿色表示。可变位点分别用红色、蓝色和橙色表示BT03、LD08和W106-1。黑色箭头表示核苷酸替换,红色箭头表示核苷酸添加,圆圈表示核苷酸缺失。所有基因按在线粒体基因组中出现的顺序显示,从trnY开始。

4、线粒体基因组中的重复序列

我们分析了三个N. cubana线粒体基因组中散布的重复序列。结果显示,来自中国海南省乐东地区的N. cubana线粒体基因组包含131个正向类型(总共3836 bp),54个反向重复(总共1219 bp),31个互补类型(总共689 bp),以及78个长度为22 bp或更长的回文重复(总共1778 bp)。线粒体基因组中剩余的两个散布重复是可比较的,表明大部分散布重复位于线粒体基因组的基因间区域(图5)。进一步使用串联重复查找器检查了三个N. cubana分离株和P. fici W106-1菌株线粒体基因组中的串联重复序列,在三个N. cubana分离株的线粒体基因组中发现了4个串联重复序列。这些串联重复的序列片段在各N. cubana分离株的线粒体基因组中相似,最长串联重复序列的长度为54 bp,最短串联重复序列的长度为3 bp(表S1)。相比之下,P. fici W106-1的线粒体基因组包含19个长度在3到45 bp之间的串联重复。使用MISA在线工具辅助分析了N. cubana分离株和P. fici W106-1菌株的线粒体基因组,发现各线粒体基因组中存在简单序列重复(SSR)。我们观察到检测到的SSR的主要部分是长度在11-28 bp范围内的单核苷酸重复。其余较少类型的SSR包括二核苷酸重复(从0到2)、三核苷酸重复(从4到7)、四核苷酸重复(从6到9)、五核苷酸重复(从0到2)和六核苷酸重复(从2到3)。

图5. 用紫色线条表示N. cubana LD08散布重复序列的定位。箭头表示核心PCGs,灰色矩形是内含子,蓝色矩形是开放阅读框,绿色矩形是rrns和rrnL序列,所有基因都朝同一方向定向。

5、线粒体基因组中的基因重排

三个N. cubana分离株的线粒体基因组用于进一步与炭角菌目其他成员进行线粒体比较基因组分析,包括Annulohypoxylon stygium、Nemania diffusa(MH620794.1, NC_049077.1)和Arthrinium arundinis(NC_035508.1)。检查结果显示,N. cubana分离株和P. fici W106-1之间蛋白质编码基因、rRNA编码基因和tRNA编码基因的定向上存在最小的线粒体基因组差异。然而,N. cubana与亲缘关系较远的目的物种之间的线粒体基因组中蛋白质、rRNA和tRNA编码基因的定向存在很大差异(图6)。虽然在三个N. cubana分离株之间基因的定向没有记录到差异,但我们观察到,五指山N. cubana分离株线粒体基因组中的trnG基因经历了重复事件。

图6. N. cubana分离株和P. fici线粒体基因组中基因定向的比较。所有物种中的核心PCGs为蓝色;tRNA基因为绿色;基因组重复为黄色;rns和rnl序列为红色,物种单独拥有的tRNA基因用空白框中的数字表示。

同时,我们发现N. cubana和P. fici W106-1线粒体基因组之间trnC基因的重复模式差异以及trnG基因数量的差异。例如,除了trnC基因重复模式的差异外,与P. fici W106-1相比,N. cubana线粒体基因组中缺少一个trnG基因。在Annulohypoxylon stygium的线粒体基因组中发现了倒位(trnS和trnR基因)、缺失和重复(trnK和trnC基因)的情况。然而,这些倒位、缺失和重复的模式与在N. cubana线粒体基因组中观察到的模式不同。另一方面,Nemania diffusa和Arthrinium arundinis的线粒体基因组经历了显著的基因重排,表明炭角菌目物种在进化过程中发生了频繁的基因重排事件。

使用Mauve软件分析了7个线粒体基因组共线性,发现N. cabana的线粒体基因组与炭角菌目其他真菌有5个同源区域(图7)。这些同源区域的位置在不同的线粒体基因组之间显示出显著的变异。这与前面提到的基因顺序比较一致,进一步支持了炭角菌目线粒体基因组在进化过程中发生基因重排的观点。虽然不同线粒体基因组中同源区域的大小差异很大,但N. cubana的线粒体基因组在这些区域的差异很小,与其线粒体基因组的长度一致。这可能归因于相应位置的基因间区域。

图7. 炭角菌目7个线粒体基因组的共线性分析。不同线粒体基因组之间的同源区域用同色块表示,用线条连接。NCW, N. cubana WZS16; NCL,N. cubana LD08; NCB,N. cubana BT03; PFW,P. fici W106-1; AS, Annulohypoxylon stygium; AA, Arthrinium arundinis; ND, Nemania diffusa。

6、核心PCGs的变异

N. cubana和P. fici W106-1线粒体基因组中,14个核心PCGs和rps3在长度或GC含量上几乎完全相同(图8A),仅cox1和rps3基因长度存在细微差异,而三个N. cubana的折线图中GC含量没有变化。这一观察结果表明,在附毛孢科(Sporocadaceae)的进化过程中,核心PCGs是保守的。在分析的15个核心蛋白编码基因中,atp9基因具有最高的平均GC含量为35.11%,而cox3基因以32.35%紧随其后(图8B)。相反,nad6基因显示最低的GC含量,平均为20.45%。这15个基因的AT偏斜或GC偏斜值在四个附毛孢科的线粒体基因组中在某种程度上有所不同。唯一一个在AT偏斜中具有负偏斜的基因是rps3(图8C)。除atp6和atp8外,所有基因在GC偏斜中都呈正偏斜(图8D)。这一结果表明,在进化过程中,大多数核心PCGs的前导链都倾向于T-rich和G-rich进化。

图8. 三个N. cubana和一个P. fici物种核心PCGs的序列信息。(A) 基因长度;(B) GC含量;(C) AT偏移;(D) GC偏移。

7、系统发育分析

为了阐明N. cubana在子囊菌门中的进化关系,我们从NCBI数据库中选择了169个子囊菌门真菌的线粒体基因组。这些真菌都被鉴定为腐生和植物病原性。使用这些线粒体基因组的14个核心PCGs构建了一个系统发育树,采用了与多基因比对分区兼容的替换模型,以Phytophthora infestans作为外群,根据所有线粒体基因组的完整长度评估这169个属之间的进化和系统发育关系,并绘制成图(图9)。结果显示,存在11个进化支系差异显著且支持度很高(BS > 83)(图9)。

图9. 根据最大似然(ML)方法从169个子囊菌门真菌的串联线粒体基因组核心PCGs推断的系统发育树。相应的颜色表示树节点的bootstrap值。包含≥3个物种的属被赋予相同的颜色。饼图表示不同物种线粒体基因组的总长度,通过比较不同物种线粒体基因组的长度获得。

此外,我们观察到同一进化支系内的分类群具有平行的线粒体基因组长度。三个N. cubana的线粒体基因组聚集在一起,与P. fici W106-1密切相关。这一发现支持了之前关于P. fici系统发育关系的研究结论。这项研究进一步证明了线粒体基因组作为分类标记的有效性。它可用于分析子囊菌门内物种之间的系统发育关系。

8、核心PCGs的进化适应

通过分享非同义替换率(dN)和同义替换率(dS)等多个易受选择压力影响的参数,评估了N. cubana和其他属的线粒体基因组的选择压力强度,与来自15个属的15个真菌线粒体基因组的核心PCGs进行了对比。使用计算得出的平均dN/dS对从15个属中记录的峰值分布值进行了绘制。有趣的是,观察到的dN/dS分布落入两个主要类别。第一组包括来自5个属的物种,包括Cladosporium、Clonostachys、Colletotrichum、Epichloe、Fusarium和Lecanora,以及Neopestalotiopsis、Penicillium、Rhynchosporium和Trichoderma,显示出正的dN/dS值和较窄的峰值分布。第二组包括其余10个属的物种,具有相对较平的dN/dS分布(图10A)。

对Sporocadaceae科中的两个Neopestalotiopsis物种N. cubana和Pestalotiopsis fici进行进一步的种内评估,发现N. cubana的dN和dS值范围为(0-0.03),而P. fici为(0.12-0.43)。最高dN/dS值为0.03,对应于nad5基因,而atp8、atp9、nad1、nad3和nad4L的dN/dS值为0。这些结果表明,N. cubana和Pestalotiopsis fici W106-1的核心PCGs在进化过程中经历了强烈的净化选择(图10B)。在评估dN和dS值方面,Lecanora的大多数PCGs在所有属中具有最高的dN或dS值。此外,Bipolaris、Ceratocystis、Chrysoporthe、Cladonia、Cladosporium、Clonostachys、Epichloe、Erysiphe、Fusarium、Neopestalotiopsis和Rhynchosporium共包含36个核心PCGs,它们的dN值均为0。这表明,这些物种所受的环境进化压力在很大程度上偏向于净化选择作用。然而,也有一些物种具有稍高的dN值,如Chrysoporthe的atp8和nad3,以及Penicillium的nad6,其值在0.07到0.16之间,表明它们在特定核心蛋白编码基因上受到的环境压力略高于其他属。同时,15个属中各个物种的dS值都大于0,其中Epichloe的nad5基因的dS值最低为0.002。Colletotrichum、Penicillium和Lecanora的大多数基因的dS值高于0.5,Lecanora的atp6和nad4趋向于具有2.0的dS值,这意味着它们的基因具有较高的突变率,但不会显著改变氨基酸序列。值得一提的是,Chrysoporthe的nad3基因具有较高的dN和dS值,这可能表明该属的nad3基因在不同环境中发挥不同的作用,受到复杂的环境选择压力。同时,从15个属中采集的物种的PCGs的dN、dS和dN/dS值评估结果显示,Bipolaris的nad4L以及cox3和cob基因的dN/dS值是所有PCGs中最高的,其基因的dN/dS值也高于其他属,表明它们在真菌属中进化较快。但没有任何菌群的dN/dS值超过1,最大的为Bipolaris的nad4L,表明它们经历了净化选择效应。总的来说,这些基因在进化上是稳定的,表明它们在线粒体基因组中发挥着重要且保守的功能作用。

图10. 子囊菌门169个物种真菌核心PCGs的基因替换分析;仅选择了3个或更多的物种。(A) dN/dS值的属特异性分布。水平轴表示dN/dS值,垂直轴表示对数正态分布。(B) 热图显示了各个基因的dN、dS和dN/dS值。

讨论

总的来说,密切相关的物种线粒体基因组的基因组成、tRNA的二级结构、密码子使用偏好、重复序列的位置和数量、基因重排现象、核心蛋白编码基因以及进化过程中施加的选择压力,对于理解相关物种的进化起源和系统发育关系很重要。与植物和动物相比,真菌的线粒体基因组研究有限,尤其是子囊菌门内的物种。然而,尽管近年来真菌线粒体基因组的数据大幅增加,但尚未对N. cubana的线粒体基因组进行研究。在本研究之前,Sporocadaceae科仅有一个物种P. fici W106-1的线粒体基因组可用。我们为三个N. cubana田间分离株组装了首个线粒体基因组,也是Sporocadaceae科第二个发表的线粒体基因组。

我们从中国海南省五指山、乐东和保亭组装了三个N. cubana线粒体基因组,长度分别为38,666 bp、33,846 bp和32,593 bp。我们发现,N. cubana的线粒体基因组小于大多数其他真菌,我们推测主要原因是线粒体基因组内含子太少,每个线粒体基因组只有一个内含子。研究结果表明,Pestalotiopsis和Neopestalotiopsis关系非常密切,因为Neopestalotiopsis以前被认为是一个独立于Pestalotiopsis的属,它们的进化方向和发生的变化必须非常相似,这项研究进一步证实了这一点。在N. cubana和P. fici W106-1的比较中,主要差异在于内含子的数量和线粒体基因组本身的长度,P. fici W106-1远大于N. cubana。这些结果与之前的建议一致,即内含子构成了决定线粒体基因组大小的关键因素。这些是之前研究发现影响线粒体基因组大小的一些最重要的因素。这四个线粒体基因组中ORF的数量不同,尤其是在五指山地区,N. cubana的线粒体基因组比其他两个地区大得多,而P. fici W106-1的ORF数量与P. fici W106-1相似;因此,我们推测ORF的数量不是决定线粒体基因组大小差异的关键因素。此外,这四个线粒体基因组之间的基因间序列也存在很大差异,基因间序列的百分比在一定程度上与线粒体基因组的长度呈正相关,这与之前研究的结论一致,即基因间序列也是影响线粒体基因组大小的一个因素。

密码子使用偏好在蛋白质功能和翻译准确性中起着至关重要的作用,密码子使用分析有助于研究不同物种的进化和环境适应。我们评估了N. cubana和P. fici W106-1线粒体基因组中的密码子使用偏好,发现两个物种线粒体基因组中的密码子偏好几乎相同。四个线粒体基因组核心蛋白编码基因的起始密码子也完全相同,而终止密码子的使用略有不同。在62个密码子中,有26个的RSCU值大于1.0,特别是AGA(编码Arg2)和UUA(编码Leu2),这可能是由于环境胁迫的影响。

tRNA作为运输体发挥着蛋白质翻译的关键作用。研究结果表明,额外臂数量的变化会导致密切相关物种线粒体基因组间tRNA长度的变化。与之前的观察一致,本研究发现,在四个线粒体基因组共有的30个tRNA中,有4个tRNA具有比其他tRNA长得多的额外臂。tRNA二级结构中的可变位点部分反映了物种之间的主导进化差异,但对tRNA自身的运输功能没有影响。有趣的是,我们在这30个共有的tRNA中鉴定出56个可变位点,分布在15个tRNA中,其中trnG(tcc)最为丰富,有30个可变位点。从这些观察结果来看,我们推测,由于环境胁迫,N. cubana和P. fici W106-1中甘氨酸的使用经历了相对不同的进化过程,导致其相应tRNA的水平变异频繁。

在早期的研究中,真菌线粒体基因组中基因的顺序相对保守,因为它们都来自同一个祖先α-变形杆菌。然而,随着真菌线粒体基因组资源的不断增加,关于基因重排等关键线粒体基因组特征的详细见解开始浮现。研究表明,真菌线粒体基因组中重复序列的积累导致基因组结构在进化过程中发生动态变化,从而导致基因顺序重排。我们检测到了N. cubana线粒体基因组中不同的重复序列,分析了它们在基因组中的长度、大小和位置。三个线粒体基因组中重复序列的分布在位置和长度上是相同的。以乐东N. cubana线粒体基因组的环状图为例,可以看到大部分散布重复序列(≥22 bp)位于基因间序列上,这可以与N. cubana和P. fici W106-1的基因重排现象相印证。同样,串联重复和SSR主要位于基因间序列。与炭角菌目其他物种线粒体基因组的基因序列比较,它们的基因重排变得更加多样,这表明线粒体基因组中的基因重排在进化过程中非常频繁地发生,在一定程度上反映了物种的系统发育关系。

核心蛋白编码基因在线粒体基因组中高度保守,在进化初期表现出轻微的变异。随着时间和环境的变化,它们倾向于经历正选择或净化选择,不同线粒体基因组中核心PCGs的差异也可能反映了进化速率。通过比较N. cubana和P. fici W106-1的核心PCGs,我们发现两个物种线粒体基因组之间长度、GC含量、AT偏移和GC偏移的差异最小,我们推测科级以下物种的核心PCG进化速率相同。N. cubana和P. fici W106-1核心PCGs的dN值、dS值和dN/dS分析也反映,它们的PCGs在进化过程中经历了强烈的净化选择效应。169个子囊菌物种的核心PCGs随时间推移表现出不同的进化方向,dN/dS分布主要分为分类和狭窄的峰值以及平坦的分布。N. cubana的dN/dS在子囊菌门中几乎最小,表明其进化速率在整个子囊菌门系统中相对较慢,这可能与中国海南省Neopestalotiopsis属的环境状况有关。

Neopestalotiopsis最初被归入Pestalotiopsis属,但目前Neopestalotiopsis、Pseudopestalotiopsis和Pestalotiopsis都归入Sporocadaceae科,自成立以来经历了众多分类学变化。这种现象可能解释了仅凭形态特征难以准确分类Neopestalotiopsis真菌的困难。线粒体基因组正成为分析真菌系统发育关系的重要因素。尽管基于核基因组的系统发育分析提供了更丰富的遗传信息,但核基因组的获取成本太高,所需的人力和资源远高于线粒体基因组,在短时间内大规模大量获取真菌核基因组很困难。为进一步验证Neopestalotiopsis在真菌系统发育关系中的位置,我们在子囊菌门169个物种的线粒体基因组中组装了14个核心蛋白编码基因,用最大似然(ML)法构建了系统发育树。可以看到,来自三个N. cubana地区的真菌在同一分支上聚集,支持度很高。另一方面,P. fici与N. cubana关系密切,是炭角菌目其他真菌最近的。这些结果与之前对子囊菌门内系统发育关系的研究一致,进一步证明线粒体基因组是分析真菌群落系统发育关系的强大工具。

在本研究中,我们组装了N. cubana的线粒体基因组,并通过与其他密切相关物种的比较,进一步了解了真菌线粒体基因组。然而,获取炭角菌目和Sporocadaceae科真菌的线粒体基因组的途径有限,无法支持大规模的线粒体基因组系统发育组学分析。未来,随着更多线粒体基因组的出现,这些分析在真菌种群遗传学、分类学和进化生物学研究中将变得更有价值。

温馨说明

 1、惠通生物针对叶绿体、线粒体测序项目组装结果准确,可以提供定制化高级分析,欢迎联系我们获取小基因组文章专业解决方案,助力文章发表。

 2、惠通生物小基因组服务电话:18926264030


欢迎关注物种分类及进化研究



  深圳市惠通生物科技有限公司,成立于2016年,技术成员在生物信息方面均有10年以上分析经验,在小基因组项目(叶绿体、线粒体、病毒)上形成强劲技术优势并可提供定制化高级分析内容。成立至今已服务客户单位200余家包括中国科学院植物研究所、中国科学院昆明植物研究所、华南农业大学、浙江大学、中国人民解放军疾病预防控制中心、武汉水生生物研究所等科研单位。合作老师发表小基因组SCI文章逾200篇,发表在《BMC Plant Biology》、forests》、 Frontiers in Plant Science》、《Frontiers in Microbiologymolecules》、International Journal of Biological Macromolecules》、《Plant Genome》、International Journal of Molecular Sciences》、《Infectious Diseases of Poverty》、《Insect Science》genes》、《frontiers in Veterinary Science》《Frontiers in Immunology》等杂志。

物种分类及进化研究
《物种分类及进化研究》专注于物种分类及进化研究,主要研究技术为植物叶绿体基因组测序,植物线粒体基因测序,动物线粒体基因组测序,真菌线粒体基因组测序,真菌基因组测序。我们会定期通过网络,汇总物种分类及进化相关研究进展,解读相关研究论文。
 最新文章