BMC Genomics|8个侧耳属真菌的线粒体基因组中同义密码子的种内和种间变异

文摘   2024-11-07 09:00   北京  

摘要

本研究中作者调查了8个侧耳属真菌线粒体基因组中十二个核心蛋白编码基因(PCGs)的密码子偏好,其中两个菌株来自同一物种。结果显示,所有侧耳属真菌的密码子更倾向于以A/T结尾。此外,还发现密码子碱基组成与密码子适应指数(CAI)、密码子偏差指数(CBI)和最优密码子频率(FOP)之间存在相关性,暗示碱基组成对密码子偏差的影响。研究发现,两种侧耳属真菌(P. ostreatus)在各种碱基偏差指标上存在差异。侧耳属真菌线粒体核心PCGs的平均有效密码子数(ENC)小于35,表明其具有强烈的密码子偏好。中性图分析和PR2-Bias图分析进一步表明,自然选择在侧耳属真菌线粒体的密码子偏差中发挥了重要作用。此外,在8个侧耳属真菌中识别出6-10个最优密码子(ΔRSCU > 0.08和RSCU > 1),其中UGU和ACU是侧耳属真菌中使用最广泛的最优密码子。最后,基于组合的线粒体序列和RSCU值,推导出不同侧耳属真菌之间的遗传关系,显示出它们之间存在较大变异。这项研究提高了我们对这一重要真菌群体同义密码子使用特征和进化的理解。

8个侧耳属真菌的线粒体基因组中同义密码子的种内和种间变异
Intraspecific and interspecific variations in the synonymous codon usage in mitochondrial genomes of 8 pleurotus strains

时间:202杂志:BMC Genomics 影响因子:3.5 分区:2/2区

研究方法

1、序列处理

在NCBI数据库中,已发布8个完整的侧耳属真菌线粒体基因组,其中2个是我们之前研究报告的。这8个侧耳属真菌线粒体基因组首先从NCBI数据库下载,获取的登录号为NC_036998、NC_038091、NC_033533、NC_062374、OX344747、NC_009905、NC_036999和NC_061177。我们进一步获得了8个侧耳属真菌线粒体基因组的核心蛋白编码序列。序列长度小于300 bp的核心蛋白编码基因被排除在后续分析之外。最终,我们为每个侧耳属真菌获得了12个核心蛋白编码基因用于后续分析,包括atp6、cob、cox1、cox2、cox3、nad1、nad2、nad3、nad4、nad5、nad6rps3    

2、密码子使用指数

GC3s参数用于测量在第三个同义位点上含有鸟嘌呤和胞嘧啶的密码子数量,排除了Met、Trp和终止密码子。密码子的第三个碱基通常是最不保守和变化最大的位点。密码子适应指数(CAI)是衡量对在高表达基因中常见的密码子的偏好程度的指标。CAI反映了基因密码子使用对生物体tRNA库的适应性,影响翻译效率。其数值范围为0-1.0,数值越大表示同义密码子使用的频率越高。密码子偏差指数(CBI)是评估基因表达的指标,量化编码相同氨基酸的密码子偏离随机或均匀分布的程度。最优密码子频率(FOP)通过将最优密码子的数量除以基因中同义密码子的总数来确定,直接衡量一个基因使用“最佳”或翻译效率最高的密码子的频率。有效密码子数(ENC)是衡量一个基因中使用的密码子数量的指标,范围从20-61。值为20表示每种氨基酸仅使用一个密码子,而61则表示每个密码子的平均使用情况。低ENC值(低于35)表示强烈的密码子使用偏好,而较高值(高于35)则表示偏好较弱。相对同义密码子使用(RSCU)值通过将同一氨基酸编码的同义密码子的数量与它们出现概率进行比较来计算,为不同基因或物种间的密码子使用提供直接比较,同时考虑到由于氨基酸组成导致的密码子组成差异。值大于1表示正向密码子偏差,小于1则表示负向密码子偏差。一般平均疏水性(GRAVY)值通过将聚合酶基因序列中所有氨基酸的疏水性值相加并乘以基因序列中的残基数量来确定,提供了对蛋白质潜在膜跨越或细胞内定位的洞察。GRAVY值范围从-2到2,正值和负值分别代表疏水性和亲水性蛋白质。芳香性(AROMO)值是芳香氨基酸(Phe、Tyr和Trp)频率的指标。芳香氨基酸具有独特的化学结构,使其能够与其他分子稳定地特异性相互作用。蛋白质的芳香性可以影响其结构、功能以及与其他分子的相互作用。GRAVY和AROMO值也是氨基酸使用的指标,氨基酸组成的变化也会影响密码子使用分析的结果。所有这些密码子使用指标均可通过CodonW1.4.2或CAIcal服务器计算得出。   

3、中性图分析

中性图(GC12与GC3)可用于分析在形成密码子偏差时突变与选择之间的平衡。GC12表示密码子第一和第二位置的平均GC含量(GC1和GC2),而GC3表示第三位置的GC含量。中性进化理论假设突变是随机发生的,并且对生物体的适应性没有影响。然而,选择压力可能会引入观察到的突变频率的偏差,导致偏离中性状态。一种强烈的统计相关性表明,GC12与GC3之间的关系主要由突变驱动,而缺乏相关性则意味着主要驱动力是自然选择。

4、ENC-GC3s图分析

ENC-GC3s图(ENC与GC3s)通常用于评估特定基因的密码子使用是否仅受到突变或其他因素(如自然选择)的影响。该图由纵坐标ENC值和横坐标GC3s值组成,预期曲线通过特定公式计算得出。如果相应点分布在预期曲线周围,则突变压力是形成密码子偏差的独立力量。然而,如果点显著低于或远离预期曲线,则可能有其他因素(如自然选择)在密码子偏差的形成中发挥关键作用。

ENCRatio值反映了ENC的预期值与实际值之间的变动范围。

5、PR2-Bias图分析   

此外,基于[A3/(A3 + U3)与G3/(G3 + C3)]的Parity Rule 2偏差(PR2-Bias)图分析可用于确定基因偏差的程度和方向。图中的中心点为A = T和C = G,意味着该密码子没有使用偏差。

6、对应分析

对应分析(COA)是一种广泛接受的多变量统计分析方法,用于识别密码子使用模式。所有基因被放置在一个59维的超空间中,考虑到59个有意义的密码子(排除Met和Trp)。该方法可以检测侧耳属真菌线粒体核心CDS中密码子使用的主要趋势,并根据RSCU值沿轴排列密码子。

7、最优密码子的确定

根据ENC值将基因按表达量从高到低排序,并选择前后各10%的基因形成高表达和低表达基因数据集。然后计算两个数据集之间的D值(ΔRSCU),将ΔRSCU值大于0.08定义为高表达密码子。RSCU值大于1的密码子被视为高频密码子。ΔRSCU > 0.08且RSCU > 1的密码子被定义为最优密码子。

8、系统发育分析

通过基于密码子使用和线粒体序列的方法比较侧耳属真菌的系统发育关系。使用8个侧耳属真菌的RSCU值,采用SPSS v19.0软件生成层次聚类法,以说明不同物种之间的关系树。我们采用之前研究中描述的方法构建8个侧耳属真菌线粒体基因组的系统发育树,使用组合线粒体基因数据集。为此,使用MAFFT v7.037对单个线粒体基因进行比对,然后使用Sequence Matrix v1.7.8将比对序列合并为一个集合。通过分区同质性测试识别不同线粒体基因之间的潜在系统发育冲突。Partition Finder 2.1.1用于确定组合线粒体基因集最合适的分区和进化模型。系统发育树采用贝叶斯推断(BI)方法构建,使用MrBayes v3.2.6进行分析。进行了两次独立运行,四条链(三条加热链和一条冷链),持续2×10^6代,每100代取样一次。前25%的样本被丢弃作为烧入,其余树用于计算50%多数规则共识树中的贝叶斯后验概率(BPP)。灵芝(Ganoderma lingzhi)被设定为外群。   

主要研究结果

1、侧耳属真菌核心PCGs的核苷酸组成

对8个侧耳属真菌中12个线粒体核心蛋白编码基因(PCGs)的密码子使用分析显示,这些基因的平均长度范围从370 bp-2262 bp,其中nad3基因的平均长度最短,而rps3基因的平均长度最长。在这12个核心PCGs中,10个基因在不同的侧耳属真菌物种之间具有不同的序列长度,而cox2和nad6基因在所有8个菌株中具有相同的基因长度。rps3基因显示出最大的长度变异,最大差异为318 bp。不同的侧耳属真菌物种在碱基组成上表现出显著差异,即使在同一物种(P. ostreatus)之间也是如此。这12个核心PCGs的碱基组成富含T碱基,平均含量为41.80%,其次是A碱基,平均含量为31.70%。G和C碱基的含量相对较低,平均分别为13.59%和12.92%。核心PCGs的平均GC含量范围为19.36%到33.57%,其中rps3基因的GC含量最低,而cox1基因的GC含量最高。

2、密码子使用分析

8个侧耳属真菌中12个核心PCGs的GC1、GC2和GC3含量分别为34.23%、34.31%和11.08%(图1)。这12个PCGs的平均GC3s值为9.44%,表明侧耳属真菌线粒体核心PCGs倾向于以A或T碱基结尾。此外,侧耳属真菌物种12个核心PCGs的A3s、T3s、G3s和C3s指标显示,密码子更可能以A结尾,其次是T、C和G,值分别为54.80%、54.65%、7.53%和2.27%。我们对8个侧耳属真菌中12个核心PCGs进行了密码子偏差分析。核心PCGs的CAI值范围从0.12-0.20,其中nad2值最低,nad3值最高。P. giganteus的CAI值最高,而P. citrinopileatus和P. pulmonarius的CAI值最低,表明它们具有强烈的密码子偏差。8个侧耳属真菌的CBI值范围从−0.164到−0.173,其中P. giganteus值最低,而P. ostreatus值最高。12个核心PCGs的平均FOP值范围从0.25到0.37,其中nad1值最低,nad3值最高。P. ostreatus和P. platypus具有最低FOP值,而P. giganteus具有最高FOP值。这12个核心PCGs的GRAVY值大多为正,表明它们可能是疏水性蛋白质,除了rps3被认为是亲水性。PCGs的AROMO值范围从0.08到0.17,其中rps3值最高而cox3值最低。8个侧耳属真菌的AROMO值相对相似,平均为0.14。两种P. ostreatus物种在各种碱基偏差指标上表现出差异,其中P. ostreatus P51具有较高的CBI、FOP、ENC、GC3s和AROMO值,而P. ostreatus则具有较高的CAI和GRAVY指标,表明在侧耳属真菌物种内同义密码子使用频率也发生了变化。   

图1 不同侧耳属真菌中12个线粒体核心蛋白编码基因的密码子使用指标

3、密码子使用相关性分析

在所有八个侧耳属真菌中,线粒体密码子的GC1含量与GC2、GC3、GC3s和AROMO值之间观察到显著相关性(P < 0.05)(图2)。此外,GC2含量与GC含量和AROMO值之间也发现了显著相关性(P < 0.05)。GC3含量与GC3s和GC含量显著相关(P < 0.05),并且还发现它影响了两种侧耳属真菌物种(P. citrinopileatus和P. giganteus)的密码子偏差。所有8个侧耳属真菌的GC3s与GC含量之间存在显著相关性(P < 0.05)。此外,所有侧耳属真菌线粒体的GC含量与AROMO值之间也发现了显著的相关性(P < 0.01)。最后,在8个侧耳属真菌中,线粒体密码子的CAI指数与FOP指数和CBI指数之间在七个菌株中存在显著相关性(P < 0.05)。最后,在P. giganteus中观察到ENC值与GRAVY值之间的负相关性(P < 0.01)。   

图2 不同侧耳属真菌线粒体的密码子使用指标的Pearson相关性分析热图。颜色块的颜色从绿色变化为红色,表示相关性指数在增加。一个星号表示两个指标之间在P < 0.05水平上存在显著相关性,而两个星号则表示两个指标之间在P < 0.01水平上存在显著相关性。这8个侧耳属真菌物种分别是P. citrinopileatus、P. cornucopiae、P. eryngii、P. giganteus、P. ostreatus P51、P. ostreatus、P. platypus和P. pulmonarius,从左到右,从上到下排列。            

 

4、中性图分析

我们根据中性图分析计算了GC12与GC3之间的关系(图3)。GC12含量范围从23.29%到41.25%,而GC3含量范围从6.37%到20.53%。对侧耳属真菌线粒体密码子中GC12与GC3含量的分析显示出弱正相关,回归系数范围为0.55到0.95,R²值范围为0.2219到0.4458。统计分析表明,GC12与GC3值之间没有显著相关性(P > 0.05),这表明自然选择在侧耳属真菌线粒体的密码子偏差中发挥了主要作用。

图3 8个侧耳属真菌整个编码DNA序列的GC12与第三密码子位置(GC3)中性图分析。a, P. citrinopileatus;b, P. cornucopiae;c, P. eryngii;d, P. giganteus;e, P. ostreatus P51;f, P. ostreatus;g, P. platypus;h, P. pulmonarius。

5、ENC-GC3s图分析

所有检测到的12个核心PCGs的平均ENC值为29.86,低于35,表明存在强烈的密码子使用偏好(图1)。此外,8个侧耳属真菌的ENC值范围从29.58-30.74,进一步确认了侧耳属真菌物种的强密码子使用偏好。ENC图显示,所有侧耳属真菌基因均位于预期ENC图曲线以下(图4),这表明除了突变压力之外,还有其他因素(如自然选择)在密码子偏差形成中发挥作用。   

图4 12个侧耳属真菌核心PCGs的ENC-GC3图分析。实线表示当密码子使用偏差仅受突变压力影响时的预期曲线。a, P. citrinopileatus;b, P. cornucopiae;c, P. eryngii;d, P. giganteus;e, P. ostreatus P51;f, P. ostreatus;g, P. platypus;h, P. pulmonarius。

6、PR2偏差图分析

我们开展了一项二元性规则2(PR2)图分析,以探索是否存在侧耳属真菌线粒体基因的偏差(图5)。双轴都设置在0.5处,将图划分为四个象限。结果显示,侧耳属真菌线粒体密码子的第三位碱基对A和C有很强的偏爱,但对T和G也有偏爱。大部分点集中在第三象限,而其中六个出于八个菌株未分布在第四象限(偏爱A至T和C至G),其中P. citrinopileatus 和 P. giganteus 是例外。全部8个侧耳属真菌未分布在第一个象限(偏爱A至T和G至C)。这表明侧耳属真菌物种中存在强烈的密码子使用偏好。   

图5 PR2图分析8个侧耳属真菌线粒体中12个核心PCGs。a, P. citrinopileatus;b, P. cornucopiae;c, P. eryngii;d, P. giganteus;e, P. ostreatus P51;f, P. ostreatus;g, P. platypus;h, P. pulmonarius。        

 

7、对应分析

为了进一步分析侧耳属真菌中的密码子偏差,我们基于8个侧耳属真菌线粒体基因的RSCU值进行了对应分析(COA)(图6)。轴1、轴2、轴3和轴4是方差的主要贡献者,平均贡献率分别为45.61%、15.62%、8.24%和6.30%。结果显示,轴1是方差的最大贡献者。Pearson相关性分析表明,轴1与CAI和ENC值之间存在显著相关性。此外,我们观察到rps3基因和其他核心PCGs之间存在较大变异,表明核心PCGs的同义密码子使用存在差异。   

图6 基于8个侧耳属真菌12个线粒体基因的相对同义密码子使用(RSCU)值的对应分析(COA)。紫色代表cox基因,红色代表nad基因,绿色代表atp6基因,蓝色代表cob基因,黄色代表rps3基因。a, P. citrinopileatus;b, P. cornucopiae;c, P. eryngii;d, P. giganteus;e, P. ostreatus P51;f, P. ostreatus;g, P. platypus;h, P. pulmonarius。

8、最优密码子分析

对8个侧耳属真菌的相对同义密码子使用(RSCU)分析显示,在六个物种中(P. citrinopileatus、P. cornucopiae、P. eryngii、P. ostreatus P51、P. platypus和P. pulmonarius)发现了27个高频密码子,而P. giganteus包含26个,P. ostreatus则包含28个(图7)。在P. citrinopileatus和P. giganteus中,AUA的使用频率较低,但在其他侧耳属真菌物种中使用频率较高。在这28个常用密码子中,15个以T结尾,11个以A结尾,仅有2个以G结尾,表明对以A/T结尾的密码子存在偏好。此外,在8个侧耳属真菌中识别出22、15、23、30、19、28、28和20个高表达密码子(ΔRSCU > 0.08),分别对应于P. citrinopileatus、P. cornucopiae、P. eryngii、P. giganteus、P. ostreatus P51、P. ostreatus、P. platypus和P. pulmonarius(图8)。比较分析显示,在P. citrinopileatus、P. cornucopiae、P. eryngii、P. giganteus、P. ostreatus P51、P. ostreatus、P. platypus和P. pulmonarius中,分别发现6、6、7、7、10、9、8和6个最优密码子(ΔRSCU > 0.08且RSCU > 1)。所有这些最优密码子均以A/T结尾,其中UGU和ACU是使用最广泛的,其次是GGA、AUU和UUU,这些被用作五个菌株的最优密码子。GCA、GCU、AAU、UCU、UAA和ACA分别被用作一个物种的最优密码子。此外,P. ostreatus P51和P. ostreatus在最优密码子的使用上存在显著差异。AAU、GGU、AUA、UUA、UAA和GUA被用作P. ostreatus P51的最优密码子,而GCA、GGA、AUU、CCU和GUU则被用作P. ostreatus的最优密码子。   

图7 相对同义密码子使用(RSCU)分析8个侧耳属真菌中12个线粒体基因的结果。底部垂直轴上不同颜色的颜色块代表上方图像中的不同密码子。a, P. citrinopileatus;b, P. cornucopiae;c, P. eryngii;d, P. giganteus;e, P. ostreatus P51;f, P. ostreatus;g, P. platypus;h, P. pulmonarius。            

 

图8 8个侧耳属真菌线粒体的最优密码子(ΔRSCU > 0.08且RSCU > 1)用紫色标记。高表达密码子(ΔRSCU > 0.08)用黄色标记,高频密码子(RSCU > 1)用绿色标记。

9、系统发育分析

采用贝叶斯推断(BI)方法构建了8个侧耳属真菌的系统发育树,基于组合的线粒体基因集(图9)。结果显示,P. giganteus和P. citrinopileatus较早地与侧耳属真菌种群发生了分化。P. cornucopiae被确定为P. platypus的姐妹种。此外,两个P. ostreatus菌株被归为同一进化支,表明它们之间存在密切的系统发育关系。与序列推断的系统发育关系相比,基于RSCU推断的物种关系存在一些差异,例如P. ostreatus、P. eryngii和P. pulmonarius的系统发育状态。然而,基于RSCU的物种关系也清楚地揭示了P. platypus与P. cornucopiae之间的密切关系,以及P. giganteus和P. citrinopileatus从侧耳属真菌种群中早期分化的情况。   

图9 不同侧耳属真菌线粒体的进化关系推断,基于贝叶斯推断(BI)方法(a)和相对同义密码子使用(RSCU)层次聚类(b)。

讨论

测序技术的发展使研究人员能够获取各种物种和类型基因组的遗传序列,包括核基因组、叶绿体基因组和线粒体基因组。通过对遗传信息的分析,观察到不同物种之间同义密码子的使用存在差异,有些密码子的使用频率高于其他密码子。这种密码子使用偏差主要受到多个因素的影响,如基因碱基组成、基因长度、基因表达水平、tRNA丰度、氨基酸的疏水性、芳香性、突变和选择,其中突变和选择是最具影响力的因素。研究不同物种的密码子偏差特征有助于理解物种的遗传结构和进化趋势。然而,高等真菌重要细胞器基因组的密码子使用尚未得到深入研究。

线粒体基因组通常被称为真核生物的“第二基因组”。本研究发现,不同侧耳属真菌的线粒体核心PCGs的长度和碱基组成存在显著差异,即使在同一侧耳属真菌物种内也如此,这表明侧耳属真菌线粒体基因的分化。同义密码子的差异主要体现在第三位密码子。此外,观察到所有侧耳属真菌物种的核心PCGs倾向于以A/T结尾,这与许多真核生物的线粒体密码子使用规则一致。通过RSCU解析的大多数高频密码子也以A/T结尾,进一步确认了侧耳属真菌第三位密码子的使用倾向。此外,不同物种和基因之间也观察到碱基使用的变化。两种P. ostreatus物种在CAI、CBI、FOP、ENC和GC3s值等各种碱基偏差指标上也表现出差异,表明侧耳属真菌物种内同义密码子的碱基使用频率也发生了变化。此外,检测到密码子碱基组成与GC3s、CAI、CBI和FOP之间存在相关性,提示碱基组成对密码子偏差的影响。ENC值低于35表明存在强烈的密码子偏好。侧耳属真菌线粒体核心PCGs的平均ENC值为29.86,表明存在强烈的密码子偏好。此外,预期和实际ENC值显示出显著差异(18.59-20.55%)。中性图分析和PR2-Bias图分析也显示了侧耳属真菌密码子偏差中自然选择的证据。这与其他物种线粒体基因组中的结果一致。本研究的结果揭示,尽管不同侧耳属真菌物种之间在密码子使用指标上存在一些差异,但它们在其线粒体PCGs上都经历了强烈的自然选择。   

线粒体被认为是真核生物祖先从细菌中获得的,大多数线粒体基因随后转移到了核基因组中。虽然大多数真核生物仍保留一些核心PCGs,以及用于能量代谢的一些tRNA基因和rRNA基因,这些可以作为系统发育的分子标记。因此,线粒体基因组被视为推断物种系统发育关系的重要工具。本研究根据组合线粒体基因集分析了不同侧耳属真菌物种的遗传关系,并发现每个进化支都具有较高的支持率。此外,根据RSCU值确定不同侧耳属真菌物种之间的关系,这与基于序列的关系有所不同。利用RSCU值构建的系统发育树可以作为构建线粒体基因系统发育树的补充和参考,与之前的研究一致。密码子偏差,即同义密码子的非均匀使用,在物种多样性、生理学、形态学和真菌营养中发挥着作用。它可以促进特定物种的遗传特征,影响翻译效率和蛋白质表达水平,潜在地影响与形态相关的蛋白质结构和功能,并影响一个物种利用不同营养素的能力。然而,密码子偏差与这些生物特征之间精确机制及因果关系仍未完全理解。因此,本研究增强了对这一高等真菌群体密码子使用特征和遗传演化的理解。   

温馨说明

 1、惠通生物针对叶绿体、线粒体测序项目组装结果准确,可以提供定制化高级分析,欢迎联系我们获取小基因组文章专业解决方案,助力文章发表。

 2、惠通生物小基因组服务电话:18926264030



欢迎关注物种分类及进化研究



  深圳市惠通生物科技有限公司,成立于2016年,技术成员在生物信息方面均有10年以上分析经验,在小基因组项目(叶绿体、线粒体、病毒)上形成强劲技术优势并可提供定制化高级分析内容。成立至今已服务客户单位200余家包括中国科学院植物研究所、中国科学院昆明植物研究所、华南农业大学、浙江大学、中国人民解放军疾病预防控制中心、武汉水生生物研究所等科研单位。合作老师发表小基因组SCI文章逾200篇,发表在《BMC Plant Biology》、forests》、《 Frontiers in Plant Science》、《Frontiers in Microbiologymolecules》、《International Journal of Biological Macromolecules》、《Plant Genome》、《International Journal of Molecular Sciences》、《Infectious Diseases of Poverty》、《Insect Science》《genes》、《frontiers in Veterinary Science》《Frontiers in Immunology》等杂志。

物种分类及进化研究
《物种分类及进化研究》专注于物种分类及进化研究,主要研究技术为植物叶绿体基因组测序,植物线粒体基因测序,动物线粒体基因组测序,真菌线粒体基因组测序,真菌基因组测序。我们会定期通过网络,汇总物种分类及进化相关研究进展,解读相关研究论文。
 最新文章