本研究使用高通量测序技术来确定6种步甲虫的完整线粒体基因组序列,其中包括5种地甲亚科和1种步甲亚科。线粒体基因组的大小范围从15,334 bp到16,972 bp不等,包含37个基因,其中包括13个编码蛋白的基因、22个转运RNA基因和2个核糖体RNA基因。此外,每个物种都被发现拥有一个推测的控制区域。我们将65个已发表的步甲科甲虫线粒体基因组序列作为内群,以及4个来自跟Trachypachidae、Gyrinidae和Dytiscidae的物种作为外群,采用最大似然法和贝叶斯推断法进行系统发育分析。此外,我们还使用基于ASTRAL方法重建了步甲科甲虫的物种进化树。结果显示,步甲科并不是一个单系类群。在最大似然分析中,地甲亚科被支持为一个单系类群。尽管在连锁分析中,步甲亚科被发现不是单系类群,但在物种树分析中,它被确认为一个单系类群。
基于线粒体基因组数据的系统发育分析,六个来自 Harpalinae 和 Carabinae(鞘翅目,步甲科)的地甲的完整线粒体基因组Six complete mitochondrial genomes of ground beetles from the Harpalinae and Carabinae (Coleoptera, Carabidae) with phylogenetic analysis based on mitogenomic data
时间:2024 杂志:Arch Insect Biochem Physiol. 影响因子:1.536本研究中,作者通过测序6种地面甲虫的线粒体基因组,进行了线粒体基因组系统发育分析,旨在探讨豆科甲虫科内部的亲缘关系。坐着提供了这些线粒体基因组的详细特征,并计算了它们的进化速率。此外,作者整合了65个先前发表的线粒体基因组序列,重建了豆科甲虫科内部的系统发育关系。采用了最大似然法、贝叶斯推断法以及基于coancestry的物种树方法(ASTRAL)进行了系统发育分析。这些全面的分析为了解这个昆虫科的遗传多样性和进化动态提供了洞见。
成虫标本采集自中国河南省郑州市。初步物种鉴定基于外部形态特征。此外,我们还使用DNA条形码序列进行了分子鉴定,以确认标本的身份。本研究中6种新测序的地甲虫的保存详情列于表1。成虫标本保存在95%乙醇中,存储于-80°C,然后被保存在河南农业大学昆虫博物馆,以供进一步研究。使用TIANamp Micro DNA试剂盒(天根生物科技有限公司)按照制造商的说明从胸部组织中提取总基因组DNA。提取DNA的质量和浓度使用琼脂糖凝胶电泳和核酸蛋白分析(Qua Well Technology Inc.)进行评估。
使用Illumina TruSeqTM DNA Sample Prep Kit (Illumina)试剂盒制备测序文库。基因组测序在 Illumina HiSeq 2500 平台上进行,采用双端 2 × 150 bp 的测序方式。数据质控后使用 GetOrganelle软件进行线粒体基因组组装,采用动物数据库作为参考。初步的线粒体基因组注释是使用 MITOS网址注释。蛋白编码基因和核糖体 RNA 基因的边界通过与近缘物种进行比对进行了细化(表2)。 13 个蛋白编码基因使用 TranslatorX和 MAFFT 算法进行单独比对。比对质量较差的区域和gap使用 trimAl的"automated1 heuristic"选项进行了去除。
随后,所有比对结果使用FASconCAT-G进行了拼接,创建了三种类型的数据集:(1)PCG_nt,包含13个蛋白编码基因的拼接核苷酸序列;(2)PCGnt+RNA,包含13个蛋白编码基因、22个tRNA基因和2个rRNA基因的拼接核苷酸序列;(3)16gene_partiton_ASTRAL,包含13个蛋白编码基因、2个核糖体RNA基因和tRNA基因(所有22个tRNA基因作为单一分区,因为它们相对较短)的核苷酸序列。
进行了碱基组成偏移分析,使用公式:AT-skew = (A - T)/(A + T)和GC-skew = (G - C)/(G + C)。使用DnaSp计算了每个蛋白编码基因的平均非同义替换率(ka)和同义替换率(ks)。
表2 本研究中的物种线粒体登录号
本研究使用了71个代表14个亚科的步甲科(Carabidae)线粒体基因组进行系统发育分析。外群包括Gyrinidae (Dineutus mellyi)、Dytiscidae (Acilius sulcatus和Hydroporus obscurus)和Trachypachidae (Trachypachus holmbergi)。本研究采用了最大似然(ML)、贝叶斯推断(BI)和ASTRAL物种树分析三种方法进行系统发育树重建。
最大似然分析,构建系统发育树时,基于PCG_nt矩阵使用IQ-TREE进行了最大似然分析。每个基因分区的最佳替换模型使用ModelFinder确定。节点支持度使用10,000次重复的ultrafast bootstrap(BS)分析评估。
贝叶斯推断分析,使用PhyloBayes-MPI软件包,在CIPRES Science Gateway实施。从PCGs+RNAs数据集推断BI树。应用CAT-GTR模型到核苷酸比对,执行两个独立的运行,每个运行包括两个链,总长度为10,000个循环。通过比较分区频率差异(maxdiff < 0.3)评估链之间的收敛性。从两次运行中生成共识树,丢弃前1000个循环作为burn-in。支持度使用后验概率(PP)评估。
ASTRAL物种树分析,此外,我们还使用ASTRAL进行了物种树分析。这种树估计方法表现出了出色的准确性,可以作为广泛使用的序列串联方法的补充。使用16gene_partition_ASTRAL数据集进行了coalescent‐based估计,使用ASTRAL在 coalescent模型下总结基因树。在ASTRAL拓扑结构上计算了局部后验概率作为支持值。
在本研究中,我们测序了6个线粒体基因组,大小约在15-17 kb之间,每个都包含一个非编码的控制区域(图1)。在新测序的Harpalus sp.1线粒体基因组中,比对到线粒体contig(16,429 bp)的碱基数量达到25,234,198。同样地,对于Harpalus sp.2(16,027 bp)新的线粒体基因组比对到24,607,866碱基数。对于Amara ovata,新的线粒体,有22,965,966个碱基比对到15,334 bp的基因组序列contig。Harpalus griseus(16,972 bp)线粒体基因组序列显示有39,688,508个碱基比对上。对于Diplocheila zeelandica,新的线粒体基因组序列有18,524,956个碱基对应于原始16,190 bp的contig。最后,Carabus sp.的新线粒体基因组序列有29,257,452个碱基比对到原始16,546 bp的contig。这些结果表明,测序深度与线粒体基因组组装效率之间存在明确的相关性,如表3所详述。 这些新测序的线粒体基因组在基因排列和基因组组织上与假定的祖先昆虫线粒体基因组相似。重链上有23个基因,剩余14个基因编码在轻链上。六种地甲虫物种的完整线粒体基因组大小范围为15,334 bp到16,972 bp。线粒体基因组图谱使用OGDRAW构建。对这些线粒体基因组内的AT核苷酸组成进行分析,发现存在明显的A和T偏移。具体而言,Harpalus sp.1和H. griseus的AT含量均为80.4%,而Carabus sp.的AT含量略低,为79.4%。Harpalus sp.2的AT组成更高,达到80.8%。Amara ovata的AT含量为80.1%,Diplocheila zeelandica的AT含量最低,为78.3%。AT偏移值在0.023到0.039之间,表明存在轻微到中等程度的A偏移。相反,GC品阿姨值在-0.183到-0.146之间,表明存在较强的C偏移(表4)。此外,替换率分析表明,Rhysodes仍然表现出加速的进化速率。这从Rhysodes最高的非同义替换与同义替换之比(ka/ks值为0.580)可以看出(表5)。这表明Rhysodes可能经历了正选择或净化选择,导致其线粒体基因组的遗传变化积累速度比其他研究物种更快。
与之前的研究相比,我们扩大了样本的分类覆盖范围,包括了更多的步甲科及其亚科,在Li et al. (2020)的研究基础上进行了拓展。我们的分析得到了在两个串联数据集(图2和图3)上基本一致的树拓扑。然而,最大似然(ML)分析相比贝叶斯推断(BI)分析展现出了更高的分辨率。在BI分析树中,通往内部节点的许多分支过短,难以清楚地区分它们之间的关系。在三种系统发育分析方法中,只有ASTRAL分析成功恢复了单系的Carabinae。在ML和BI分析中,Carabinae都被发现对于Cychrus caraboides是非单系的。此外,基于目前线粒体基因组序列数据的所有系统发育分析都发现步甲科是非单系的,这是由于Trachypachidae和/或Gyrinidae的嵌套位置所致。在串联分析中,Harpalinae、Paussinae、Cicindelinae、Rhysodinae、Scaritinae、Broscinae、Omophroninae、Loricerinae、Promecognathinae、Elaphrinae和Trechinae亚科的单系性得到了支持。但是,Brachininae、Nebriinae和Carabinae亚科在最大似然(ML)树中并未被恢复为单系群。此外,Carabus sp.和C. smaragdinus之间的姊妹关系得到了强有力的支持。同样地,A. ovata被确定为Amara communis的姊妹类群,支持度很高(BS = 100,PP = 1)。我们还观察到Harpalus sp.2与(Harpalus sp.1 + H. griseus + H. pensylvanicus)形成聚类。在推断的系统发育关系方面,ML和BI分析的主要差异在于Brachininae亚科和Cychrini族的位置。在ML分析中,Brachininae被树拓扑描绘为Rhysodinae的姊妹群,而Cychrini(代表C. caraboides)则被确定为Notiophilini(代表Notiophilus quadripunctatus)的姊妹类群(图2)。相反,在贝叶斯推断(BI)分析中,Brachininae和Cychrini的位置发生了明显变化,Brachininae与Harpalinae聚为一支(图3),Cychrini被确定为Nebrini(Nebria ingens + N. brevicollis)的姊妹群,但这些关系缺乏显著的统计支持。此外,在BI分析中,Brachininae中的两个代表(Mastax latefasciata和Brachinus crepitans)聚为一支,而在ML分析中它们分别位于远离的位置。
图2 基于13个蛋白编码基因核苷酸序列的最大似然系统发育树。该系统发育树是使用IQ-TREE软件推断得到的。节点旁的数字表示ultrafast bootstrap值。
图3 基于PCGnt+RNA核苷酸数据集的贝叶斯系统发育树。该系统发育树是使用PhyloBayes-MPI软件推断得到的。树上节点旁的数字表示贝叶斯后验概率。
基于coalescent的物种树分析(图4)发现Brachininae亚科是非单系的,这与ML分析结果一致,但与BI分析结果不同。除Brachininae外,其他所有亚科(Harpalinae、Paussinae、Cicindelinae、Rhysodinae、Scaritinae、Broscinae、Omophroninae、Loricerinae、Promecognathinae、Elaphrinae、Trechinae和Nebriinae)在coalescen物种树分析中都被恢复为单系群。
图4 基于16gene_partiton_ASTRAL核苷酸数据集的物种树。该物种树是使用ASTRAL软件推断得到的。
总之,不同分析方法得到的矛盾结果表明,步甲科及其亚科的进化历史可能更为复杂。这可能是由于样本覆盖范围仍然有限所致。因此,未来的研究应该着重扩大样本规模,并纳入更广泛的分子标记,以获得更全面的步甲科系统发育关系理解。
之前的研究表明,地甲虫形成了一个单系群,意味着它们具有共同的祖先。这一观点得到了形态特征和分子证据的支持。然而,后续研究采用了多种方法,包括Arndt(1998)对形态特征的审查、Maddison et al.(2009)对核基因数据的分析,以及Li et al.(2020)和Raupach et al.(2022)对线粒体基因组数据的研究,都未能证实甲虫科的单系地位。在本研究中,在基于13个蛋白编码基因核苷酸序列的最大似然(ML)分析中,由于包含了Trachypachidae,步甲科被确定为非单系(尽管支持度较弱,BS = 57)。在使用PCGs+RNAs数据集进行的贝叶斯推断(BI)分析中,也观察到了类似的模式,步甲科由于包含了Trachypachidae和Gyrinidae而被界定为非单系,但Trachypachidae(Pp = 0.88)和Gyrinidae(Pp = 0.5)的位置支持度较弱。这些发现表明需要进一步研究来阐明甲虫科内部关系的必要性。此外,ASTRAL生成的物种树表明,线粒体基因组序列数据对于推断甲虫科内部的系统发育关系是有用的。尽管结果也显示步甲科由于包含Trachypachidae而呈现非单系聚类,但Carabinae亚科被恢复为单系。
在Kieran(2020)最近的一项研究中,使用线粒体基因组序列以及核基因18S rDNA和28S rDNA确定了Harpalinae和Pterostichinae为一个单系支。我们的分析利用线粒体基因组序列数据,在最大似然(ML)分析中强烈支持了Harpalinae的单系性(BS = 99)。此外,我们获得了一个高分辨率的拓扑结构,明确了步甲科内部几个亚科群的单系关系,支持度很高。Harpalinae和Brachininae的姊妹群关系得到了强有力的节点支持(BS = 92)。Ober(2002)的先前研究也支持了这一姊妹群关系。然而,贝叶斯推断(BI)和ASTRAL分析都认为Harpalinae是Brachininae的姊妹群,但这一关系没有得到显著的统计支持。尽管如此,这些矛盾的结果表明,这些亚科之间的关系存在潜在的不确定性,需要进一步的研究来获得更多确认。在Yu et al.(2019)之前的研究中,通过分析线粒体基因组的13个蛋白编码基因,Harpalus被确定为非单系群。他们认为Harpalus与Abax、Stomis、Amara和Pterostichus关系密切。在本研究中,我们重新评估了Harpalus的系统发育,确认它们是一个单系群。此外,我们的分析 一致地显示,Harpalus是由Anisodactylus组成的单系支的姊妹群。在最大似然(ML)和贝叶斯推断(BI)分析中,我们的结果表明Carabinae亚科是非单系的,因为C. caraboides被嵌套在Nebriinae中。然而,ASTRAL分析却认为Carabinae是单系的,但支持度较弱(PP = 0.8)。在Carabus属的单系支中,所有分析都确认了其单系性,支持度很高(BS = 100,PP = 0.99)。这与Deuve et al.(2012)之前的研究结果一致,也支持Carabus是一个单系群。在本研究中,所有分析一致支持Carabus sp.和C. smaragdinus之间的姊妹群关系。我们成功获得了Licinini族(D. zeelandica)的第一个完整线粒体基因组序列。BI分析显示,Licinini形成了Panagaeini的姊妹群,尽管支持度较弱(PP = 0.77)。同样地,ASTRAL分析中Licinini和Panagaeini的姊妹群关系也只获得了较弱的支持(BS = 85,PP = 0.68)。这些发现为Licinini和Panagaeini两个族的系统发育关系提供了新的见解。 在本研究中,我们测序了6种地甲虫的完整线粒体基因组,包括5个来自地甲亚科的物种和1个来自步甲亚科的物种。新测序的线粒体基因组在组织和内容上都符合Cameron et al.(2014a, 2014b)报告的假定的祖先昆虫模型。通过将新的线粒体基因组序列与之前发表的序列结合,我们旨在探讨地甲虫的系统发育关系。我们的结果表明,步甲科(Carabidae)不是单系的,而地甲亚科一直被确认为单系群。此外,Carabus属被确定为一个单系支,Carabus sp.在所有分析中都被恢复为C. smaragdinus的姊妹种。在最大似然(ML)和贝叶斯推断(BI)分析中,Carabinae亚科未被恢复为单系。然而,在ASTRAL分析中,所有Carabinae代表被聚集在一个单系支中。此外,我们的结果在所有分析中一致地揭示了Licinini和Panagaeini两个族之间的姊妹群关系,无论使用何种数据集或推断方法。本研究突出了线粒体基因组序列在阐明步甲科(Carabidae)系统发育关系中的效用。这些发现有望丰富我们对地甲虫进化历史和相互关系的理解。
1、惠通生物针对叶绿体、线粒体测序项目组装结果准确,可以提供定制化高级分析,欢迎联系我们获取小基因组文章专业解决方案,助力文章发表。
2、惠通生物小基因组服务电话:18926264030
深圳市惠通生物科技有限公司,成立于2016年,技术成员在生物信息方面均有10年以上分析经验,在小基因组项目(叶绿体、线粒体、病毒)上形成强劲技术优势并可提供定制化高级分析内容。成立至今已服务客户单位200余家包括中国科学院植物研究所、中国科学院昆明植物研究所、华南农业大学、浙江大学、中国人民解放军疾病预防控制中心、武汉水生生物研究所等科研单位。合作老师发表小基因组SCI文章逾200篇,发表在《forests》、《 Frontiers in Plant Science》、《Frontiers in Microbiology》、《molecules》、《International Journal of Biological Macromolecules》、《Plant Genome》、《International Journal of Molecular Sciences》、《Infectious Diseases of Poverty》、《Insect Science》、《genes》、《frontiers in Veterinary Science》《Frontiers in Immunology》等杂志。