​Ticks and Tick-borne Diseases|西藏血蜱完整线粒体基因组的表征及系统发育分析

文摘   2024-04-30 11:09   湖南  

摘要

血蜱是一类专门的外寄生虫,它们以宿主的血液为食,不仅会对宿主造成身体伤害,还能传播各种病原体,从而引发人畜多种疾病。血蜱属(Haemaphysalis)包含许多病原体的传播媒介。线粒体基因组序列作为可靠的分子标记,在进化分析、研究物种起源和探索分子系统发育方面发挥着关键作用。本研究获得了西藏血蜱(Haemaphysalis tibetensis)线粒体基因组,长度为14,714 bp的序列。该线粒体基因组包含13个蛋白编码基因、2个核糖体RNA基因、22个tRNA基因和2个控制区。西藏血蜱线粒体基因组的核苷酸组成为:A 38.38%、G 9.61%、T 39.32%、C 12.69%,A+T含量高达77.7%,明显高于G+C含量。西藏血蜱线粒体基因组中还存在两个长度为33 bp的重复序列单元,位于nad1和rrnL基因的下游。基于13个蛋白编码基因的系统发育分析结果显示,西藏血蜱(亚属Allophysalis)与尼泊尔血蜱(亚属Herpetobia)和丹尼尔血蜱(亚属Allophysalis)形成单系。然而,其他形态上与西藏血蜱相似的血蜱物种(如无刺血蜱、北海道血蜱、科洛尼尼血蜱和科拉斯贝尔科乌血蜱),虽然也属于原始的Alloceraea亚属,但未能与西藏血蜱形成单系。

本研究获得了西藏血蜱的完整线粒体基因组序列,丰富了血蜱类的线粒体基因组数据,为进一步研究该属的种群遗传和分子进化提供了重要的遗传标记。

西藏血蜱(Haemaphysalis tibetensis)完整线粒体基因组的表征及系统发育分析

Characterization of the complete mitochondrial genome and phylogenetic analyses of Haemaphysalis tibetensis Hoogstraal, 1965 (Acari: Ixodidae)

时间:2024  杂志:Ticks and Tick-borne Diseases 影响因子:3.2 分区:1/2区

研究目的

本研究采用了NGS技术对西藏血蜱(Haemaphysalis tibetensis)的完整线粒体基因组进行了测序和注释。作者还利用线粒体基因组中的蛋白编码基因(PCGs)构建了系统发育树,并探讨了西藏血蜱与其他血蜱。特别是血蜱属(Haemaphysalis)内各亚属之间的进化关系。

研究方法

1、血蜱的鉴定
血蜱样本采集自西藏林芝市贡布江达县牦牛的皮肤,并使用Leica SAPO立体显微镜(Leica Microsystems, Singapore)进行鉴定。血蜱的图像使用显微镜相机(MC170 HD)拍摄。成年血蜱属(Haemaphysalis)物种可通过某些形态特征与其他属区分,如肛门后方的肛沟、背面方形的基节和无眼睛和装饰的11个小节的盾板。此外,成年西藏血蜱(H. tibetensis)还可根据关键形态特征与其他相关血蜱属物种区分,包括雌性个体具有棒状触肢(图1,2)、雄性个体第四对腿节内侧具有细长的棘状突起,以及雌性个体具有亚脊状内突(图1,2)。此外,雄性个体具有三角形的角突,而雌性个体则没有(图2)。

图1 成年西藏血蜱的形态特征

雄性:(A) 背面视图,(B) 腹面视图;

雌性:(C) 背面视图,(D) 腹面视图。   

图2. 成年西藏血蜱角突和内突的形态特征

雄性:(A) 背面视图,(B) 腹面视图;

雌性:(C) 背面视图,(D) 腹面视图。

2、构建基因组文库和测序
个体血蜱样本经过研磨后,使用FastPure Blood/Cell/Tissue/Bacteria DNA Isolation Mini Kit从中提取总DNA。采用全基因组测序(WGS)方法使用Illumina NovaSeq平台进行2×150 bp双端测序。使用FastQC软件验证数据质量指标,并使用Adapter Removal (version 2)程序去除低质量的3'末端reads。为验证NGS结果的准确性,对提取的DNA进行PCR扩增,扩增两个大的非编码区(CR1和CR2),并使用Sanger测序进行验证。

3、线粒体基因组的组装和注释
使用A5-miseq v20150522和SPAdesv3.9.0两种软件,从头组装高质量的NGS数据,得到contig和scaffold序列。通过BLASTN分析将高测序深度的序列与NCBI nt数据库进行比对,识别出线粒体序列。参考H. formosensis完整线粒体基因组( NC_020334)作为参考序列,利用mummers v3.1软件进行共线性分析,确定contig的位置关系并填补间隙。   最终通过使用pilon v1.18软件对结果进行校正,获得了校正后的西藏血蜱完整线粒体基因组序列。将获得的线粒体序列提交到MITOS网站进行初步基因注释和tRNA二级结构预测。然后通过与其他血蜱的同源性比对,对注释结果进行验证和修正。使用CGView Server (http://stothard.afns.ualberta.ca/cgview_server/)绘制线粒体基因组圈图。使用PhyloSuite计算相对同义密码子使用率(RSCU)和组成偏移值,并使用UniPro UGENE进行DNA序列比对。

4、线粒体基因组系统发育分析
多基因串联可以提高系统发育重建的稳定性和可靠性。为了进行比较和系统发育分析,作者检索了107种硬蜱类、2种软蜱类、1种纳塔利埃蜱和1种基部节肢动物的线粒体基因组序列(表S1-1),并使用PhyloSuite软件提取了这111个线粒体基因组的13个蛋白编码基因(PCGs)。

首先,使用PhyloSuite和手动方法对序列进行标准化,确保它们的名称和注释正确无误。然后使用MAFFT软件对蛋白编码基因进行比对,并通过PhyloSuite将所有PCGs的对齐结果合并成一个联合数据集,同时使用Gblocks 0.91b去除了模糊对齐的区域。接下来,使用ModelFinder确定了每个基因适合的进化模型,然后采用IQ-TREE构建了最大似然系统发育树,使用了核苷酸替换的分区模型。进行了100,000次超快速Bootstrap重复值,生成了系统发育树,最后使用iTOL v5对进化树进行可视化和美化。

主要结果

1、线粒体基因组结构和核苷酸组成    

西藏血蜱的线粒体基因组大小为14,714 bp。该基因组的核苷酸组成为:A 38.38%、T 39.32%、C 12.69%、G 9.61%,呈现明显的AT偏倚。AT偏倚值为-0.012,GC偏倚值为-0.138。

该线粒体基因组包含22个tRNA基因、13个蛋白编码基因、2个rRNA基因(rrnL和rrnS)以及2个非编码的控制区(CR1和CR2)(表1,图3)。22个tRNA基因序列总长1366 bp,A+T含量为80%。13个蛋白编码基因总长10,800 bp,A+T含量为77%。2个rRNA基因总长1950 bp,A+T含量为81%。

         

 

1 西藏血蜱的线粒体基因组基因长度和排列

         

 

   

图3 西藏血蜱的线粒体基因组图谱

2、线粒体蛋白编码基因和密码子使用
西藏血蜱的13个蛋白编码基因(PCGs)的大小与其他已测序的硬蜱类物种相似。其中nad2、nad3、nad5、nad6和atp8基因使用ATT作为起始密码子,cox2、cox3、nad4、nad4L、atp6和cob基因使用ATG作为起始密码子,而nad1和cox1基因使用ATA作为起始密码子。终止密码子主要为TAA,仅有2个PCGs使用TAG,还有4个PCGs使用不完整的”T”作为终止密码子。在13个PCGs中,9个(nad2、cox1、cox2、atp8、atp6、cox3、nad3、nad6和cob)位于主链(J链),4个(nad5、nad4、nad4L、nad1)位于副链(N链)。西藏血蜱的密码子使用、相对同义密码子使用率(RSCU)和密码子家族比例如图4所示。西藏血蜱PCGs中,异亮氨酸(13.45%)、亮氨酸(12.95%)和苯丙氨酸(11.39%)是最丰富的氨基酸。特别是编码这些最常见氨基酸的密码子的第二位置全部为T,与该物种较高的T偏移(AT skew=-0.444)相对应。   

图4 西藏血蜱线粒体基因组的相对同义密码子使用率(RSCU)。图中x轴标注了密码子家族,柱状图显示了各密码子的RSCU值。柱顶的数值表示相应氨基酸的使用率。      

 

3、tRNA和rRNA基因
西藏血蜱线粒体基因组中包含22个tRNA基因,长度从54 bp(trnS1)到67 bp(trnK和trnQ)不等(表1)。大多数tRNA基因具有完整的三叶草二级结构,但trnS1和trnC缺失二氢尿嘧啶(DHU)臂。这种不典型的trnS1(AGN)在硬蜱中很常见。trnC中缺失配对的DHU臂也曾在硬蜱中报道过。西藏雪平线粒体基因组中连接的tRNA序列呈现G核苷酸偏好(GC skew=0.148)。两个rRNA基因rrnL和rrnS的长度分别为1246 bp和704 bp,A+T含量分别为81.3%和79.9%。这两个rRNA基因由trnV基因分隔(表1,图3),这在软蜱类和硬蜱类之间是保守的。

         

 

4、非编码区
使用PCR和Sanger测序对NGS获得的两个大型非编码区(推测为控制区)的序列进行了验证。从20个不同的血蜱样本中扩增的目标片段与NGS获得的非编码区序列高度一致(图5)。位于rrnS-trnI之间和trnL1-trnC之间的两个非编码区分别命名为CR1和CR2,长度分别为308 bp和309 bp(表1)。经过对齐,这两个非编码区在相对位置54-308的核苷酸序列显示100%的一致性,对应于最丰富的单倍型(图5)。   

图5 西藏血蜱线粒体基因组(GenBank: OM049539)中确定控制区1(CR1)和控制区2(CR2)。图中括号内的数字表示该单倍型的序列数量。       

 

在蜱类线粒体基因组中,Montagna等人曾将一些小的非编码区域定义为“Tick-Box”,认为它们可能参与调控nad1和rrnL基因的3'端成熟,起到转录终止或前体转录物加工的作用。

但后来的研究发现,这些区域实际上是重复单元,并且是双链转录的。在本研究中,研究人员在西藏血蜱线粒体基因组中也发现了重复单元,但它们位于nad1和rrnL基因的下游,而不是在互补区域(图6)。此外,在属于亚属Alloceraea的4个血蜱物种(H. inermis、H. kitaokai、H. kolonini和H. colasbelcouri)中,也发现了在trnE和nad1基因之间存在插入序列,包含重复单元。

图6 西藏血蜱线粒体基因组中的重复区域。图中上方的数字表示相对于tRNA-M基因的位置。     

 

3.5. 系统发育分析
基于完整线粒体基因组构建的系统发育树揭示了蜱类物种之间的进化关系。该系统发育树是基于从NCBI数据库获取的111个已报道线粒体基因组的13个蛋白编码基因数据构建的。该系统发育树可以清晰地把血蜱属分为两个平行的主要支系。主支系由西藏血蜱(H. tibetensis)、尼泊尔血蜱(H. nepalensis)、丹尼尔血蜱(H. danieli)以及血蜱属中的大多数物种组成。第二个较小的支系包括亚属Alloceraea中的4个物种:无刺血蜱(H. inermis)、北海道血蜱(H. kitaokai)、科拉斯-贝尔科尔血蜱(H. colasbelcouri)和科洛尼尼血蜱(H. kolonini),以及古老的Archaeocroton sphenodonti物种(图7)。

图7 基于13个蛋白编码基因构建的系统发育树,展示了蜱类物种之间的进化关系。图中,Limulus polyphemus (NC_003057)作为外群。比例尺表示每个位点的预期变化数。每个节点旁边的数字表示Bootstrap支持率的百分比。

讨论

本研究确定并分析了分布于中国高海拔山区的西藏血蜱(Haemaphysalis tibetensis)的完整线粒体基因组。获得了总长14,714 bp的线粒体基因组序列,包括13个蛋白编码基因、2个rRNA基因、22个tRNA基因以及2个非编码区。该线粒体基因组的核苷酸组成比例为:A 38.38%、G 9.61%、T 39.32%、C 12.69%,与已报道的其他蜱类物种相近,呈现出弱的AT负偏移。A+T含量明显高于G+C含量,这是大多数节肢动物线粒体基因组的共同特征。13个蛋白编码基因主要编码ATP合成酶亚基、细胞色素和氧化还原酶亚基。   

在硬蜱类线粒体基因组中发现了“Tick-Box”序列结构,被认为可能参与转录后调控,并可能导致基因组重排。但后续研究发现,这些其实是重复单元,长度和拷贝数在不同物种间存在差异。通常这些重复单元位于nad1和rrnL基因的下游区域。在某些亚属,如Dermacentor、Rhipicentor和Hyalomma,还会在trnQ和trnF基因之间发现第三个重复单元。但在属Amblyomma和Haemaphysalis中,这两个基因之间的非编码区很短,不含“Tick-Box”序列。这可能有助于将蜱类划分为更高的分类单元。与属血蜱属其他物种仅在nad1和rnnL基因下游有重复单元不同,H. inermis、H. colasbelcouri、H. kolonini和H. kitaokai的线粒体基因组中,重复单元位于trnE和nad1基因之间的插入区域。这可能是由于这些物种这两个基因之间的非编码区较长所致。

血蜱属包含16个亚属。Hoogstraal和Kim根据形态特征将这些亚属划分为三个组,“structurally primitive”组(Alloceraea、Allophysalis、Aboimisalis和Sharifiella);“structurally intermediate”组(Herpetobia)和“structurally advanced”组(Aborphysalis、Dermaphysalis、Elongiphysalis、Garnhamphysalis、Gonixodes、Haemaphysalis、Kaiseriana、Ornithophysalis、Rhipistoma、Segalia和Subkaiseriana)。系统发育分析结果表明,西藏血蜱所属的亚属Allophysalis相对于主要的Haemaphysalis支系更为远缘。在主Haemaphysalis支系内部,H. (Herpetobia) sulcata、H. (Herpetobia) qinghaiensis和H. (Aboimisalis) punctata以及几个其他亚属形成一个小支系,而Allophysalis和H. (Herpetobia) nepalensis则位于外围。因此,Hoogstraal和Kim提出的“结构上原始、中间和进化”的分类方案在系统发育上并不单一。但值得注意的是,亚属Alloceraea中的4个“structurally primitive”物种(H. inermis、H. kitaokai、H. kolonini和H. colasbelcouri)在线粒体基因组水平上形成了一个独立的支系。这些物种被认为具有血蜱属物种中最“原始”的形态特征。   

温馨说明

 1、惠通生物针对叶绿体、线粒体测序项目组装结果准确,可以提供定制化高级分析,欢迎联系我们获取小基因组文章专业解决方案,助力文章发表。

 2、惠通生物小基因组服务电话:18926264030


欢迎关注物种分类及进化研究



  深圳市惠通生物科技有限公司,成立于2016年,技术成员在生物信息方面均有10年以上分析经验,在小基因组项目(叶绿体、线粒体、病毒)上形成强劲技术优势并可提供定制化高级分析内容。成立至今已服务客户单位200余家包括中国科学院植物研究所、中国科学院昆明植物研究所、华南农业大学、浙江大学、中国人民解放军疾病预防控制中心、武汉水生生物研究所等科研单位。合作老师发表小基因组SCI文章逾200篇,发表在forests》、 Frontiers in Plant Science》、《Frontiers in Microbiologymolecules》、International Journal of Biological Macromolecules》、《Plant Genome》、International Journal of Molecular Sciences》、《Infectious Diseases of Poverty》、《Insect Science》genes》、《frontiers in Veterinary Science》《Frontiers in Immunology》等杂志。         

 

    

物种分类及进化研究
《物种分类及进化研究》专注于物种分类及进化研究,主要研究技术为植物叶绿体基因组测序,植物线粒体基因测序,动物线粒体基因组测序,真菌线粒体基因组测序,真菌基因组测序。我们会定期通过网络,汇总物种分类及进化相关研究进展,解读相关研究论文。
 最新文章