摘要
跳蚤是全球最常见和广泛的外寄生虫之一,包括至少2500个物种。它们是鼠疫杆菌等致病菌的载体,。然而,尽管它们很重要,但跳蚤的分子遗传学、生物学和系统发育仍然不太清楚。我们使用二代测序技术测序、组装和注释了啮齿类跳蚤秃病蚤(Nosopsyllus laeviceps)的完整线粒体(mt)基因组。然后,将其与23个其他跳蚤物种的mt基因组数据结合起来,进行比较线粒体基因组学、核苷酸多样性和进化速率分析。随后,我们基于13个线粒体蛋白编码基因数据,使用贝叶斯推断(BI)和最大似然(ML)方法探讨了蚤目(Siphonaptera)内物种的系统发育关系。啮齿类跳蚤N. laeviceps的完整mt基因组是一个16,533bp的环状DNA分子,包含37个典型基因(13个蛋白编码基因,22个转运RNA[tRNA]基因和2个核糖体RNA[rRNA]基因),以及一个大的非编码区(NCR)。蚤目之间的比较分析显示,基因顺序稳定,没有基因重排,并且具有很高的AT含量(76.71–83.21%),除了3种跳蚤Aviostivalius klossi bispiniformis、Leptopsylla segnis和Neopsylla specialis外,其他物种都有明显的负AT和GC偏斜。此外,我们发现有力的证据表明,细胞色素c氧化酶亚基1(cox1)基因是跳蚤最保守的蛋白编码基因(Pi = 0.15,非同义/同义[Ka/Ks]比率= 0.13)。使用两种方法进行的系统发育分析揭示了不同的拓扑结构,但两种结果都强烈表明:(i)角叶蚤科(Ceratophyllidae)和细蚤科(Leptopsyllidae)是并系的,彼此最接近;(ii) 栉眼蚤科(Ctenophthalmidae)是并系的。
在本研究中,我们获得了啮齿类跳蚤N. laeviceps的高质量线粒体基因组,并利用线粒体数据进行了蚤目(Siphonaptera)的比较线粒体基因组学和系统发育分析。研究结果将丰富跳蚤的线粒体基因组数据,为跳蚤的系统发育分析奠定基础,并促进跳蚤目物种的进化分析。
The complete mitochondrial genome of the rodent flea Nosopsyllus laeviceps: genome description, comparative analysis, and phylogenetic implications
时间:2024 杂志:Parasites & Vectors 影响因子:3 分区:1/2区
研究方法
1、样本采集、观察、洗涤和DNA提取
本研究中涉及动物的所有操作均已获得动物伦理委员会的批准(编号:201703386)。啮齿类跳蚤成虫样本采自重庆市下水道大家鼠(Rattus norvegicus)的体表。所有跳蚤标本在初步清洗后放入离心管中。首先使用立体显微镜对跳蚤进行形态学鉴定,达到属水平。然后,每只跳蚤放入含生理盐水的无菌离心管中,经过振荡和洗涤以去除附着在体表的杂质和尘埃。值得注意的是,当观察到跳蚤腹部有明显的红色条带时,将腹部切开并清洁血液,以确保后续DNA提取的准确性。经过上述过程,样品分别储存于-40℃的100%乙醇中,以备后续分子研究使用。
使用QIAGEN公司的QIAamp® DNA Micro Kit,按照说明书从单只跳蚤中提取总基因组DNA。DNA浓度和质量分别使用Invitrogen公司的Qubit 4.0荧光计和1.0%的琼脂糖凝胶电泳进行测定和分析。通过PCR对线粒体细胞色素c氧化酶亚基1(cox1)和cox2基因进行扩增,PCR产物由上海生工从正反两个方向(正向和反向)进行测序。进一步通过与GenBank数据库中已登录的跳蚤序列进行核苷酸序列比对进行分子鉴定。
2、线粒体基因组测序、组装、注释和可视化
使用Illumina NovaSeq 6000平台构建了一个基因组DNA文库并测序(插入片段为350bp)。通过PE250测序策略生成的原始读取以FASTQ格式输出,然后使用Fastp v.0.19.7软件过滤掉接头reads、高度重复reads、富含“N”和低质量reads。使用Geneious Prime中的“Map to Reference”工具组装线粒体基因组,以扩增的cox1和cox2基因序列作为初始参考。组装标准为最小重叠相似度99%和最小重叠150 bp。当生成一个以重叠片段结束的大contig时,组装被视为完成。
使用ORFfinder和NCBI数据库的BLAST预测和注释了13个蛋白编码基因,并通过ARWEN和tRNAscan-SE识别了22个转运RNA(tRNA)基因及其相应的二级结构。通过与其他的跳蚤线粒体基因组进行比对,确定了两个核糖体RNA(rRNA)基因。所有基因在MITOS WebServer中手动检查。使用MEGA 11软件分析序列比对。啮齿类跳蚤N. laeviceps的线粒体基因组通过Proksee系统进行可视化。
3、序列分析
使用DNASTAR v.5.0计算碱基含量,然后使用以下公式计算GC和AT偏斜:GC偏斜 = (G − C)/(G + C),AT偏斜 = (A − T)/(A + T)。本研究中生成的啮齿类跳蚤的完整线粒体基因组与GenBank数据库中可用的跳蚤基因组在长度、基因顺序和AT含量方面进行了比较。使用DnaSP v.6软件进行核苷酸多样性和进化速率分析。前者通过滑动窗口计算,参数为窗口大小=300,步长=25;后者通过非同义(Ka)/同义(Ks)替代比率进行分析。
4、系统发育分析
研究共选择了23个可用的跳蚤物种,以及蝎蝇Boreus elegans(HQ696579)作为外群进行系统发育分析(表S1)。使用MAFFT 7.122对13个线粒体蛋白编码基因的氨基酸序列进行比对。然后将比对的序列连接成一个数据集。使用Gblocks 0.91b以默认参数排除模糊位点。
采用贝叶斯推断(BI)和最大似然(ML)方法进行系统发育分析。对于BI分析,使用MrBayes 3.2.6构建系统发育树,该程序自动选择最合适的进化模型。同时运行4个独立的马尔可夫链,模拟100万代metropolis耦合马尔可夫链蒙特卡罗,每100代采样一棵树。前2500棵树代表burn-in,剩余树用于检测似然值的稳定性并计算贝叶斯后验概率(Bpp)。当估计样本量(ESS)大于100,潜在缩放减少因子(PSRF)接近于1.0,平均分裂频率的标准差(ASDSF)<0.01时,假定已达到平稳状态。
对于ML方法,根据Akaike信息准则(AIC),ProtTest 3.4选择MtArt+I+G+F为最佳模型。gamma shape为0.66,采用4个速率类别,不变位点的比例为0.23。树拓扑搜索采用subtree pruning and regrafting (SPR)方法。然后使用PhyML 3.1以BioNJ起始树构建系统发育树。自展值通过100次计算,并在节点上标注。使用FigTree v.1.42可视化系统发育树。
主要研究结果
1、啮齿类跳蚤N. laeviceps的鉴定
本研究中收集的所有标本均显示出Nosopsyllus属的典型形态特征:(1) 头部呈圆形,具有一对发达的眼睛和触角;(2) 前胸段有刺,背刺的长度与背面大致相同,前股有一排侧刺;(3) 中胸和腹部背板上有一排刺,前面的刺通常是退化的或缺失的;(4) 第八背板没有刺。
我们从跳蚤样本中获得了大量的cox1和cox2基因序列。BLAST结果显示,标本的部分cox1基因与亚种N. l. ellobii(KM890985)和N. l. kuzenkovi(KM890987)的相似度分别为96.6%和96.4%。标本的部分cox2基因序列与啮齿类跳蚤N. l. laeviceps(MF045767)、N. l. ellobii(KM890852)和N. l. kuzenkovi(KM890858)的相似度分别为98.1%、98.1%和97.6%。
2、啮齿类跳蚤N. laeviceps的线粒体基因组特征
从啮齿类跳蚤N. laeviceps的DNA文库中产生了超过3 GB的Illumina数据。完整的线粒体基因组呈现典型的环状结构,大小为16,533 bp(图1),并已上传NCBI数据库(PP838812)。该线粒体基因组识别出37个典型的多细胞动物基因,包含13个蛋白编码基因(腺苷三磷酸[ATP]合成酶F0亚基6[atp6]、atp8、细胞色素c氧化酶亚基1–3[cox1–3]、细胞色素b[cytb]、烟酰胺腺嘌呤二核苷酸[NADH]脱氢酶亚基1–6[nad1–6]和nad4L)、两个rRNA基因(大亚基rRNA和小亚基rRNA)以及22个tRNA基因(表1,图1)。共23个基因位于重链上,另有14个基因位于轻链上(表1)。有13个基因重叠位点,每个位点重叠1–19 bp。同样,在14个不同的位置发现了基因间区,其中最长的位于大亚基rRNA(rrnL)和tRNA-Val(缬氨酸)基因之间(99 bp)(表1)。
几乎所有啮齿类跳蚤N. laeviceps的线粒体基因组中的蛋白编码基因都使用了常见的起始密码子,包括ATT(atp6、nad3和nad6)、ATG(atp8、cox2、cox3、cytb、nad1、nad4、nad4L和nad5)和ATA(nad2),而cox1基因则使用GTG作为起始密码子(表1)。完整的终止密码子TAA是使用最频繁的,其次是不完整的终止密码子T。然而,通常的终止密码子TAG仅在nad5基因中使用了一次(表1)。此外,N. laeviceps的线粒体基因组中只有一个非编码区(NCR)(表1,图1)。这个大的NCR,也称为控制区,涉及DNA复制的调控,位于tRNA-Ile(I)基因和rrnS基因之间,大小为1882 bp。AT含量为71.3%。与其他可用的跳蚤线粒体基因组相比,只有三种蚤科物种包含两个NCR。猫栉头蚤(Ctenocephalides felis felis)和人蚤(Pulex irritans)有两个长NCR,而犬栉头蚤(C. canis)则有两个短NCR。
表1 啮齿类跳蚤Nosopsyllus laeviceps的线粒体基因组结构特征
图1 啮齿类跳蚤Nosopsyllus laeviceps的完整线粒体基因组图谱
3、跳蚤目(Siphonaptera)的比较线粒体基因组学分析
表2中给出了来自蚤目物种的核苷酸序列大小、AT含量和碱基偏斜的全面比较。约一半的跳蚤线粒体基因组长度约为15,000 bp,而三种蚤科跳蚤——猫栉头蚤(Ctenocephalides felis felis)、东洋栉首蚤(Ctenocephalides orientis)和人蚤(Pulex irritans)则显示出超过20,000 bp的异常大小。啮齿类跳蚤N. laeviceps的AT含量较高(78.10%),并明显表现出负的AT偏斜(−2.87)和GC偏斜(−16.53)(表2)。值得注意的是,蚤目中除了三种跳蚤Leptopsylla segnis、Aviostivalius klossi bispiniformis和Neopsylla specialis外,AT偏斜和GC偏斜均为负值,其中Leptopsylla segnis反而表现出正的AT偏斜(2.36)和GC偏斜(24.77),而后两者均显示中性AT偏斜(0)和负GC偏斜(−16.99和−25.12)(表2)。与其他跳蚤的线粒体基因组相比,我们发现啮齿类跳蚤N. laeviceps的线粒体基因顺序与其他跳蚤相同。基因顺序稳定,在跳蚤目中没有基因重排。
表2 蚤目物种的线粒体基因组比较,包括啮齿类跳蚤Nosopsyllus laeviceps
4、非同义/同义替代率分析
通过滑动窗口分析,发现nad2和nad5基因具有高度的核苷酸序列变异性(Pi峰值>0.30),而rrnS、rrnL和cox1基因的变异性较低(Pi低值<0.13)(图2)。同样地,13个蛋白编码基因的Ka/Ks替代率也显示,nad5基因具有最高的Ka/Ks比值(1.93),而cox1基因的比值最低(0.13)(图3)。这里,两个蛋白编码基因(atp6和nad5)的Ka/Ks比值显著高于1.00(图3),表明这些跳蚤的线粒体基因在正选择压力下以较高的进化速率进化。其他Ka/Ks比值低于1.00的基因则处于纯化选择之下。
图2 蚤目昆虫完整线粒体基因组比对的滑动窗口分析(不包括非编码区)
每个基因的平均核苷酸多态性值显示在图表上方。
图3 跳蚤线粒体基因组中的Ka/Ks替代比率
显示了各个蛋白编码基因的非同义(Ka)和同义(Ks)替代率以及预期的比率
5、系统发育关系
基于24种跳蚤的13个蛋白编码基因进行的贝叶斯推断(BI)和最大似然(ML)分析得到了不同的拓扑结构(图4和图5)。两种拓扑结构都表明,啮齿动物跳蚤N. laeviceps与([Paradoxopsyllus custodis + Macrostylophora euteles] + [Ceratophyllus anisus + Ceratophyllus wui + Citellophilus tesquorum])关系最近,获得了强的BI支持(Bpp = 1.0)和弱的ML支持(Bv < 70)(图4和图5),表明角叶蚤科(Ceratophyllidae)是并系的。细蚤科(Leptopsyllidae)内的另外三种成员(Frontopsylla spadix、Frontopsylla diqingensis和Leptopsylla segnis)没有被高度统计支持地归为一组(Bpp = 1.0; Bv = 100)(图4和图5),表明细蚤科是并系的。除了Aviostivalius klossi bispiniformis(Siphonaptera: Stivaliidae)位于最外层的支系(Bpp = 1.0; Bv < 70)之外,本研究包括的所有跳蚤物种都聚集在一个大支系中,而蚤科(Pulicidae)形成了一个单系支系(Bpp = 1.0; Bv = 100)。在贝叶斯推断拓扑结构中,栉眼蚤科(Ctenophthalmidae)和多毛蚤科(Hystrichopsyllidae)是并系的,因为Hystrichopsylla weida qinlingensis、Stenischia humilis和Stenischia montanis与蠕形蚤科(Vermipsyllidae)分别聚集在一起(图4)。然而,最大似然分析支持多毛蚤科的单系性,但以较低的节点支持度否认了栉眼蚤科的单系性。
图4 基于13个线粒体基因的氨基酸序列,采用贝叶斯推断(BI)分析得到的24种蚤目昆虫的系统发育关系。以蝎蝇Boreus elegans(HQ696579)作为外群。本研究中的啮齿类跳蚤Nosopsyllus laeviceps用红色字体标出。贝叶斯后验概率(Bpp)标注在节点上。
图5 基于13个线粒体基因的氨基酸序列,采用最大似然(ML)分析得到的24种蚤目昆虫的系统发育关系。以蝎蝇Boreus elegans(HQ696579)作为外群。本研究中的啮齿类跳蚤Nosopsyllus laeviceps用红色字体标出。自展值(Bv)标注在节点上。节点支持度<70的用实心黑圈表示。
讨论
跳蚤是最常见的节肢动物传播生物之一,分布广泛。在本研究中,我们首次对啮齿类跳蚤N. laeviceps的完整线粒体基因组结构特征进行了描述和分析,并利用线粒体数据库进行了比较线粒体基因组学、核苷酸多样性、进化速率分析和系统发育分析。线粒体蛋白编码基因的Ka/Ks替代比率代表了同一分类群中密切相关物种的分子进化速率。它们反映了线粒体基因在进化过程中所经历的选择压力。当Ka/Ks比率等于1时,表明线粒体基因处于中性选择压力下,有害突变和有益突变相互抵消。当Ka/Ks比率大于1时,意味着在线粒体基因和核基因的相互进化过程中,有害突变积累。为了消除有害突变,正选择压力作用于线粒体基因,导致其适应性进化。相反,当Ka小于Ks时,线粒体基因受到负选择或纯化选择的影响,防止氨基酸序列发生改变。Ka/Ks比率通常与序列保守性相关,本研究的结果显示,nad5基因序列在蚤目中可能表现出更大的变异性,而cox1基因可能是最保守的。核苷酸多样性分析表明,rrnL、rrnS和cox1基因是最高度保守的基因,表明它们适合作为物种鉴定的分子标记,而nad2和nad5基因具有较高的Pi值,更适合用于物种进化研究。
蚤目昆虫的分类地位和系统发育关系多年来一直是昆虫分类学、系统学和进化生物学中最具挑战性的问题之一。多年来,跳蚤的系统分类主要基于传统的形态学和生理特征,这具有很大的局限性,并且存在长时间的争议。分子系统学的发展为跳蚤的分类和系统学提供了新的见解。由于线粒体基因组数据集的实用性、高系统发育信号和树的强统计支持,建议使用扩展的线粒体数据集重新分析蚤目的系统发育关系。
Whiting等人使用来自四个基因位点数据(包括18S核糖体DNA (rDNA)、28S rDNA、cox2和EF-1α基因)构建了跳蚤的第一个综合系统发育树。为了全面理解跳蚤的系统发育关系,他们使用了128个不同的分类物种,代表16个科和83个跳蚤属,并收集了8个外群样本。基于分子分析,他们提出10个科是单系的,包括Tungidae、Lycopsyllidae、Pygiopsyllidae、Stivaliidae、Stephanocircidae、Rhopalopsyllidae、Chimaeropsyllidae、Pulicidae、Ischnopsyllidae和Ceratophyllidae,而Hystrichopsyllidae、Ctenophthalmidae和Leptopsyllidae科则是并系的。然而,这些结果是通过少数单基因产生的,包含的分子信息有限;因此,他们指出,使用新的分子和形态数据澄清跳蚤的系统分类和系统发育是至关重要的。之前的研究使用完整的线粒体基因组重建了跳蚤的系统发育关系,但所包含的跳蚤种类不超过15种,因此未能反映跳蚤的整体系统发育关系。我们的系统发育分析结果支持蚤科(Pulicidae)的单系性,但拒绝了Ctenophthalmidae、Leptopsyllidae和Ceratophyllidae的单系性,这与大量之前的研究一致,但与Whiting等人使用四个基因位点的结果相矛盾。
尽管对跳蚤的分类学和生物学进行了广泛研究,跳蚤的系统发育关系仍然存在争议。线粒体基因组包含丰富的分子信息,在过去三十年中被广泛用于系统学、系统发育学、群体遗传学和多细胞生物的进化研究。研究表明,线粒体基因组是物种鉴定、系统发育分析、分子流行病学和其他跳蚤研究领域的合适分子工具。与此同时,形态特征和宿主信息仍然是跳蚤分类和鉴定的重要信息来源。
结论
在本研究中,我们获得了啮齿类跳蚤N. laeviceps的高质量线粒体基因组。我们的发现表明,细胞色素c氧化酶亚基1(cox1)基因是鉴定跳蚤的合适分子标记。系统发育分析表明,角叶蚤科(Ceratophyllidae)、栉眼蚤科(Ctenophthalmidae)和细蚤科(Leptopsyllidae)是并系的,支持蚤科(Pulicidae)的单系性。与其他研究相比,我们从线粒体基因组数据集生成的系统发育学拓扑结构有所不同。因此,需要更多的线粒体基因组数据来解决跳蚤的系统发育关系。我们的结果将丰富跳蚤的线粒体基因组数据,为跳蚤的系统发育分析奠定基础,并促进蚤目物种的进化分析。
温馨说明
1、惠通生物针对叶绿体、线粒体测序项目组装结果准确,可以提供定制化高级分析,欢迎联系我们获取小基因组文章专业解决方案,助力文章发表。
2、惠通生物小基因组服务电话:18926264030
欢迎关注物种分类及进化研究
深圳市惠通生物科技有限公司,成立于2016年,技术成员在生物信息方面均有10年以上分析经验,在小基因组项目(叶绿体、线粒体、病毒)上形成强劲技术优势并可提供定制化高级分析内容。成立至今已服务客户单位200余家包括中国科学院植物研究所、中国科学院昆明植物研究所、华南农业大学、浙江大学、中国人民解放军疾病预防控制中心、武汉水生生物研究所等科研单位。合作老师发表小基因组SCI文章逾200篇,发表在《BMC Plant Biology》、《forests》、《 Frontiers in Plant Science》、《Frontiers in Microbiology》、《molecules》、《International Journal of Biological Macromolecules》、《Plant Genome》、《International Journal of Molecular Sciences》、《Infectious Diseases of Poverty》、《Insect Science》、《genes》、《frontiers in Veterinary Science》《Frontiers in Immunology》等杂志。