白纹伊蚊基因组及其进化

文摘   科学   2022-05-24 07:06   英国  


白纹伊蚊又称亚洲虎蚊,起源于亚太地区,在过去的40余年的时间里,其迅速扩散至全球除南极洲以外的所有大陆。其对气候有很强的适应性,并且是至少26种虫媒病毒的媒介载体,包括基孔肯雅热病毒、登革热病毒、Zika等。一些媒介病毒,比如基孔肯雅热病毒,通过突变,增强了其通过白纹伊蚊的传播能力,使得白纹伊蚊成为基孔肯雅热爆发的主要传播媒介。

但是对伊蚊基因组(包括白纹伊蚊和埃及伊蚊)的组装十分困难,主要是因为其基因组很大,其中遍布重复序列。其中,针对埃及伊蚊,通过PacBio长度长,并结合10X 和Hi-C测序,科研人员已经能够组装到1.3Gb大小的基因组。对于白纹伊蚊,虽然通过流式细胞仪估计其基因组大小也应该在1.19-1.28Gb之间,但是有些研究对白纹伊蚊基因组的组装已经达到了2.54Gb,已经快接近人类基因组大小了。还有一些组装显示白纹伊蚊基因组大小为1.45Gb.

白纹伊蚊基因组概况

本研究样本来自广东省疾病预防控制中心实验室佛山系白纹伊蚊,始于1981年。DNA提取于单个白纹伊蚊蛹,然后进行了DNA扩增,短插入和长插入(170bp - 20kb)配对测序,最后得到了689Gb的测序数据,组装为了1.97Gb大小的基因组。

白纹伊蚊基因组是目前已组装蚊类最大的基因组。按蚊Anohpeles darlingi的基因组大小为174Mb,致倦库蚊Cules quinquefasciatus的基因组大小为540Mb,埃及伊蚊大小为1.3Gb. 不同地区的白纹伊蚊其基因组大小也有一定差异,可能主要是由于重复序列含量不同造成的。

本研究组装的基因组中,共预测了17539个蛋白编码基因。此外,通过RNA-seq,本研究还发现了57个白纹伊蚊特有的miRNA。

基于2096个单拷贝同源直系基因建立的进化关系来看,白纹伊蚊和其近亲埃及伊蚊分化于7100万年前【也即在恐龙快要灭亡的时候】,早于之前预测的6000万年。其和果蝇分化的时间为2.6亿年前【二叠纪末期,恐龙时代即将开始的时候】。下图(A)

【A: 物种进化关系,白纹伊蚊和埃及伊蚊分化于7100万年前;和致倦库蚊分化于1.8亿年前;和按蚊分化于2.17亿年;和果蝇分化于2.6亿年。B:各个物种参考基因组中转座子的占比:green, Gypsy; blue, Pao, light blue, Copia, red, RTE-BovB; orange, LOA; purple, R1; white, other。C:白纹伊蚊基因组中转座子拷贝数随时间的变化(增加)。D:白纹伊蚊、埃及伊蚊、致倦库蚊、冈比亚按蚊、darlingi按蚊和黑腹果蝇基因组中各种转座子大小和占比。】

在2096个建树基因中,有11%(239个)在白纹伊蚊中显示出正向选择迹象。

白纹伊蚊基因组中的重复序列

白纹伊蚊基因组中有68%的序列是重复序列,是所有已知蚊种中最多的。其中LINE转座子是最多重复序列。在LINE转座子家族中,RTE-Bov累积达308Mb,占整个基因组的15.7%;Duo转座子在白纹伊蚊基因组中占4.1%,其同源序列在埃及伊蚊中占3.17%,二者很相似,提示该转座子可能存在于白纹伊蚊和埃及伊蚊的共同祖先中。不过,白纹伊蚊基因组中有超过20%的重复序列在埃及伊蚊中没有同源序列,这说明,大量DNA重复序列是白纹伊蚊和埃及伊蚊分化后,在白纹伊蚊中快速形成,进而也导致了二者基因组大小的巨大差异。进一步分析显示,这些转座子的多发生于最近1000万年(上图C),而此时埃及伊蚊中并没有明显的大量转座子活动。这进一步说明了LTR和LINE等转座子近期活动造成了白纹伊蚊基因组大小的变异

除了转座子的插入,还有转座删除,通过比较白纹伊蚊、埃及伊蚊和致倦库蚊non-LTR转座子活性,发现转座删除比转座插入更加常见【缓缓画一个问号。。。转座子导致的插入应该比其导致的删除更加常见;对于普通的INDEL,删除确实比插入更常见】。白纹伊蚊DNA删除率要比埃及伊蚊和致倦库蚊低,这也可能是其基因组逐步增大的原因。

基因组中的黄病毒整合

黄病毒flavivirus是正链RNA病毒,包括西尼罗河病毒、登革热病毒、黄热病毒和Zika病毒等。其基因组长度10Kb-11Kb,其在宿主细胞质中进行RNA复制,翻译,组装等,不需要逆转录过程,也称为非逆转录RNA病毒。在白纹伊蚊和埃及伊蚊基因组中检测到了黄病毒序列,特别是在白纹伊蚊基因组中, 病毒整合的序列长度也更长,包括类似登革热病毒的序列。这些整合序列多发生在宿主基因组含有较多LTR转座子的区域,特别是Ty1-copiaTy2-gypsy。而在整合位点附件没有发现重复倒置序列,这说明这些黄病毒序列的整合并不是通过经典的转座插入方式实现的,而是由既有转座子的异位重组造成的。

之前的研究也有在白纹伊蚊基因组中发现黄病毒序列的整合,但是数量要远比本研究的数量少。可能是研究方法不同导致的,也有可能是因为本研究样本为原始株,世界其他地区的样本为扩散株,由于建立者效应和群体瓶颈效应,导致很多整合序列在群体扩散过程中丢失。黄病毒整合序列数量的差异可能也是导致各地区白纹伊蚊基因组大小差异的一个原因。同时,黄病毒在白纹伊蚊基因组的整合可能也是一个正在进行的过程。比如在意大利北部的白纹伊蚊基因组中独立形成的黄病毒序列,并且有完整的开放阅读框架。这些整合序列对蚊子感染和传播病毒有何影响,还有待进一步研究。

重点基因

1. 滞育相关基因

对滞育和非滞育个体转录组的比较发现,有至少140个基因在昆虫发育的至少一个阶段存在表达差异,其中96个涉及到压力应激、脂代谢、基因表达调控等过程。

2. 解毒代谢相关基因

  • CYP:本研究组装的白纹伊蚊基因组中,有186个完整长度的细胞色素氧化酶P450基因(CYP),相应基因在埃及伊蚊中有168个,冈比亚按蚊中有104个,致倦库蚊中有196个,果蝇中有87个。白纹伊蚊基因组中还有24个CYP假基因。CYP9J家族主要负责拟除虫菊酯类杀虫剂代谢,其在埃及伊蚊中的所有基因在白纹伊蚊基因组中均能找到。

  • CCE:羧基胆碱酯酶(CCE)是另一类重要的代谢酶。本研究在白纹伊蚊基因组中发现了64个相关基因,数量和埃及伊蚊及致倦库蚊相似。其中CCEae3A为代谢双硫磷杀虫剂的关键基因,其在本研究白纹伊蚊基因组中存在两个串联重复基因拷贝。此外,本研究基因组中有3个乙酰胆碱酯酶相关基因,很多其他昆虫只有一个或两个,这可能也暗示白纹伊蚊对乙酰胆碱具有更高的代谢效率。

  • GST:本研究白纹伊蚊基因组有32个谷胱甘肽S转移酶相关基因。该数量比埃及伊蚊和冈比亚按蚊多,但是比黑腹果蝇和致倦库蚊少。

【不同物种外源化合物和抗性基因在基因组中的数量】

3. 气味受体相关基因

本研究注释发现了86个气味结合蛋白(OBP)和158个气味受体(OR)基因。蚊子的气味结合蛋白和气味受体基因普遍比果蝇的多。而白纹伊蚊和埃及伊蚊的要比冈比亚按蚊和致倦库蚊的多。如下

3. 性别偏向基因表达

246个雌性特异性表达基因,268个雄性特异性表达基因。

4. 性别决定基因:(略)

5. 免疫相关基因

本研究在白纹伊蚊中发现554个免疫相关基因,对应在埃及伊蚊中有476个,冈比亚按蚊中有536个,致倦库蚊中有400个,黑腹果蝇中有345个。

总结

白纹伊蚊有迄今为止报道的蚊类最大的基因组,其中含有大量的重复序列,基因的扩增以及黄病毒序列的整合。这么大的基因组为白纹伊蚊的全球扩张和侵入提供了很好的遗传条件。大量的重复序列提供了遗传变异的底物,以此扩大了自然选择的空间,促进白纹伊蚊适应各种不同的外界环境




资料来源:Chen, X. G., Jiang, X., Gu, J., Xu, M., Wu, Y., Deng, Y., ... & James, A. A. (2015). Genome sequence of the Asian Tiger mosquito, Aedes albopictus, reveals insights into its biology, genetics, and evolution. Proceedings of the National Academy of Sciences, 112(44), E5907-E5915.

参考资料:Boyle, J. H., Rastas, P., Huang, X., Garner, A. G., Vythilingam, I., & Armbruster, P. A. (2021). A linkage-based genome assembly for the mosquito Aedes albopictus and identification of chromosomal regions affecting diapause. Insects, 12(2), 167.

https://en.wikipedia.org/wiki/Flavivirus



AI写代码的DNA
我的群体进化遗传学 学习笔记~~~ 学习|交流|进步