背景导读
水平基因转移(HGT) 可以广义地定义为通过正常繁殖 (例如配子融合)以外的其它方式在物种之间移动遗传物质。该过程已在原核生物和真核生物内部和之间进行了推断,现在被认为可能在适应中发挥作用,如最近来自植物的示例所示,概念有时扩展到包括细胞区室之间的转移(例如叶绿体到线粒体),我们在这里将HGT称为生物体之间的遗传物质交换,并认为它与细胞内转移不同。促进植物之间HGT的机制包括通过例如伤口/嫁接、寄生吸器、附生相互作用和非法授粉的直接接触。此外,还提出了间接途径,例如通过土壤、细菌、病毒或内生真菌。在植物中检测到HGT的早期病例主要在它们的线粒体基因组(mitogenomes),可能部分是由于与核基因组相比,细胞器序列可用性更高。与广泛测序的叶绿体基因组(plastome)相比,细胞机制如活性DNA摄取细胞器融合和裂变已被引用来解释为什么HGT在线粒体基因组中更普遍。尽管来自核基因组的HGT实例正在积累,但线粒体基因组实例仍然是植物中HGT证据的很大一部分。寄生植物与其宿主之间的紧密联系有利于遗传物质的交换,从而可能导致植物之间的水平基因转移(HGT)。随着最近几个寄生植物核基因组的发表,人们对这种非性别的基因交换有了相当大的关注。为了研究广泛分布的菟丝子属(Cuscuta) 中的HGT事件的图片,我们组装并分析了两个最近测序的物种南方菟丝子(C. australis)和中国菟丝子(C. campestris)的细胞器基因组,使其成为用于解释该属的第一个完整的线粒体基因组(mitogenomes)。
原名:Mitochondrial genomes of two parasitic Cuscutaspecies lack clear evidence of horizontal gene transfer and retain unusually fragmented ccmFC genes
杂志:BMC Genomics. IF= 4.547 发表时间:2021
研究方法
1、从Genbank下载Cuscuta australis和C. campestris全基因组数据,其中:Cuscuta australis:二代数据(SRA accession SRR5851367; 155M reads)+三代数据(SRA accessions SRR5851361–6; 711 k reads)+转录组数据(SRR6664647–54; 411M reads);C. campestris:二代数据(SRA accessions ERR1917169–71; 9.5M reads)+三代数据(SRA accessions ERR1910865–7; 490 k reads)。Ipomoea nil:转录组数据(ERR2040616、SRR1772255、DRR024544–9)。
2、细胞器基因组组装与注释
二代和三代数据用于组装细胞器基因组,使用BLASTN v. 2.6.0默认参数,搜索contigs,BBMap进一步比对和组装。二代数据采用Unicycler v.0.4.8和SPAdes v. 3.14.0软件来组装,三代数据用Canu v. 1.8默认参数来组装。在通过人工校正,获得完整的叶绿体和线粒体基因组。通过构建参考叶绿体(14个来自13个属和13个科)和参考线粒体(172个来自130个属和62个科)核苷酸和蛋白序列数据库,采用BLAST来注释叶绿体和线粒体基因组。对于线粒体基因组,使用参考文献建立蛋白质比对,HMMER v. 3.3寻找ORFs(ORFfinder v. 0.4.3),MFAannot v.1.35手动调整和选择内含子边界。使用tRNAscan-SE 2.0查找tRNAs。为了研究线粒体ccmFC基因的转录和剪接,使用BBMap对mRNA进行了比对。我们还将番薯转录组序列与来自其线粒体基因组的类似ccmFC DNA序列进行了比对,以与菟丝子进行比较。为了评估nad1最后部分的基因结构,通过Mauve v. snapshot_2015-02-13比较了番薯和两个菟丝子的对应序列。
4、潜在细胞内转移
为了检测从叶绿体到线粒体基因组的转移的情况,使用BLASTN和默认参数对照参照叶绿体组。还对线粒体ORF进行了检索,以参考叶绿体建立的HMMER数据库,以检测是否存在叶绿体基因的完整部分,并体现比对上的信息。为了确定核基因组中是否存在缺失的线粒体基因,以及在线粒体基因组和核基因组之间是否存在其他转移,针对两个已发表的核基因组(C. australis: GCA_003260385.1, C. campestris: PRJEB19879)构建BLAST检索。
5、基因的水平转移
使用系统发育方法研究了HGT,其中为菟丝子中存在的每个线粒体基因构建了系统发育树,并检查菟丝子序列是否支持与其近亲(特别是番薯)或更远亲缘植物聚类分组。使用参考线粒体基因组和菟丝子属线粒体基因组,提取了所有CDS蛋白序列和核苷酸序列,以及核糖体RNA序列。使用GENECONV v. 1.81评估了转移的证据。
研究结果
1、细胞器基因组
叶绿体组装成具有典型四分结构的单环分子,其中两个反向重复将小的和大的单拷贝区域分开。C. australis和C. campestris叶绿体长度分别为85263bp和86749bp,GC含量分别为37.8%和37.7%,除了反向重复序列(14,070bp在C. australis和14,348 bp 在C. campestris),没有长度超过50bp且同相似性>90%的重复序列。串联重复约占C. australis和C. campestris分别为0.2%和0.4%。与菟丝子属其它种如菟丝子C. gronovii和C. obtusiflora的叶绿体相似,叶绿体缺失ndg、infA、matK、psaI、rpo、rpl23、rpl32和rps16基因,缺失tRNAs包括trnA-UGC、trnG-UCC、trnI-GAU、trnK-UUU、trnR-ACG和trnV-UAC。C. australis和C. campestris线粒体基因组组装大小为265,696和275,898 bp, GC 含量为44.0% 和44.3%。散在重复序列约占21.8%和34.1%,而串联重复分别约占5.0%和2.5%。除了一些末端contigs和一些位点上代表可替代构象,数据深度和组装大小基本一致,C. australis和C. campestris的重复评估的重组率为10-48%(average = 29%, n =6)和33-47% (average =37%, n =12)。对于每个线粒体基因组,我们注释了31个蛋白质编码基因,3个核糖体RNA基因和19个tRNA(一些有多个拷贝)。与 C. australis 相比,C. campestris 有一个额外的 trnQ-UUG(在可能转移的区域内),但缺少 trnT-UGU。两个基因组的常见缺失或假基因包括 sdh3、sdh4、rpl2和rpl10,以及六个rps基因(rps2、7、10、11、14、19)。一些已经存在的基因的额外片段可能被打断,包括两个物种的atp和cox1,以及C. campestris的atp6、rps12和rps3。
图1南方菟丝子(Cuscuta australis)和中国菟丝子(C. campestris)线粒体基因组的线性图谱
表1南方菟丝子(Cuscuta australis)和中国菟丝子(C. campestris)及其近亲 Ipomoea nil 的线粒体基因组特征(NC_031158)
ccmFC 基因在两个物种中都存在注释问题(在C. gronovii和Ipomoea nil中注释为假基因)并且可能无法正确转录,因为缺少反式剪接的第一个外显子的一部分。基于与其他被子植物如桔梗 (NC_035958))比较,ccmFC基因在两个菟丝子属线粒体基因组中分布在三个位置(图2)。比对mRNA数据发现ccmFC基因的覆盖率低,但为外显子1和外显子2的3' 端的成功反式剪接提供了一些支持(图 2)。然而,没有迹象表明 mRNA 产物包含外显子1的两个部分,因此不清楚外显子1的大部分是否真的被翻译成功能产物。此外,在两种菟丝子线粒体基因组中发现nad1的基因结构比较特殊,即外显子4、matR 和外显子5。在两个菟丝子属线粒体中,外显子5位于相反链上的相反方向,而外显子4位于与matR相同的链上。这可能表明nad1i728 已转变为反式剪接(如在其他一些被子植物中所见,例如烟草, NC_006581.1)。
图2与被子植物中的典型结构相比,南方菟丝子及其近亲Ipomoea nil中的ccmFC基因结构示意图
2、潜在的胞内转移
我们比较了南方菟丝子和中国菟丝子的线粒体和叶绿体基因组,发现有8个区域有比对上,C. australis和C. campestris(表2)分别比对上大约0.6%和1.1%。比对上的2和7区域的系统发育树表明,与细胞内转移一致。这两个物种共有两个区域,比对上的4和5对应于叶绿体基因ndhB和psbB。两种菟丝子在其叶绿体基因组中缺乏完整的ndhB的拷贝(对应4)和比其它菟丝子叶绿体序列更接近金虎尾目的psbB,表明可能存在潜在的HGT。在两种菟丝子物种中,psbB和ndhB对应区域彼此相距不到2 kb,可能表明更大的转移区域。检索两种菟丝子物种的核基因组,产生了明显不同的结果。在C. australis中,约有~ 260 Mbp的序列比对上线粒体基因组(约占27%),但在C. campestris中,~ 477 Mbp的序列比对上线粒体基因(约占99.8%)。这些结果可能初步表明线粒体序列大规模整合到核基因组中,但也可能是因为人手动组装的原因,本身线粒体污染很难识别。
表2南方菟丝子(Cuscuta australis)和中国菟丝子(C. campestris)线粒体与参考叶绿体比对结果
在两个核基因组中鉴定到了缺失线粒体基因(如rps2、rps10、rps11、rps14、rps19、sdh3和dh4)的潜在拷贝(表3)。除了sdh3没有确定的起始密码子外,所有基因都有完整的开放阅读框。对来自参考线粒体基因组和由NCBI比对得到基因的系统发育分析表明,某些情况下,核拷贝(rps2、rps11、rps14、sdh3)存在垂直遗传,但也有三种基因(rps10、rps19、sdh4)可能代表HGT。
表3南方菟丝子(Cuscuta australis)和中国菟丝子(C. campestris)缺失线粒体基因在核基因组上的拷贝
3、基因的水平转移
对所有线粒体基因串联的系统发育分析发现,菟丝子属归属于茄目(图3)。基于种子植物构建个体基因树,大多数基因(26/34,76%)结果进化树将三种菟丝子属物种分组在一起,并与它们的近亲自养型亲缘植物番薯为姐妹群,这是一种垂直遗传模式。这种模式的例外是atp 9(与番薯属有71%的亲缘)、ccmB(不支持)、cox 2(66%)、nad 3(不支持)、nad 4L(与番薯属没有亲缘关系,但与番薯属在茄目中有80%的亲缘关系)、rpl 16(68%)、rps 12(不支持)和rrn 5(未解析)。在不支持与番薯属亲缘关系的情况下,也强烈不支持在其他地方分组,如HGT所预期的那样。在某些基因(如cox2 exon 1, nad4 exon 3和nad5 exon 5)的一些部分,会发现与其他目相比,与茄目具有更高同一致性的blast比对结果,这表明它可能经历了基因转换,没有明显的迹象表明菟丝子的序列是嵌合的。
图3基于菟丝子中所有已知线粒体基因以及具有完全线粒体基因组的代表性被子植物目串联的最大似然进化树
结论
温馨说明
1、惠通生物针对叶绿体、线粒体测序项目组装结果准确,可以提供定制化高级分析,欢迎联系我们获取小基因组文章专业解决方案,助力文章发表。
2、惠通生物小基因组服务电话:18926264030
欢迎关注物种分类及进化研究
深圳市惠通生物科技有限公司,成立于2016年,技术成员在生物信息方面均有五年以上分析经验,在小基因组项目(叶绿体、线粒体、病毒)上形成强劲技术优势并可提供定制化高级分析内容。成立至今已服务客户单位200余家包括中国科学院植物研究所、中国科学院昆明植物研究所、华南农业大学、浙江大学、中国人民解放军疾病预防控制中心、武汉水生生物研究所等科研单位。合作老师发表小基因组SCI文章逾200篇,发表在《forests》、《 Frontiers in Plant Science》、《Frontiers in Microbiology》、《molecules》、《International Journal of Biological Macromolecules》、《Plant Genome》、《International Journal of Molecular Sciences》、《Infectious Diseases of Poverty》、《peerJ》、《genes》、《frontiers in Veterinary Science》《Frontiers in Immunology》等杂志。