摘要
白芷(Angelica dahurica)是一种具有经济价值和观赏价值的中药材,在我国分布广泛。尽管白芷具有重要的药用价值,但目前对其基因组,尤其是线粒体基因组的研究有限。为了探究线粒体基因组与叶绿体基因组之间的序列交换,本研究利用长读长测序组装了白芷完整的环状线粒体基因组。白芷的线粒体基因组总长为228,315 bp,GC含量为45.06%。共编码56个基因,包括34个蛋白质编码基因、19个tRNA基因和3个rRNA基因。此外,根据序列相似性,本研究发现叶绿体基因组和线粒体基因组之间有9个同源大片段。本研究首次报了道白芷线粒体基因组,可为质体基因组之间的基因交流提供启示,同时也为伞形科药用植物的基因组提供参考。
背景
时间:2024:杂志: Frontiers in Plant Science
影响因子:5.6 分区:1/2区
材料和方法
利用天根公司总RNA提取试剂盒(货号:DP419)对白芷的总RNA进行提取。在构建lncRNA文库的过程中,转录酶与随机六聚体引物相结合。利用AMPure XP系统对cDNA进行末端修复、接头连接和精确大小选择。随后在Illumina Novaseq 6000平台上进行测序。
2、线粒体基因组组装和注释:Flye软件对白芷的长读长数据进行从头组装, 生成了Genome Fragment Assembly (GFA) 格式的图形输出。组装结果包括核基因组、叶绿体基因组和线粒体基因组的序列。利用makeblastdb工具构建后续分析所需的contig库。利用了BLASTn算法,以拟南芥线粒体基因组(NC_037304)为参考基因组,识别包含线粒体的contig,这一过程有助于选择性地提取线粒体相关的等位基因。随后利用GetOrganelle工具获取线粒体基因组的特异性短读数,SPAdes软件构建线粒体基因组的图谱。为了整合并证实以上结果,本研究使用结合BWA工具的Unicycler软件,将基因组图谱衍生的contig与长读长组装获得的线粒体等位基因进行比对。这一过程通过合并长短读长数据重建白芷线粒体基因组,最终成功获得白芷的完整线粒体基因组。最后利用Bandage软件完成白芷线粒体基因组的可视化。
参考拟南芥线粒体基因组(NC_037304.1),使用Geseq软件对线粒体基因组进行注释,tRNAscan-SE软件对tRNA基因注释,BLASTn工具对rRNA基因进行注释。Apollo软件对每个线粒体基因注释中的不准确之处进行了更正。
4、MTPTs鉴定和共线性分析:通过GetOrganelle工具包对叶绿体基因组进行组装,随后应用CPGAVAS2软件增强注释。利用BLASTn对同源序列进行了分析,并利用Circos进行可视化。利用BLASTn对线粒体基因组进行比较分析,同时,识别了保守的共轭片段,这些片段的可视化通过Multiple Synteny Plot工具完成。
6、重复序列介导的基因组重排验证:从untig图中提取了双分叉结构附近的序列。每个结构都有四种独特的序列模式,它们共享相同的中心重复序列,但相邻序列各不相同。这种变化暗示了重复序列驱动的重组。为了进行不同的构象分析,本研究使用Bandage提取了fasta文件,并用minimap2与ONT测序数据进行比对。通过PCR和Sanger测序验证支持的长读数序列。
主要研究结果
图1白芷线粒体基因组图谱
2、密码子偏好性和重复序列分析:密码子偏好是指在某些生物的DNA或RNA序列中,特定密码子比其他密码子更容易被利用的现象,通常表示一种可影响基因表达和蛋白质组装的倾向。本研究对白芷线粒体基因组中34个线粒体蛋白质编码基因(PCGs),RSCU值大于1的密码子被认为是氨基酸偏爱的密码子。除了起始密码子AUG和色氨酸密码子(UGG)的RSCU值都精确为1之外,线粒体PCGs中密码子使用偏好的显著模式也很明显(图2)此外,对白芷和10个近缘物种之间进行了密码子偏好性分析结果显示,精氨酸、亮氨酸和丝氨酸的使用频率相似,且使用频率更高。
图2白芷线粒体基因组相对同义密码子使用情况。
简单序列重复序列(SSR)通常被称为微卫星,是基因组中按顺序复制的简短但重要的DNA片段。由于这些SSR在不同个体间具有明显的变异性,因此在遗传研究中被广泛用作生物标记。在白芷线粒体基因组中,这些SSR以串联重复为特征,每个重复由1-6个核苷酸组成。线粒体基因组1号染色体上有8个该种SSR重复。白芷线粒体基因组还包含10个不同的重复序列,每个重复序列的长度超过30个碱基对(bp)。这组序列包括4对正向重复序列和6对回文重复序列,从而凸显了基因组结构中重复元件的丰富复杂性(图3)。
图3白芷线粒体基因组的重复序列分析。
最内圈的彩色线段连接两个分散重复序列,黄色线段代表回文重复序列,紫色线段代表正向重复序列。第二个圆圈上的黑色线段代表串联重复序列,最外圈的黑色线段代表微卫星重复序列。
3、重复序列介导的基因重组:对植物线粒体基因组而言,同源重组涉及相似或相同DNA序列之间遗传物质的交换,这种交换显著增强了基因组的多样性和进化动态。这种机制在保持不同植物物种线粒体DNA结构和功能的完整性方面起着关键作用。在利用长读长测序技术组装白芷线粒体基因组的过程中,发现了两个不同的重复序列:R1(ctg13)和R2(ctg14),长度分别为4,733 bp和1,119 bp。这些序列为正向重复序列,具有特定的作用:如图4所示,R1(ctg13)与ctg12和ctg2结合形成1号和2号染色体,而R2(ctg14)与ctg11和ctg7结合产生3号和4号染色体。此外,这些重复序列帮助1号和2号染色体以及3号和4号染色体形成环状染色体分子。
为了证实这些重复序列在协调同源重组中的作用,本研究采用PCR扩增和Sanger测序。证实了白芷线粒体基因组内存在复杂的同源重组机制的假设。因此,推测这些重复序列促进了染色体重组,最终形成了12种独特的环状染色体构象。
(A)白芷线粒体基因组图谱和重复序列。(B)从主要构象到次要构象的发展过程。(C)多对引物扩增的PCR产物的凝胶电泳结果。
4、MTPTs鉴定:利用BLASTn对线粒体基因组和质体基因组(登录号PP049083)进行比较基因组学分析,发现了9条同源序列,总长度达1,732 bp(图5)。其中最长的序列被命名为MTPT9,长度为382 bp。在这些同源片段中,已鉴定出9个完整基因,包括1个蛋白质编码基因和5个tRNA基因。MTPT3和MTPT6与叶绿体基因组反向重复片段中的同源区域一致,导致这些序列在叶绿体中重复。本研究推测,这些位点是序列迁移的关键热点,表明它们在基因组结构动态中发挥着重要作用。
图5线粒体基因组与叶绿体基因组水平序列迁移。
5、系统发育和同源关系分析:为了阐明白芷线粒体基因组的进化,本研究进行了系统进化分析。以茄目(Solanales)的两个线粒体基因组用作外群,根据来自29个不同物种的24个保守线粒体蛋白编码基因(PCGs)的DNA序列构建了一棵系统发育树。白芷被归为伞形科(Apiaceae)科,与防风(Saposhnikovia divaricata)的进化关系更近(图6)。
基因组同源性分析在白芷线粒体基因组中发现显著的同源和共线区块,它们通过复杂的带状结构相互连接。这些共线区块在不同植物纲中经历的广泛重排,说明了线粒体基因组的显著变异性(图7)。同源性分析发现了10个长度超过5000 bp的片段,这些长片段与防风(S. divaricata)具有很高的同源性,该结果加强了它们之间密切的系统发育关系。然而,尽管存在这些相似性,白芷的基因组结构与其进化关系较近的同类相比明显缺乏保守性,从而突出了其独特的结构特性。
图7白芷线粒体基因组的同源性
6、RNA编辑事件:利用Deepred-mt工具分析了白芷线粒体基因组34个蛋白编码基因(PCGs)中的RNA编辑现象,如图 8所示。在PCGs中总共发现了615个预测的RNA编辑位点。nad4基因出现潜在RNA编辑位点的频率最高,共有48个RNA编辑位点,超过了所有其他线粒体基因。
图8白芷线粒体基因组RNA编辑位点
为了进一步证实RNA编辑事件的发生,本研究选择cox1、atp6和atp9基因,通过PCR扩增和随后的Sanger测序进行验证。结果证实在特定位点存在RNA编辑,包括cox1-2、atp6-718和rps9-223。其中,cox1基因的RNA编辑效率较高(图9)。
图9 RNA编辑位点验证
总结
本研究成功获得了白芷的完整线粒体基因组,其基因组结构为环状,由12条染色体组成。本研究对其基因含量、重复元件、密码子使用、MTPTs、RNA 编辑位点进行了全面分析,并进行了系统发育推断。白芷线粒体基因组共包含34个PCGs、19个tRNA 基因和3个rRNA基因,同时还发现了叶绿体基因组和线粒体基因组共有的9个同源大片段。本研究是首次对白芷完整线粒体基因组进行广泛表征。该研究为了解植物线粒体基因组错综复杂的结构和动态提供了宝贵的见解,可为白芷以及其他植物物种未来的分子育种工作提供参考。此外,本研究结果还揭示了线粒体基因进化动态中以前未曾探索的方面,有助于更好地了解这些基因组的进化历史。
温馨说明
1、惠通生物针对叶绿体、线粒体测序项目组装结果准确,可以提供定制化高级分析,欢迎联系我们获取小基因组文章专业解决方案,助力文章发表。
2、惠通生物小基因组服务电话:18926264030
欢迎关注物种分类及进化研究
深圳市惠通生物科技有限公司,成立于2016年,技术成员在生物信息方面均有10年以上分析经验,在小基因组项目(叶绿体、线粒体、病毒)上形成强劲技术优势并可提供定制化高级分析内容。成立至今已服务客户单位200余家包括中国科学院植物研究所、中国科学院昆明植物研究所、华南农业大学、浙江大学、中国人民解放军疾病预防控制中心、武汉水生生物研究所等科研单位。合作老师发表小基因组SCI文章逾200篇,发表在《BMC Plant Biology》、《forests》、《 Frontiers in Plant Science》、《Frontiers in Microbiology》、《molecules》、《International Journal of Biological Macromolecules》、《Plant Genome》、《International Journal of Molecular Sciences》、《Infectious Diseases of Poverty》、《Insect Science》、《genes》、《frontiers in Veterinary Science》《Frontiers in Immunology》等杂志。