IF 5.6|中药白芷的完整线粒体基因组及其在伞形科复杂线粒体基因组结构进化分析中的意义

文摘   2024-05-17 09:00   广东  

摘要

白芷(Angelica dahurica)是一种具有经济价值和观赏价值的中药材,在我国分布广泛。尽管白芷具有重要的药用价值,但目前对其基因组,尤其是线粒体基因组的研究有限。为了探究线粒体基因组与叶绿体基因组之间的序列交换,本研究利用长读长测序组装了白芷完整的环状线粒体基因组。白芷的线粒体基因组总长为228,315 bp,GC含量为45.06%。共编码56个基因,包括34个蛋白质编码基因、19个tRNA基因和3个rRNA基因。此外,根据序列相似性,本研究发现叶绿体基因组和线粒体基因组之间有9个同源大片段。本研究首次报了道白芷线粒体基因组,可为质体基因组之间的基因交流提供启示,同时也为伞形科药用植物的基因组提供参考。

背景

白芷(Angelica dahurica)在中国通常被称为湘白芷,是伞形花科多年生草本植物。它的干根被广泛用于临床。历史文献中白芷首次出现在《神农本草经》中,证明其在中国的使用已有千年之久。值得注意的是,白芷是一种著名的香料,在保健产品、烹饪艺术、皮肤科产品等多个领域都有应用。当代药理学研究表明,白芷根具有多种治疗特性,包括抗炎、镇痛、解痉、抗菌、抗氧化、抗肿瘤、神经保护和美白皮肤等功效。
白芷在中国各个地区广泛种植。根据地理分布,该物种可分为多个栽培品种:川白、豫白芷和波白芷。近来,对白芷的需求显著增加,导致其人工栽培面积扩大。各地纷纷进行引种和栽培,并形成了较大的规模。然而,不同地区的盲目引进导致了白芷种质混杂,掩盖了基原植物的起源,对药材的产量和质量产生了不利影响。对细胞器基因组的研究有助于开发分子标记,提高物种鉴定的准确性。   
线粒体结构的异质性给线粒体基因组的组装带来了巨大障碍。虽然大多数记录在案的植物线粒体都是环状的,但也有一些线粒体是分枝结构。线粒体基因组的大小差异很大,通常从200 kb到11 Mb不等。低温电子显微镜下的观察显示,虽然植物线粒体基因组通常呈现环状结构,但实际,线粒体基因组包含大量重复序列,导致出现多种排列方式,其真实结构是复杂和动态的,包括线性、分枝和环形。这些线粒体基因组序列重排在调控基因表达和线粒体功能方面起着至关重要的作用,凸显了了解线粒体基因组结构在植物生物学和育种策略中的重要性。
植物线粒体基因组的一个重要特征是RNA编辑,这是一种广泛的转录后修饰,会造成测序结果与原始模板序列之间的差异。线粒体基因组中胸苷对胞苷的基因组水平替代会导致RNA编辑位点的明显减少。基因表达动态和逆加工机制可能会显著影响RNA编辑和进化轨迹,从而在植物细胞器基因组的功能功效和适应能力方面发挥不可或缺的作用。
白芷的完整线粒体基因组及其在伞形科复杂线粒体基因组结构进化分析中的意义
Complete mitochondrial genome of Angelica dahurica and its implications on evolutionary analysis of complex mitochondrial genome architecture in Apiaceae

时间:2024:杂志:

Frontiers in Plant Science

影响因子:5.6 分区:1/2区

材料和方法

1、DNA和RNA测序:在中国四川遂宁采集新鲜的白芷叶片样本。利用十六烷基三甲基溴化铵(CTAB)法提取基因组总DNA。构建插入大小为300 bp的DNA文库,进行二代测序。也采用Oxford测序技术,按照SQK-LSK109基因组测序试剂盒步骤对样本进行测序。

利用天根公司总RNA提取试剂盒(货号:DP419)对白芷的总RNA进行提取。在构建lncRNA文库的过程中,转录酶与随机六聚体引物相结合。利用AMPure XP系统对cDNA进行末端修复、接头连接和精确大小选择。随后在Illumina Novaseq 6000平台上进行测序。

2、线粒体基因组组装和注释:Flye软件对白芷的长读长数据进行从头组装, 生成了Genome Fragment Assembly (GFA) 格式的图形输出。组装结果包括核基因组、叶绿体基因组和线粒体基因组的序列。利用makeblastdb工具构建后续分析所需的contig库。利用了BLASTn算法,以拟南芥线粒体基因组(NC_037304)为参考基因组,识别包含线粒体的contig,这一过程有助于选择性地提取线粒体相关的等位基因。随后利用GetOrganelle工具获取线粒体基因组的特异性短读数,SPAdes软件构建线粒体基因组的图谱。为了整合并证实以上结果,本研究使用结合BWA工具的Unicycler软件,将基因组图谱衍生的contig与长读长组装获得的线粒体等位基因进行比对。这一过程通过合并长短读长数据重建白芷线粒体基因组,最终成功获得白芷的完整线粒体基因组。最后利用Bandage软件完成白芷线粒体基因组的可视化。   

参考拟南芥线粒体基因组(NC_037304.1),使用Geseq软件对线粒体基因组进行注释,tRNAscan-SE软件对tRNA基因注释,BLASTn工具对rRNA基因进行注释。Apollo软件对每个线粒体基因注释中的不准确之处进行了更正。

3、密码子使用偏好性和重复序列分析:不同生物之间不同的密码子使用率被推测为是通过长期选择过程建立的进化平衡的结果。利用PhyloSuite软件从线粒体基因组中提取蛋白质编码序列,对相对同义密码子使用率(RSCU)进行分析。利用MEGA软件计算RSCU值。
为了鉴定线粒体基因组内的SSR序列、串联重复序列和分散重复序列,分别使用MISA、TRF和REPuter进行分析预测。使用Microsoft Excel和Circos软件进行可视化。

4、MTPTs鉴定和共线性分析:通过GetOrganelle工具包对叶绿体基因组进行组装,随后应用CPGAVAS2软件增强注释。利用BLASTn对同源序列进行了分析,并利用Circos进行可视化。利用BLASTn对线粒体基因组进行比较分析,同时,识别了保守的共轭片段,这些片段的可视化通过Multiple Synteny Plot工具完成。   

5、系统发育分析和RNA编辑位点鉴定:根据分类学关系,本研究选择了近缘物种的线粒体基因组进行进一步研究。从蛋白编码基因(PCG)开始,将跨度为100 bp的相邻区域作为参考序列。利用HISAT2将特定链的RNA-seq数据与这些序列进行了比对。随后,利用REDItools精确鉴定RNA编辑位点。
提取了这10个物种的线粒体基因组中共有的16个蛋白编码基因(PCGs)的 DNA序列。使用MAFFT工具进行比对,并根据比对结果用Phylosuite以最大似然法(ML)构建了系统发生树。最后,对生成的最大似然树进行了可视化。

6、重复序列介导的基因组重排验证:从untig图中提取了双分叉结构附近的序列。每个结构都有四种独特的序列模式,它们共享相同的中心重复序列,但相邻序列各不相同。这种变化暗示了重复序列驱动的重组。为了进行不同的构象分析,本研究使用Bandage提取了fasta文件,并用minimap2与ONT测序数据进行比对。通过PCR和Sanger测序验证支持的长读数序列。

主要研究结果

1、白芷线粒体基因组特征:白芷线粒体基因组结构呈分支状,总长度为228,315 bp,GC含量为45.06%。通过对ONT数据的长读长数据分析来评估重复区域,本研究成功地组装12个环状contigs(图1)。共注释有34个独特的蛋白质编码基因,包括24个核心基因和10个非核心基因,以及23个tRNA基因和3个rRNA基因。   

图1白芷线粒体基因组图谱

2、密码子偏好性和重复序列分析:密码子偏好是指在某些生物的DNA或RNA序列中,特定密码子比其他密码子更容易被利用的现象,通常表示一种可影响基因表达和蛋白质组装的倾向。本研究对白芷线粒体基因组中34个线粒体蛋白质编码基因(PCGs),RSCU值大于1的密码子被认为是氨基酸偏爱的密码子。除了起始密码子AUG和色氨酸密码子(UGG)的RSCU值都精确为1之外,线粒体PCGs中密码子使用偏好的显著模式也很明显(图2)此外,对白芷和10个近缘物种之间进行了密码子偏好性分析结果显示,精氨酸、亮氨酸和丝氨酸的使用频率相似,且使用频率更高。   

图2白芷线粒体基因组相对同义密码子使用情况。

简单序列重复序列(SSR)通常被称为微卫星,是基因组中按顺序复制的简短但重要的DNA片段。由于这些SSR在不同个体间具有明显的变异性,因此在遗传研究中被广泛用作生物标记。在白芷线粒体基因组中,这些SSR以串联重复为特征,每个重复由1-6个核苷酸组成。线粒体基因组1号染色体上有8个该种SSR重复。白芷线粒体基因组还包含10个不同的重复序列,每个重复序列的长度超过30个碱基对(bp)。这组序列包括4对正向重复序列和6对回文重复序列,从而凸显了基因组结构中重复元件的丰富复杂性(图3)。   

图3白芷线粒体基因组的重复序列分析。

最内圈的彩色线段连接两个分散重复序列,黄色线段代表回文重复序列,紫色线段代表正向重复序列。第二个圆圈上的黑色线段代表串联重复序列,最外圈的黑色线段代表微卫星重复序列。

3、重复序列介导的基因重组:对植物线粒体基因组而言,同源重组涉及相似或相同DNA序列之间遗传物质的交换,这种交换显著增强了基因组的多样性和进化动态。这种机制在保持不同植物物种线粒体DNA结构和功能的完整性方面起着关键作用。在利用长读长测序技术组装白芷线粒体基因组的过程中,发现了两个不同的重复序列:R1(ctg13)和R2(ctg14),长度分别为4,733 bp和1,119 bp。这些序列为正向重复序列,具有特定的作用:如图4所示,R1(ctg13)与ctg12和ctg2结合形成1号和2号染色体,而R2(ctg14)与ctg11和ctg7结合产生3号和4号染色体。此外,这些重复序列帮助1号和2号染色体以及3号和4号染色体形成环状染色体分子。   

为了证实这些重复序列在协调同源重组中的作用,本研究采用PCR扩增和Sanger测序。证实了白芷线粒体基因组内存在复杂的同源重组机制的假设。因此,推测这些重复序列促进了染色体重组,最终形成了12种独特的环状染色体构象。

图4线粒体基因组结构的可视化和验证。

(A)白芷线粒体基因组图谱和重复序列。(B)从主要构象到次要构象的发展过程。(C)多对引物扩增的PCR产物的凝胶电泳结果。

4、MTPTs鉴定:利用BLASTn对线粒体基因组和质体基因组(登录号PP049083)进行比较基因组学分析,发现了9条同源序列,总长度达1,732 bp(图5)。其中最长的序列被命名为MTPT9,长度为382 bp。在这些同源片段中,已鉴定出9个完整基因,包括1个蛋白质编码基因和5个tRNA基因。MTPT3和MTPT6与叶绿体基因组反向重复片段中的同源区域一致,导致这些序列在叶绿体中重复。本研究推测,这些位点是序列迁移的关键热点,表明它们在基因组结构动态中发挥着重要作用。   

图5线粒体基因组与叶绿体基因组水平序列迁移。

5、系统发育和同源关系分析:为了阐明白芷线粒体基因组的进化,本研究进行了系统进化分析。以茄目(Solanales)的两个线粒体基因组用作外群,根据来自29个不同物种的24个保守线粒体蛋白编码基因(PCGs)的DNA序列构建了一棵系统发育树。白芷被归为伞形科(Apiaceae)科,与防风(Saposhnikovia divaricata)的进化关系更近(图6)。   

图6白芷与近缘物种线粒体基因组系统发育树

基因组同源性分析在白芷线粒体基因组中发现显著的同源和共线区块,它们通过复杂的带状结构相互连接。这些共线区块在不同植物纲中经历的广泛重排,说明了线粒体基因组的显著变异性(图7)。同源性分析发现了10个长度超过5000 bp的片段,这些长片段与防风(S. divaricata)具有很高的同源性,该结果加强了它们之间密切的系统发育关系。然而,尽管存在这些相似性,白芷的基因组结构与其进化关系较近的同类相比明显缺乏保守性,从而突出了其独特的结构特性。

图7白芷线粒体基因组的同源性    

6、RNA编辑事件:利用Deepred-mt工具分析了白芷线粒体基因组34个蛋白编码基因(PCGs)中的RNA编辑现象,如图 8所示。在PCGs中总共发现了615个预测的RNA编辑位点。nad4基因出现潜在RNA编辑位点的频率最高,共有48个RNA编辑位点,超过了所有其他线粒体基因。

图8白芷线粒体基因组RNA编辑位点

为了进一步证实RNA编辑事件的发生,本研究选择cox1、atp6和atp9基因,通过PCR扩增和随后的Sanger测序进行验证。结果证实在特定位点存在RNA编辑,包括cox1-2、atp6-718和rps9-223。其中,cox1基因的RNA编辑效率较高(图9)。   

图9 RNA编辑位点验证

总结

本研究成功获得了白芷的完整线粒体基因组,其基因组结构为环状,由12条染色体组成。本研究对其基因含量、重复元件、密码子使用、MTPTs、RNA 编辑位点进行了全面分析,并进行了系统发育推断。白芷线粒体基因组共包含34个PCGs、19个tRNA 基因和3个rRNA基因,同时还发现了叶绿体基因组和线粒体基因组共有的9个同源大片段。本研究是首次对白芷完整线粒体基因组进行广泛表征。该研究为了解植物线粒体基因组错综复杂的结构和动态提供了宝贵的见解,可为白芷以及其他植物物种未来的分子育种工作提供参考。此外,本研究结果还揭示了线粒体基因进化动态中以前未曾探索的方面,有助于更好地了解这些基因组的进化历史。   

温馨说明

 1、惠通生物针对叶绿体、线粒体测序项目组装结果准确,可以提供定制化高级分析,欢迎联系我们获取小基因组文章专业解决方案,助力文章发表。

 2、惠通生物小基因组服务电话:18926264030


欢迎关注物种分类及进化研究



  深圳市惠通生物科技有限公司,成立于2016年,技术成员在生物信息方面均有10年以上分析经验,在小基因组项目(叶绿体、线粒体、病毒)上形成强劲技术优势并可提供定制化高级分析内容。成立至今已服务客户单位200余家包括中国科学院植物研究所、中国科学院昆明植物研究所、华南农业大学、浙江大学、中国人民解放军疾病预防控制中心、武汉水生生物研究所等科研单位。合作老师发表小基因组SCI文章逾200篇,发表在《BMC Plant Biology》、forests》、 Frontiers in Plant Science》、《Frontiers in Microbiologymolecules》、International Journal of Biological Macromolecules》、《Plant Genome》、International Journal of Molecular Sciences》、《Infectious Diseases of Poverty》、《Insect Science》genes》、《frontiers in Veterinary Science》《Frontiers in Immunology》等杂志。

物种分类及进化研究
《物种分类及进化研究》专注于物种分类及进化研究,主要研究技术为植物叶绿体基因组测序,植物线粒体基因测序,动物线粒体基因组测序,真菌线粒体基因组测序,真菌基因组测序。我们会定期通过网络,汇总物种分类及进化相关研究进展,解读相关研究论文。
 最新文章