背景导读
紫花地丁(Viola philippica Cav.)是《中国药典》中描述的堇菜(Violae Herba, VH)唯一原生植物。这种生药的质量受到来自堇菜属几种混伪品植物的影响,而堇菜属植物的真正来源仍然存在争议。近年来,由于利用ITS、ISSR、RAPD和叶绿体(cp)标记进行DNA鉴定的快速进展,分子工具已逐渐应用于堇菜研究。核ITS基因和几个cp基因组区域(包括trnL-trnF、psbA-trnH和rpl16)已被频繁用于堇菜的分子系统学和物种鉴定。然而,堇菜中存在自然杂交、闭卵受精和多倍体,因此很难进行分类。常见的单基因座标记未能提供足够的遗传变异信息,以阐明堇菜物种之间的亚属关系,因此迫切需要更可靠的分子鉴定条形码。基于基因组的鉴定提供了丰富的遗传信息和潜在的分子标记,可用于鉴定密切相关的物种。叶绿体被认为是具有相对独立遗传物质的半自主性细胞器与核基因相比,cp基因的基因组结构、基因含量和基因顺序更保守,当使用整个cp基因组作为“超级条码”时,在植物系统发育分析和物种鉴定中具有重要意义。在这项研究中,我们比较了18个商品VH的原生植物V. philippica和其他五种常见混伪品的形态和化学成分。然后,我们对这六个物种的完整cp基因组进行了比较分析。本研究的主要目的是调查VH的认证来源,并在遗传水平上为这些容易混淆的物种开发更有效的标记和超级条码。
论文ID
An integrated study of Violae Herba (Viola philippica) and five adulterants by morphology,chemical compositions and chloroplast genomes: insights into its certified plant origin
杂志:Chinese Medicine 影响因子:5.45 发表时间:2022
材料方法
1、研究对象
对从安徽、河北、河南、湖北、江苏、山东、陕西、四川和广东省9个中药市场采集的18批商业VH样品进行了检查。将每个样品的干燥叶片在水中轻轻膨胀,在中国不同省份收集了被鉴定为VH替代品和掺伪品的全草,并进行了拍照。
2、化学成分分析
使用高效液相色谱结合二极管阵列检测(HPLC–DAD,Agilent 1260系列)分析这些样品的化学成分,测定了六种堇菜的主要成分。
3、VH样本的遗传分析
改良CTAB法用于从干燥样品中提取总基因组DNA,使用rbcLa和psbA-trnH的通用引物和先前发表的PCR条件扩增该序列。所有rbcLa和psbA-trnH序列均上传至GenBank。
4、VH叶绿体cp基因组测序和分析
从中国嘉兴、南京和石家庄市的草地上采集堇菜新鲜叶片,用于cp基因组Illumina HiSeq测序。使用Velvet v1.2.10和NOVOPlasty v2.7.2进行cp基因组组装,在线工具GeSeq对完整的cp基因组进行注释和分析。同时绘制基因组圈图、进行码子使用偏差和RNA编辑位点预测、重复序列分析、基因组比较与DNA条形码开发、系统发育分析等。
主要结果
1、VH形态和薄层色谱特征的比较
对在水中膨胀的干燥样品的检查表明,商用VH的叶片形状是可变的(图1A),不在紫花地丁的变化范围内。营养期的差异导致了对VH起源的错误识别。为了了解VH的实际植物来源,通过TLC检查和分析了来自中药市场的18个样品(图1B)。结果表明,色谱图存在差异。显然有三种主要类型的斑点。
图1 VH形态学和薄层色谱特征的比较。A商业干燥样品的叶片在水中膨胀以显示形态特征。每个单元格表示一个典型的叶片形状。B以标准药物和七叶皂苷为参考,对18批次堇菜的薄层色谱特征进行了研究。M1-M18表示来自TCM市场的18批样品。C六种堇菜的薄层色谱特征,以标准药物和七叶皂苷为参考。
中药市场上的商业VH主要来源于野生采集,而非栽培。基于文本和实地研究,从中国南部到东北部收集了五种广泛分布的堇菜属药用植物(图2);这些植物长期以来一直被用来掺杂商业VH。将形态特征与商用VH进行了比较,以进行初步植物起源鉴定(图2)。
图2 六种堇菜的鲜叶变异和原生植物。
2、VH特征成分比较和分子鉴定
在中国不同地区共采集了6种植物的42个样品,用于比较特征成分。确定每种物种的HPLC色谱图。紫花地丁中鉴定出四种主要成分:菊苣苷、七叶苷、秦皮乙素和早开堇菜苷,我们将这些特征成分指定为VH认证的索引成分。大多数商用VH和标准参考药物的色谱图与紫花地丁几乎相同(图3A,B)。将18个商业VH样品与8种新鲜植物材料扩增的rbcLa和psbA-trnH片段串联构建NJ树(图3C)。三个样本可以与紫花地丁(V. prionantha)聚集在一起,大多数通过形态学和化学方法鉴定为紫花地丁的样本无法区分。接下来我们将重点放在这六个物种的cp基因组上,以深入了解它们在遗传水平上的相似性和差异,并开发更有效的条形码来验证VH及其混淆品。
图3 VH索引成分和通用DNA条形码的比较研究。
3、叶绿体基因组的一般特征
堇菜属物种叶绿体(cp)基因组为典型的四分体结构,具有良好的同源性(图4)。基因组长度在156395-158067 bp之间,包括大小的单拷贝区(LSC:85692–86509 bp,SSC:16338–17330 bp)和一对反向重复区(IRa,IRb:27105–27141 bp)。cp基因组的总GC含量在36.24%和36.35%之间(表1)。四个核糖体RNA(rRNA)基因位于IR区域,其GC含量为55.38%;这可能是使IR区域比LSC和SSC区域更保守的原因之一。cp基因组序列可根据功能分为五个区域。编码区的tRNA和rRNA基因具有最高的GC含量(>52%);相反,非编码区的基因间间隔物具有最低的GC含量(<30%)。
表1 六种堇菜的基本cp基因组特征
图4 六种堇菜属物种的叶绿体基因组图谱。
从这些cp基因组中共注释了129个基因,包括84个蛋白质编码基因、8个rRNA基因、37个tRNA基因和两个假基因(Ψycf1和Ψrps19),其中18个在IR区域重复(表2)。然而,LSC中infA和rps16基因以及SSC中rpl32基因的完全缺失,这与金虎尾目(Malpighiales)中的大多数其他物种一致。叶绿体基因组中内含子往往比外显子积累更多的突变,并在基因表达调控中发挥重要作用。堇菜cp基因组注释到17个基因含有内含子,15个基因包含一个内含子,两个基因(ycf3和clpP)包含两个内含子。
表2 六种堇菜cp基因组中的基因含量
RNA编辑在植物生命周期中广泛发生,并参与质体转录调控。叶绿体中的RNA编辑调节基因表达并产生不同的蛋白质,从而丰富遗传信息。本研究中,分析了六个堇菜cp基因组中的34个蛋白质编码基因,共鉴定了57个RNA编辑位点,主要在ndh和rpo基因复合物中。基本转换类型为C到U,丝氨酸和脯氨酸残基被亮氨酸取代的频率最高。总的来说,这些结果与其他陆地植物的结果相似。
4、密码子使用偏好性
密码子使用偏好性可用于研究分子水平上基于基因组的进化过程。第三密码子位置(GC3)的GC含量反映了定向突变压力,并与密码子偏倚密切相关。本研究中,CDS区域的密码子数量约为26297–26323,六种物种中的每一种都有84个编码序列,GC3含量(29.25-29.47%)相比于第一位(44.92–44.97%)和第二位(37.40–37.48%)较低。六种堇菜属植物的cp基因组的RSCU值仅略有不同(图5A),总值为1–6%。在所有六个物种中,密码子的有效数量(ENC)约为49.4,表明密码子的使用略有偏差。
图5 密码子使用和重复序列的比较分析。
A六个cp基因组中CDS序列的密码子含量。纵坐标显示RSCU值,横坐标表示20个氨基酸和终止密码子,直方图表示六个物种;B SSR的类型和数量;C串联重复的类型和数量。D长重复序列的类型和数量。重复类型F(正向)、P(回文)、R(反向)和C(互补)。
5、SSR和长重复分析
SSR也称为DNA微卫星(1–6 bp),串联重复的DNA序列分布在整个cp基因组中。除SSR外,串联重复基序的长度大于6bp;而长度≥30bp的称为长重复序列,包括正向重复序列(F)、回文重复序列(P)、反向重复序列(R)和互补重复序列(C)。在六种堇菜中,共鉴定出46-64种SSR,且单核苷酸重复发生频率最高,其次是二核苷酸和四核苷酸重复(图5B)。超过90%的SSR包含短的聚(A)和聚(T)重复序列,这导致基因组中对A/T使用的偏好。此外,这些SSR主要分布在基因间间隔区(IGS)和LSC区域。在这六种堇菜中也发现了串联和散在重复的长基序(图5C,D)。串联重复序列长度一般小于29 bp(91.28%),大部分在14-21 bp(49.34%)之间。此外,还检测到四种类型的分散重复序列。六个cp基因组中长重复类型的数量相似,它们在质体中的分布高度保守。长串联重复序列主要分布在LSC的IGS区(75.04%)。散在重复序列在LSC和IR区不均匀分布,只有ndhA内含子中的散在重复序列位于SSC。挖掘具有高替代率的cp SSR和长重复标记可用于堇菜进一步的进化、遗传多样性和物种鉴定研究。
6、序列分歧和热点
IR区域的收缩和扩展导致被子植物cp基因组的长度变化。本研究比较了六个堇菜cp基因组的IR/SC边界区域。我们发现,所有六个堇菜cp基因组都具有高度保守的IR序列(图6A)。所有物种的SSC/IRa边界都位于ycf1基因中,导致ycf1假基因在IRb区域重复,LSC/IRb连接扩展到rps19基因中。为了进一步表征基因组水平上的差异,使用全序列相似性mVISTA比对来研究堇菜cp基因组中的多态性区域。如图6B所示,大多数可变位点在基因间区中发现;因此,包括一些内含子(如rpl16和ndhA)在内的非编码区比编码区更具差异性。在侧翼基因trnH-atpA、rpoB-rps14和accD-psbB之间的IGS区域中发现了三个不同的热点区域(图6B)。这些结果表明,这些区域在堇菜属以及其他相关的金虎尾目物种中快速进化。核苷酸多样性(Pi)用于识别高活性区域。热点区域的特定片段可以进一步用作潜在的遗传标记。六个堇菜cp基因组的平均Pi值为0.00649,IR区域的Pi低于单拷贝区域。非编码区域的Pi值远高于CDS区域。此外,LSC/SSC区域的15个非编码片段显示出比其他区域相对更高的Pi,因此被认为是高变区域(图6C),与mVISTA分析一致。这里发现的高度可变区域更有利于物种鉴定和系统发育研究。
图6 序列差异分析。A LSC、IR和SSC扩张与收缩比较。B六个堇菜cp基因组的序列全局比对。C六种堇菜cp基因组核苷酸多样性(Pi)分析。
7、系统发育关系
本研究中,采用六个新测序物种的cp基因组,以及从GenBank下载的11个完整的堇菜cp基因组序列(西番莲作为外群),用于构建堇菜的系统发育树。从ML和BI方法表明进化树具有相同的拓扑结构(图7)。分支A和B是两个主要的平行分支,代表两个进化方向(图7)。
图7 使用最大似然(ML)和贝叶斯推断(BI)方法,基于17种堇菜物种的cp基因组的系统发育树。西番莲作为外类群。
8、植物超级条形码的种类鉴定和发展
低Pi值和信息位点的缺乏表明了当前通用DNA条形码(matK、trnL-trnF、rbcL、atpB rbcL和rpoC1外显子2)及其组合在物种水平上区分堇菜物种方面的局限性。本研究中,在热点区域和通用条形码中,七个Pi值大于0.02的基因间区域被选为潜在的cp DNA条形码,以及psbK-psbI和atpF-atpH两个常规标记,它们比其它通用条形码相对更易变(表3)。
表3 cp基因组、特定条形码和通用条形码的变异性和辨别率
使用基于NJ树的方法比较特定条形码和通用条形码的识别率,此外,由这些条形码构建的NJ树应该具有与完整cp基因组推断的系统发育树相似的拓扑结构(图7)。基于树拓扑和识别率,三个基因间区域trnH-psbA、trnE-trnT和psbZ-trnG被连接为一个组合条形码。作为“超级条形码”,具有高达100%的潜在识别能力(图8),但后者具有相对较低的分支支持。与单位点或多位点cp DNA条形码相比,作为超级条形码的完整cp基因组是鉴定VH和同源物种的有效和可靠的工具。如图8所示,V. collina与其他五个物种的遗传距离最长,两种V. prionantha物种与V. seoulensis聚在一起。V. philippica没有与新测序的物种聚集在一起,而是与紫花地丁聚集在一起。
图8 使用完整cp基因组作为超级条形码的17种堇菜的NJ进化树。
结论
本研究系统比较了18个商品堇菜的原生植物紫花地丁和其他五种常见混伪品的形态和化学成分。目前中医药市场上VH的主流植物来源被认为是V. prionantha,而不是紫花地丁。为了开发更有效的DNA条形码用于堇菜物种鉴定,对紫花地丁及其五种混淆品的完整cp基因组进行了测序和分析。首先,我们比较了这六个cp基因组的基本基因组特征、密码子使用偏差、重复序列和IR边界,这表明彼此之间几乎没有差异。然后,将测序序列与更多已发表的同类物种进行比较,三种特定的cp DNA条形码(trnH-psbA、trnE-trnT和psbZ-trnG)及其组合被鉴定为堇菜的潜在DNA条形码。本研究对基于叶绿体基因组的系统发育分析和作为堇菜草本的多种堇菜物种的鉴定具有指导意义。此外,我们建议将《中国药典》中堇菜的合法来源明确认证并修改为早开堇菜(Viola prionantha.)。