背景导读
包括中草药在内的传统中医药不断受到国际认可。中药在中医系统和食疗中得到了广泛的应用。中药在全球传统卫生体系中发挥着重要作用,不仅作为食品添加剂,还作为一些具有生物活性的医疗成分,如青蒿素和紫杉醇等,在传统中药市场上引起了轰动。然而,掺假和假中药的数量正在上升。目前,对植物和动物遗传学的理解促进了物种鉴定技术的发明。DNA条形码由于其标准化、最小化和可扩展性,已成为基于分子标记的物种鉴定中应用极为广泛的技术。DNA条形码现在被广泛用于中药品种的快速鉴定。
DNA条形码:一种有效的中药植物鉴定技术及其最新进展(综述)
DNA barcoding: an efficient technology to authenticate plant species of traditional Chinese medicine and recent advances
杂志:Chinese Medicine IF:4.546 发表时间:2022
研究目的
1、讨论DNA条形码及其衍生技术的动力学和应用前景;
2、解决最佳条形码验证常见中草药物种的问题;
3、概述了选择合适的技术来识别特定的中草药物种的过程。
主要内容
1、当前中药材行业普遍存在掺假现象
中医药行业在过去几年中迅速发展。因此,对中药日益增长的需求所带来的竞争是一个令人担忧的关键因素。中医药行业的发展趋势如图1所示。随着中药市场的不断增长,劣质/假冒草药产品也在增加。这一问题对中草药的后续临床使用和疗效产生了不可预测的影响,阻碍了精准医学的发展。因此,迫切需要快速、简单的检验程序来验证中药材的真实性。
图1 近10年中医药产品贸易额(百万美元)的趋势(数据来源于中国医药保健品进出口商会,http://en.cccmhpie.org.cn/)
2、解决方案之一:DNA条形码的起源与发展
中药的鉴定有四个主要的发展阶段,包括感官评价、微观鉴定、物理和化学鉴定(如高效液相色谱法)和基于DNA的分子鉴定。前三个阶段在准确区分真伪方面存在一定的局限性。由于准确性、成本和效率,基于DNA的草药分子鉴定得到了很大发展。DNA条形码可以通过鉴定物种来用于中药的质量控制。Hebert等人于2003年首次提出了应用DNA条形码来识别物种的概念。该技术通过使用线粒体基因的细胞色素氧化酶I(COI)的5末端,成功地在动物和真菌中使用。COI条形码是一种单倍体、单亲遗传的单基因座基因,具有很高的辨别力。然而,COI条形码不适合用于植物鉴定,因为植物中的线粒体基因进化缓慢,替代率非常低。研究人员将注意力转向叶绿体和细胞核基因组,以在植物物种中找到更强大的条形码。在过去的二十年里,已经提出了主要的标准单基因座候选条形码:ITS、ITS2、matK、rbcL、psbA-trnH和trnL-trnF,它们可以高精度地区分植物物种。然而,研究发现,单一的条形码不足以识别所有植物,这就需要使用多点DNA条形码。生命条形码联盟(CBOL)植物工作组提出了matK和rbcL基因座的组合,以提高物种识别的准确性。(NGS)技术和第三代测序技术的出现进一步促进了DNA条形码衍生技术在鉴定中草药物种方面的发展。目前的DNA条形码衍生技术包括超级条形码(super-barcoding)、元条形码(meta-barcoding)和迷你条形码(and mini-barcoding)。例如,(i)迷你条形码可以从高度降解的DNA中识别物种;(ii)元条形码可用于包含混合物种的样本中的物种丰富度分析;(iii)基于植物叶绿体基因组的超级条形码用于物种相关性研究。这三种基于DNA条形码的技术拓宽了DNA条形码的应用范围,增强了其实用性。数据挖掘和分析工具加强了基于DNA条形码技术的应用,可以有效识别中草药生物体系。然而DNA条形码技术仍然面临着许多挑战,如标准参考库不足、PCR扩增成功率低和PCR偏倚。尽管存在这些问题,但DNA条形码由于其操作简单、识别成功率高和可重复性,应用广泛。对于中药原料的质量控制技术,特别是中药植物品种的质量控制,中药原料和中成药的单一技术鉴定具有一定的片面性,因此需要将多种技术结合起来。因此,我们建议将几种鉴定方法相结合,以实现DNA条形码对中药的全面准确鉴定。
3、标准单基因座DNA条形码
DNA条形码技术已被广泛用于中药识别。根据CBOL植物工作组,统计2010年至2020年间DNA条形码的应用数量,ITS和ITS2、rbcL、matK、trnL–trnF、psbA-trnH、ycf1和rpoC1是最受关注的七种主要植物条形码。根据收集的NCBI数据库中DNA条形码序列的数量(图2),我们发现:
(i)ITS和ITS2是主要的条形码。ITS2区域不仅可以区分不同科的植物分类群,还可以在属和种水平上区分亲缘关系密切的分类群。
(ii)rbcL(179816个条目)、matK(174431个条目)和trnL–trnF(159360个条目)是第二大优势条形码,可能是其可以用作多位点DNA条形码。
(iii)rpoC1(15387个条目)和ycf1(16344条目)较少,可能归因于烟草ycf1基因的长基因序列(5709 bp)和较低的辨别力。
此外,atpF-atpH、ndhF-rpl32和psbK-psbI都是潜在的条形码候选基因。这些靶标在最近的文献中不那么受欢迎(低于1%),可能是因为它们的辨别能力相对较低,在不同分类群中的普遍性较差,或者扩增率不令人满意。一般来说,标准单基因座DNA条形码的文献仍在增加。
图2 植物主要DNA条形码序列数在NCBI Genbank中的增长
(1)ITS和ITS2
ITS是在较低分类群水平(包括属、种和亚种)对中药进行系统分子研究的最常见测序位点。ITS具有通用性、简化性、高拷贝数、种间变异性和种内一致性等优点。ITS已被用作区分21722多种植物物种的通用条形码,并被推荐用于验证中草药的真实性。然而,不完全的协同进化以及扩增和测序的困难,限制阻碍了其在中草药条形码中的应用。ITS2是一种介于5.8S rRNA和25S rRNA基因之间的非编码核DNA,可以在科、属和种水平上区分亲缘关系密切的分类群。ITS2可用于鉴定更广泛的植物分类群中的草本植物,因此,它适合于中草药粉末的认证。尽管ITS2有很多优点,但它并不适合鉴定蕨类植物。一个主要的问题是ITS2中存在多个拷贝,物种内甚至个体序列差异都很高。此外,由于协同进化,异质性是ITS2的一个问题,这可能导致不准确或误导性的结果。
(2)matK
高序列变异率和测序效率、进化、PCR扩增、合适的序列长度、被子植物的准确区分以及种内和种间分化特异性表明matK是一种有用的植物DNA条形码。该条形码已用于准确识别牡丹、Veronica officinalis。尽管如此,仍有必要开发用于识别植物物种的通用引物。
rbcL具有相对较低的种间鉴定能力,通常用于遗传变异测试。作为一个单独的候选序列,它是不合适的,因为这个区域发展缓慢,这意味着它的区分能力受到限制。最近,研究人员发现,对亲缘关系密切的物种的辨别能力较差,限制了rbcL在检测成分方面的实用性,这表明它应该与其他潜在的条形码一起使用。
超级条形码是一种很有前途的中草药鉴定方法,具有许多优点,包括:(1)避免了传统条形码中经常遇到的基因缺失问题、位点选择和低PCR回收率;(2)更高的分辨率和更好的通用性;(3)可以补充传统的DNA条形码。
与传统条形码相比,超级条形码增强了对密切相关群体的识别,包括对亚种的准确识别。例如,超级条形码被证明可以成功地区分亲缘关系密切的物种,如南洋杉属(Aruacariaceae)和紫锥菊属(Astraceae),特别是对于分类复杂的类群,如山茶属(山茶科)、中草药淫羊藿属(小檗科)、贝母属(百合科)和红豆杉属(红豆杉科)。超级条形码通常使用高通量下一代测序,它获得了更多的基因信息,并将传统的条形码区域(标准的单位点条形码)扩展到其完整的数千碱基长度。这种方法增加了完整质体基因组序列的密度和系统发育覆盖率,有望准确鉴定中草药。,
超级条形码的主要障碍是成本和对高质量DNA的要求、生成的大量高通量数据以及数据处理。此外,最近在短区域出现的变化可能太低而无法区分分化的分类群,因为质体基因组的进化通常较慢。
随着GenBank中整个叶绿体基因组数量的增加(图3),可以预见的是,在未来几年,超级条形码在中药中的应用将比标准植物DNA条形码更广泛。超级条形码并没有取代继续使用传统条形码方法的需要,而是提供了必要的数据来检查物种水平以下的变异。测序技术的持续进步可能使超级条形码成为未来在物种内或种群水平上进行植物鉴定的最佳选择。
图3 2010至2021 GenBank中完整的植物叶绿体基因组序列总数
6、元条形码
目前,已经开发了一种新的基于DNA条形码的方法,用于在单个环境样本中快速、同时识别多个分类群(即不同的中草药)。高通量测序平台的可用性和分类单元鉴定的需求促进了DNA元条形码的出现。2012年,元条形码被定义为“使用从环境样本(即土壤、水、粪便等)中提取的总的但降解的DNA来区分高通量多物种(或更高级别的分类单元)鉴定”[91]。用于识别样本的DNA元条形码包括:(1)采集混合物种环境DNA样本(获得原材料);(2)样本处理(DNA提取和PCR扩增序列);(3)高通量测序;(4)数据分析(从原始数据中获得clean data和OTU)和(5)物种识别。
DNA元条形码的最大优势是它能够同时识别复杂样本或处理混合物中的每一个物种。CPM的成分复杂,样品DNA降解严重。由于高精度,DNA元条形码可以以高覆盖率同时测量CPM的成分,从而克服上述问题。因此,元条形码越来越多地用于检测CPM的组分例如,它已经成功地鉴定了Veronica物种,并在V. officinalis草药产品中检测到其他Veronica的替代或混合。
然而,DNA元条形码的潜在应用受到PCR成功率和在建立综合分类数据库方面的限制。此外,高通量测序中的测序错误仍然是不可避免的。
DNA元条形码可以同时检测复杂样本中的多种物种,并促进加工产品中物种多样性的评估,这对于验证中药材产品的真实性极其重要。因此,这种方法可以快速准确地识别包括中草药在内的中药。然而,元条形码应与其他适当的化学方法结合使用。
7、迷你条形码
由于中药中常见的DNA降解,使用传统的标准条形码很难获得全长序列数据。迷你DNA条形码技术可以克服这一限制。迷你条形码可以利用标准DNA条形码中不完整、相对较短的序列来识别不同的物种,这对降解的DNA鉴定很有用。总体而言,它提高了物种的识别准确性。最常见的迷你条形码之一是trnL(UAA)内含子。DNA降解样品,叶绿体trnL(UAA)内含子的P6环可以用高度保守的引物进行稳健扩增。因此,它可以用于识别组分中种或属水平的药材。其他常见的迷你条形码区域包括较短的ycf1a和ycf1b、ITS2中的短区域和rbcL中的短区。
迷你条形码已成功用于识别传统中草药成分,如当归、川芎和羌活等。尽管如此,少数核苷酸通常限制了迷你条形码的分类,主要限制是分辨率。可接受的分辨率不仅取决于物种识别的准确性,还取决于参考序列数据是否足够。为了充分发挥迷你条形码的威力,需要向数据库中添加更多的参考序列。
由于迷你条形码的分子标记较短,可以将不同的物理化学技术结合起来快速识别中草药样品。例如,使用迷你条形码和高分辨率溶解(HRM)的组合,在中草药产品中准确识别沙棘。在未来,迷你条形码可能会成为一种完整的条形码技术,用于识别传统的中国草药。
8、当前DNA条形码技术在中药鉴定中的应用
根据近年来发表的关于中药和DNA条形码鉴定的论文,我们选择了中国药典中的50种常见中草药的条形码(表2)。我们还根据发表的论文总结了不同科或属的首选条形码(表3)。每个物种都有一个特定的最理想的条形码,称为“特异性条形码”。特定条形码可以包括单基因座条形码(例如,matK或psbA-trnH),或者是新标记。表2和表3总结了用于鉴定中草药物种的DNA条形码的最新发展以及特定植物的首选DNA条形码。
表2 DNA条形码和基于DNA序列的标记在中药鉴定中的应用
表3 植物鉴定中科或属水平的首选基因座
近年来,随着高通量测序技术和DNA条形码研究的不断发展,基因组学越来越多地被应用于中草药的鉴定。核标记的基因组捕获引起了研究人员的注意,而基因组扫描可以弥合标准条形码和基因组测序之间的差距。利用中药原始物种进行的中药基因组学研究取得了巨大成功。然而,数据处理和测序成本带来的巨大工作量明显高于普通条形码测序的成本。没有必要使用基因组学来鉴定中药的植物种类。
关于数据挖掘,一些研究表明,机器学习方法可以使用DNA多位点条形码或仅使用标准的单位点条形码来识别物种。机器学习中常见的DNA条形码分析方法包括BLOG(带LOGic的条形码)和WEKA。研究发现,psbA-trnH+ITS和psbA-trnH+ITS+rbcL表现出最高的识别能力。机器学习和DNA条形码技术在两个不同的领域交织在一起。在机器学习的帮助下,DNA条形码技术在中药鉴定中的应用将在未来得到有力的推动。
我们对DNA条形码及其衍生技术的应用前景持以下观点。我们的结论如图4和图5所示。总的来说,一个通用的DNA条形码可以用于不同分类单元的生物体(图4)。由于标准的单位点条形码ycf1和rpoC1如论文中所述是不明确的,因此在多位点条形码方法中,它们通常与其他条形码结合使用。对于相对较新的条形码技术,超级条形码和元条形码在较低分类级别的物种识别中具有较高的准确性和分辨率。超级条形码和元条形码很少用于初级筛选,而是用于验证或验证由传统标准单位点条形码或多位点条形码技术产生的可疑结果。迷你条形码已经获得了更广泛的认可,因为过度降解的DNA很难使用传统的单位点条形码或多位点条形码技术进行识别。因此,迷你条形码直接用于识别植物分类群,而且分类范围更广。
图4 常见的DNA条形码通常用于识别不同范围的分类单位
图5 如何选择合适的DNA条形码技术进行中草药鉴定的示意图
基于图4所示的DNA条形码的应用范围和上述每种衍生技术的特点,我们提供了一个选择理想的DNA条形码来鉴定中草药的示意程序(图5)。在该图中,高加工包括但不限于注射剂、药丸、片剂、颗粒剂、粉末、膏药、胶囊和其他剂型。传统的DNA条形码是鉴别中药的首选。建议在单个样本中使用传统的标准简单位点条形码。如果这种方法失败并且需要准确性,那么应该应用超级条形码。元条形码是同时识别多组分样品的首选技术。元条形码和迷你条形码的结合已经成为识别中成药的新趋势,这极大地促进了CPM成分的分析。
9、DNA条形码验证中药真实性的未来展望
DNA条形码及其衍生技术与其他技术(如机器学习、电化学传感器等)相结合,在识别中草药物种方面取得了巨大成果。本文综述了DNA条形码的发展,包括在中药植物物种鉴定中广泛使用的单位点和多位点条形码。我们的研究主要集中在DNA条形码衍生技术的潜在开发和应用上,包括超级条形码、元条形码和迷你条形码。通过仔细分析DNA条形码衍生技术的应用,我们开发了一个选择理想的DNA条形码技术的示意程序,用于识别中药中的特定物种,并对DNA条形码及其衍生技术的发展前景进行了展望。
展望未来,需要完善以下问题,以推动DNA条形码技术的发展:
(1)采样和分类:采样方法对于DNA条形码应该进行标准化。例如,道地药材,即特定的草药来自指定的地理区域,这些地理区域的条件包括气候、土壤和植物的种植技术。尽管来自同一物种,但药用道地材料和非药用道地对应物如何区分?
(2)随着NGS的发展及其广泛应用,中药材的DNA条形码发展正朝着基因组学方向发展,这将有助于草药基因组学的发展。这些基于DNA条形码的技术是否有可能从真伪验证或掺假检测升级为基于表观基因组学或表观遗传学信息的草药质量认证?如果DNA甲基化或his-tone修饰等分子信息有助于鉴定质量,这将扩大这些基于DNA条形码的技术的应用,这对开发中医药至关重要。
总的来说,我们提倡以下几点:(1)维护和更新全球植物DNA条形码库;(2)更新采样和分类过程的标准化协议;(3)评估基因组学和生物技术相结合的可行性,如转录组学(特异性表达子集分析)和蛋白质组学(特异性蛋白质组)。
结论
最新的文献和科学研究强调了中药中普遍存在的掺假和替代成分,这威胁到消费者的安全。在这篇综述中,我们总结了每种DNA条形码技术及其衍生识别技术的优势和局限性,包括单位点条形码、多位点条形码、超级条形码、元条形码和迷你条形码,以及测序技术、数据挖掘、数据库和与DNA条形码相关的新工具的最新发展。此外,还概述了选择合适的条形码或衍生技术分析TCM的系统过程。DNA条形码及其衍生技术作为一种快速有效的中草药鉴定方法,可以与其他几种方法相结合。在不久的将来,这些技术将用于规范中药质量控制,促进中药精密度的发展,加快中药的标准化和鉴定。
温馨说明
1、惠通生物针对叶绿体、线粒体测序项目组装结果准确,可以提供定制化高级分析,欢迎联系我们获取小基因组文章专业解决方案,助力文章发表。
2、惠通生物小基因组服务电话:18926264030
欢迎关注物种分类及进化研究
深圳市惠通生物科技有限公司,成立于2016年,技术成员在生物信息方面均有五年以上分析经验,在小基因组项目(叶绿体、线粒体、病毒)上形成强劲技术优势并可提供定制化高级分析内容。成立至今已服务客户单位100余家包括中国科学院植物研究所、中国科学院昆明植物研究所、华南农业大学、浙江大学、中国人民解放军疾病预防控制中心、武汉水生生物研究所等科研单位。合作老师发表小基因组SCI文章逾100篇,发表在《forests》、《 Frontiers in Plant Science》、《Frontiers in Microbiology》、《molecules》、《International Journal of Biological Macromolecules》、《Plant Genome》、《International Journal of Molecular Sciences》、《Infectious Diseases of Poverty》、《peerJ》、《genes》、《frontiers in Veterinary Science》《Frontiers in Immunology》等杂志。