菊科是双子叶植物第一大科,包含约1600属,超过26,000个物种,约占开花植物的7%。菊科植物在经济、生态及药用领域中具有重要意义,代表性植物如油料作物向日葵(Helianthus
annuus)、蔬菜莴苣(Lactuca sativa)和花卉万寿菊(Tagetes
erecta)等。菊科植物富含次生代谢物,许多种类在传统医学中广泛使用,如艾(Artemisia argyi)、黄花蒿(Artemisia annua)、苍术(Atractylodes lancea)及菊花(Chrysanthemum spp.)等。随着基因组学和转录组学技术的发展,菊科植物的研究逐步揭示其复杂的遗传机制,然而,由于其基因组通常庞大且结构复杂,数据整合与分析依然面临重大挑战。近日,华中农业大学果蔬园艺作物种质创新与利用全国重点实验室、药用植物资源可持续利用团队梅之南教授和杨庆勇教授课题组在国际知名期刊《核酸研究》上发表了题为“AMIR:
a multi-omics data platform for Asteraceae plants genetics and breeding
research”的研究成果,该研究构建了一个集数据整合、分析和可视化为一体的菊科植物的多组学数据库——Asteraceae Multi-omics Information Resource(AMIR)。旨在为植物科学家和育种专家提供全面的基因组、转录组、变异组和代谢组数据资源,结合多种创新功能,助力菊科植物的功能基因研究与育种策略优化。目前,AMIR数据库整合了菊科74种个物种的多组学数据,涵盖132个基因组、3897个转录组样本、超过4276万个变异数据及1.5万多个代谢物基因注释,所有的数据资源经统一处理,标准化进行整合(图1)。图1 AMIR数据库构建流程
一、AMIR主要功能模块
1.基因组和基因注释
AMIR数据库涵盖132个基因组(图2A)及4,408,432个蛋白编码基因的功能注释,包括GO术语、KEGG路径、Pfam家族域及转录因子注释(图2E)。基因组模块提供基因搜索(图2B)、家族分析(图2C)和共线性分析(图2D)功能,助力快速查找及比较不同物种间的保守与变异基因。2.泛基因组和跨物种比较
AMIR数据库构建了针对菊科植物的首个超级泛基因组(图2F),涵盖了74种菊科植物的基因组数据。泛基因组模块基于基因家族聚类分析,展示了菊科植物中的核心基因、特异性基因和可变基因。研究人员可以在这一模块中进行物种间的基因组比较,研究特定基因在不同物种中的保守性,为植物进化研究和基因组编辑提供重要参考。图2 AMIR中基因组部分功能与使用
3.转录组分析
AMIR数据库整合了3897个RNA-seq数据,覆盖44个菊科植物物种和131种不同的组织、器官和应激条件。用户可以在平台上进行单物种基因表达分析(图3A)、多物种基因表达模式比较(图3B)、组织特异性基因表达分析(图3C)和差异表达分析(图3D)等操作。4.遗传变异和关联分析
AMIR包含约30,507,963个SNP和12,257,327个插入缺失变异(InDels),支持快速查找特定基因变异(图3E)及其与基因表达的关联,揭示与重要性状相关的遗传变异位点,为分子标记辅助育种提供便利。5.代谢途径和基因调控网络
AMIR数据库收录了菊科植物次生代谢物的8个关键代谢途径及158个KEGG代谢途径,用户可探讨其生物合成途径并分析基因共表达网络(图3F)与转录因子调控网络(图3G)。图3. AMIR中转录组、遗传变异、代谢通路与基因调控网络功能与使用
6.工具集成与数据下载
AMIR集成多种分析工具,包括JBrowser、BLAST、MSA等,支持序列比对、基因家族分析及引物设计。平台还提供各类组学数据的下载,便利用户进行本地分析。
二、AMIR数据库的实际应用案例
1.超泛基因组分析:菊科植物HMGR基因的保守性研究
以3-羟基-3-甲基戊二酰辅酶A还原酶(HMGR)基因为例,通过AMIR平台的泛基因组模块(图4A),发现3-羟基-3-甲基戊二酰辅酶A还原酶(HMGR)基因在43种菊科植物中均存在(图4B),研究人员可以查看不同物种中HMGR基因的保守区域和进化关系(图C,D),进一步研究其在植物代谢中的作用。2. 转录组分析:菊花对病原菌感染的基因表达响应
在AMIR平台的差异表达分析模块中,研究人员可以分析不同实验条件下的基因表达差异(图4E)。例如,在研究菊花(Chrysanthemum morifolium)对Alternaria sp. 感染的响应时,平台显示了感染3天和5天后上调和下调的差异表达基因(DEGs)(图4F-4I)。研究人员利用GO/KEGG富集分析工具,揭示了与植物防御机制相关的代谢通路(图4J和4K)。这一功能展示了AMIR数据库在植物病害研究和抗病育种中的潜力。3. 遗传变异分析:发现与耐逆性相关的候选基因
通过AMIR数据库中的SNP和InDel变异模块,研究人员可以查找特定基因的遗传变异情况,并分析变异与基因表达之间的关系。该模块支持研究人员进行基因组水平的关联分析,以发现与特定耐逆性状或药用成分合成相关的候选基因,为菊科植物分子标记辅助育种提供了重要工具。图4 AMIR实际应用案例
AMIR数据库的发布标志着菊科植物多组学研究的重要里程碑。作为首个菊科植物多组学数据库,AMIR为功能基因研究、分子育种及药用成分开发提供系统化的数据支持。未来,研究团队计划进一步丰富数据库的组学数据类型,纳入菊科植物的表观遗传数据,并持续优化平台功能,使其成为全球菊科植物研究的核心数据资源。华中农业大学信息学院博士后刘东旭、博士研究生罗诚方、陈翔、毛红霞、李嘉炜、张林娜,硕士研究生戴睿、黄小燕,植物科学技术学院博士研究生何林共同完成了数据库的相关工作,华中农业大学药用植物资源可持续利用团队梅之南教授和杨庆勇教授为该论文的共同通讯作者。该研究得到了国家重点研发计划项目[2022YFC3502200和2022YFF1001400];国家自然科学基金项目[32322061和32070559]、湖北省种业高质量发展项目[HBZY2023B00503]以及华中农大中央高校基本科研业务费专项资金[2662023XXPY001]资助,华中农业大学作物遗传改良国家重点实验室的生物信息学计算平台支持。AMIR数据库链接:
https://yanglab.hzau.edu.cn/AMIR
原文链接:
https://doi.org/10.1093/nar/gkae833
感谢华中农业大学梅之南教授团队对本公众号的大力支持!我们诚邀对药用植物及植物药感兴趣的个人和机构关注本公众号,欢迎在这里分享您的研究成果。投稿请联系:王子龙,博士,副研究员,北京大学药学院,wangzilong@hsc.pku.edu.cn中国植物学会第十七届理事会
药用植物及植物药专业委员会