福建农林大学博士生第一作者在国际著名期刊(IF=23.8)发表论文,开发全球首个能源草多组学数据库

学术   2024-12-31 19:07   江苏  

引言

随着全球对可持续能源解决方案的需求日益增长,能源草因其在碳固定、土壤健康改善以及生物能源生产中的重要作用而备受关注。近期,福建农林大学朱方捷教授团队开发了能源草多组学数据库(EGDB,https://engrass.juncaodb.cn/),它将为能源草的研究提供强大的数据支持平台。此研究于2024年12月28日在iMeta(IF=23.8)在线发表,题为“EGDB: A comprehensive multi-omics database for energy grasses and the epigenomic atlas of pearl millet”

EGDB 将种质数据与基因组学、转录组学、表观基因组学和表型组学数据相结合,以支持不同能源草物种的功能基因组研究。EGDB 还提供了目前为止最大的能源草表观组学数据,包括珍珠粟的高分辨率染色质修饰、染色质可及性和基因表达景观。

EGDB数据库亮点

多组学数据集成:EGDB整合了11种关键能源草物种(如巨菌草、珍珠粟、芦竹等)的基因组、转录组、表观基因组和表型数据,为用户提供了一个全面的数据分析和研究平台。

丰富的基因资源:包含19.64 Gb的基因组序列,覆盖539,598个基因,其中342,300个基因已功能注释。

转录因子注释:系统性地识别了28,897个转录因子,为能源草提供了完整的转录因子注释。

基因表达图谱:整合了267个基因表达图谱,覆盖16种组织类型,助力深入探索组织特异性和条件特异性的表达模式。

EGDB主要功能模块及其功能

1.首页模块(Home):作为主要入口,包含新闻、外部链接和出版物等部分,让用户了解最新的研究进展、相关资源和关键研究。

2.物种模块(Species):允许用户探索各种能源草的详细信息,包括种质信息和表型数据。该模块还提供每种能源草的生态分布、抗逆境特性和生物质生产特性。

3.搜索模块(Search):用户可以选择能源草物种,搜索其基因、基因组位置、农艺性状、基因分类、基因表达和转录因子。

4.工具模块(Tools):提供一系列生物信息学工具,用于高级基因组研究。核心工具包括JBrowse2和BLAST+用于基因组可视化和序列分析、Primer3用于高效引物设计以及OrthoVenn3用于同源基因分析。这些工具使得用户能够执行基因搜索、功能注释、序列比对和基因家族分析。EGDB还提供了全基因组鉴定的转座元件(TEs)集合以及每个基因的导向RNA设计,这些可以直接应用于CRISPR编辑。

5.下载模块(Downloads):提供广泛的基因组和表观基因组数据资源,包括基因组序列、GFF注释、CDS序列、组蛋白修饰、染色质可及性和TE注释等。

图 1 EGDB 构建和概述以及关键功能。(A) 数据源集成:该数据库集成了多个层次的多组学数据,包括表观基因组学、表型组学、种质、转录组学和基因组学,以提供对能量草物种的全面见解。(B)网站架构:该架构利用分层中间件设计实现高效的数据处理和管理,后端服务以 Python、PHP 和 Perl 实现,而前端接口使用 AJAX、HTML、CSS 和 JavaScript。包括 JBrowse2、Sequence Server 和 OrthoVenn3 等各种依赖项模块,用于数据可视化和分析。(C) 模块和功能:该数据库提供了一套全面的功能,包括物种浏览、种质信息、BLAST 工具、CRISPR 分析、基因搜索功能以及基因组资源(如 GFF 和基因注释文件)的下载选项。(D) 首页界面:首页展示能源草研究在可持续能源生产和生物质改良中的应用。(E) 种质分布:珍珠粟 (C. americanus) 种质多样性的全球分布模式。(F) JBrowse2 可视化:能量草数据库支持不同组织和实验条件下的转录组数据可视化,以及各种能量草种的基因组数据。(G) 直系同源分析:该分析显示了直系同源基因簇在紫象草、象草和巨菌草中的分布。

珍珠粟表观基因组图谱

对于能源草,虽然可以获得基因组和转录组数据,但表观遗传数据集仍然稀缺。因此,我们补充了 EGDB 的表观遗传数据,构建了珍珠粟的综合表观基因组图谱。

珍珠粟广泛生长在干旱和半干旱地区(约 3000 万公顷)。珍珠粟广泛种植于干旱和半干旱地区(约3000万公顷)。珍珠粟谷物在用作能源草的同时,还养活了全世界超过 9000 万人。珍珠粟的谷物虽然用作能源草,但还养活了全球 9000 多万人。结合 MNase-seq、ChIP-seq、DNase-seq 和 RNA-seq,我们生成了 163 Gb 的表观遗传序列数据。通过对非编码基因组的系统注释,我们定义了 15 种染色质状态和潜在的顺式调节元件,包括 27,396 个可接近的启动子和 173,868 个远端调节元件(潜在的增强子)。表观遗传图谱显示,活性组蛋白标记在启动子区域(H3K4me3、H3K27ac、H3K14ac 和 H3K9ac)或基因区域(H3K4me1 和 H3K36me3)中富集。在珍珠粟中,71.70% 的 DNase I 超敏位点 (DHS) 位于基因间区域,53.11% 的基因间开放染色质区域与 TE 重叠,特别是与 Gypsy 元件重叠,Gypsy 元件存在于 23.18% 的基因间 DHS 中。对于抑制组蛋白标记,53.74% 的 H3K27me3 峰位于基因间区域,这可能有助于 TE 的基因组压缩和抑制。

图 2珍珠粟的表观基因组图谱有助于揭示基因表达的调控机制。(A)表观基因组特征的染色体分布全基因组表征:最外圈代表七条染色体,以100 kb分辨率显示。第二圈显示基因密度。(B)热图:展示七种组蛋白修饰和TSS(转录起始位点)周围的开放染色质信号。(C)柱状图:展示叶组织中表观遗传标记在基因组不同区域的分布,包括启动子(1−2 kb)、启动子( ≤ 1 kb)、5′ UTR、3′ UTR、外显子、内含子、下游区域( ≤ 300 bp)和远距离区域间隔。(D)染色质可及性区域分布:根据与基因的接近程度,分析全基因组的三种可及染色质区域——基因相关ACR(gACRs)、启动子ACR(pACRs)和远端ACR(dACRs)。(E)基因表达水平:分析具有活跃启动子(active)、可及启动子(accessible)和其他启动子(other)的基因表达水平。(F)远端ACR到最近基因的距离分布。(G)DNA足迹分析:分析显示AP2转录因子显著富集(左),并展示其对基因表达的影响(右)。(H)染色质图景:珍珠粟染色质特征由15种状态模型表征。(I)不均衡表达模式:展示了大多数重复直系同源基因的表达模式不均衡性。(J)表观基因组特征不均衡性 (K)主要转座元件家族中的组蛋白修饰水平。

EGDB数据库的上线,不仅为能源草的研究提供了一个集成数据资源和工具的平台,而且对于推动可持续农业和可再生能源发展具有重要意义。

福建农林大学生命科学学院2021级博士研究生罗琳,福建农林大学菌草与生态学院林冬梅教授、圣路易斯大学2022级博士生李金辉、福建农林大学菌草与生态学院2022级博士研究生陈昊为论文共同第一作者。硕士生屈祺、张林、罗源等也参与了研究工作。福建农林大学海峡联合研究院肖嘉靖副教授,朱方捷教授,四川农业大学草业科技学院黄琳凯教授为该论文的共同通讯作者。本研究得到国家重点研发计划、福建省自然科学基金、国家自然科学基金、福建省重大专项项目以及福建省农业厅项目的资助。

本研究依托福建农林大学国家菌草工程技术研究中心(菌草中心)开展,菌草中心开创的菌草技术现已传播至全球110国,为我国“一带一路”、“乡村振兴”等国家战略做出重要贡献。本中心致力于菌草资源的研究、开发与应用,以菌草生态治理、生物质能源、食用菌栽培为重点,推动菌草技术在农业、生态修复和可再生能源领域的广泛应用。作为国家创新发展和生态保护的典范,福建农林大学国家菌草工程技术研究中心始终以“科技创新、生态优先”为宗旨,为建设绿色地球贡献中国智慧与方案!

🔗 访问数据库: EGDB官网

Lin Luo, Dongmei Lin, Jinhui Li, Hao Chen, Qi Qu, Lin Zhang, Yuan Luo, et al. 2024. “EGDB: A Comprehensive Multi-Omics Database for Energy Grasses and the Epigenomic Atlas of Pearl Millet.” iMeta 3: e234.

https://doi.org/10.1002/imt2.263

#EGDB #能源草 #表观基因组 #可持续能源

Ad植物微生物
分享植物与微生物相关学科最新研究进展和科学知识。
 最新文章