点击蓝字关注我们
中文题目:辣椒果实发育过程中的全长转录组测序及转录变异数据库的构建
英文题目:Full-length Transcriptome Sequencing of Pepper Fruit during Development and Construction of a Transcript Variation Database
发表期刊:Horticulture Research
影响因子:7.6
发表日期:2024年7月
第一单位: 湖南农业大学
参与单位: 贝纳基因
背景介绍
辣椒(Capsicum annuum L.)是全球种植最广泛的香料和蔬菜作物之一,不仅在饮食文化中占有举足轻重的地位,而且在生物学研究领域也展现出显著的价值。近年来,组学技术的广泛应用使科研工作者在辣椒素生物合成和果实发育方面取得了显著进展。然而,辣椒素在发育果实中的积累动态与基因表达模式之间的确切关联尚不明确。研究表明,辣椒素浓度在开花后30天达到峰值,在开花后40天达到最高点,但对其在胎座中的积累机制及伴随的转录组变化研究仍不充分。
在本研究中,我们对八个辣椒组织/器官在五个生长阶段(共228个样本)进行了全面的转录组分析,采用了Oxford Nanopore Technologies(ONT)全长转录组测序方法,并结合高效液相色谱(HPLC)和实时定量PCR(qRT-PCR)技术,提供了全面的辣椒转录组资源,并系统研究了辣椒果实和胎座发育过程中的基因表达变化。研究重点探讨了胎座发育过程中辣椒素生物合成的基因表达与辣椒素含量的关联。为了方便科研工作者便捷地访问全谱转录组数据,我们开发了辣椒全长转录组变异数据库(PFTVD 1.0),该数据库提供了丰富的功能,包括搜索、可视化、浏览和下载辣椒转录组数据的服务,旨在促进辣椒基因组学领域的研究进展。
技术路线
研究结果
1、辣椒的全长转录组全谱概况
从76组生物学样本(每组三个重复)中收集不同的辣椒组织/器官(包括:茎(S)、叶(L)、根(R)、果实(FA)、胎座(FB)、种子(FC)、果柄(FD)和花(FL))提取总RNA,这些样本收集于辣椒生长的五个关键生长阶段(包括种子萌发期、幼苗生长期、开花期、花蕾期和果实发育期)。随后,使用ONT平台对这228个cDNA文库进行全长转录组测序。
主成分分析(PCA)结果显示,样本按组织聚类(图1左)。但FL2-C(花蕾阶段的雄蕊)和FL3-C(开花期的雄蕊),它们没有与其他组织聚类。本研究共鉴定到485,351个表达的转录本,其中35,336个为已知转录本(基因),450,015个为新转录本(图1中)。每个基因包含不同数量的转录本(1到≥8)(图1右)。新转录本在所有12条染色体上均有分布,其中chr. 1上发现的新转录本数量最多,而chr. 8上新转录本数量最少。
转录本可分为三类:编码RNA(127,882个)、lncRNA(236,722个)和其他非编码RNA(120,747个)。最大的编码RNA为蛋白编码(101,151个)。长链非编码转录本中,有89.45%(205,632个)为LincRNA 。
图1. 辣椒全谱转录组的初步分析。左)基于TPM的主成分分析; 中)基因和转录本数量的条形图; 右)显示包含不同数量转录本的基因数量的条形图; 左下)基因和转录本的染色体分布密度图; 右下)转录本分类统计。
使用GffCompare软件将新转录本分类为不同类别(图2左),其中347,703个为未知/间隔区。结合已知和新转录本,本研究共预测了77,923个基因的115,268个非冗余CDS。
通过可变剪接(AS)分析,我们识别了七种主要的AS事件类型,其中内含子保留(RI)事件最为常见(14,795个) (图2右)。辣椒不同组织的AS事件数量如图2下所示。
图2. 辣椒中新转录本的类型和可变剪接事件数量。左)新转录本类型统计; 右)可变剪接类型和事件数量; 下)每个组织的剪切事件。
2、组织特异性表达和差异可变剪接分析
辣椒不同组织特异性转录本数量差异显著。PCA分析表明随时间推移,不同组织出现了不同程度的聚类现象(图3),表明基因表达受生长阶段影响。
图3 辣椒不同部位的PCA分析。A) 花; B)胎盘; C)根; D)种子; E)果; F)果实; G)叶子; H)茎。
接下来,我们探讨了不同组织间的差异性可变剪接(DAS)事件,如图4所展示,共鉴定了2,756个基因涉及DAS。叶与果实之间的DAS事件最为丰富(218个),其次的是叶与种子(190个)以及叶与胎座(189个)。营养组织和生殖组织之间的DAS数量较高,表明可变剪接在调节辣椒生长发育过程中的重要作用。
图4 不同组织间差异可变剪切事件统计
3、果实发育相关基因表达
鉴于辣椒果实是其食用的主要部分,因此我们特别关注了与果实发育相关的基因表达变化(图5)。总共72,911个转录本在果实中表达,其中31,777个是果实特异性的。这些转录本分为12个基因簇。簇9的转录本在DAF(开花后天数)期间表达增加,参与了蛋白质输出、卟啉代谢、α-亚麻酸、类胡萝卜素和葡萄糖苷生物合成途径。
簇12的转录本在FA5(25DAF)前表达趋势增加,与果实尺寸增长一致,这些转录本参与了类胡萝卜素生物合成、植物昼夜节律和次级代谢物合成的相关通路。研究还发现纤维素合成在果实生长过程中起重要作用。簇10和簇11的转录本富集在碳水化合物代谢相关通路,表明果实发育过程中发生了显著的变化。大量转录本(2,607个)在FA7阶段达到峰值后表达开始下降,这些转录本主要富集在糖类和氨基酸代谢等途径中。
图 5 果实发育基因表达簇。
4、果实颜色形成相关基因表达
类胡萝卜素是辣椒果实中的主要色素,对果实颜色的形成至关重要。基于果实颜色随发育进程的显著变化(图6上),我们对与类胡萝卜素合成相关的基因及其转录本的表达模式进行了深入分析。在果实发育过程中,我们观察到221个转录本富集在类胡萝卜素生物合成途径中,有多个基因在不同的DAF阶段表达了不同的转录本,表明在果实发育的不同阶段,不同的转录本参与了果实颜色的形成(图6下)。
图6 辣椒果实发育过程中的表达变化。上)不同开花天数(DAF)果实发育阶段; 下)果实中类胡萝卜素相关基因热图。
在果实发育过程中可变剪接(AS)事件较多。外显子跳跃(SE)是最常见SDAS类型(图7左)。不同DAF比较中,显著不同的AS事件的比例相近。在所有比较中,DAS事件主要富集在核糖体生物合成、碳代谢、内质网中的蛋白质加工和剪接体相关通路(图7右)。
以上结果表明,辣椒果实的生长与发育过程中,伴随着细胞壁(纤维素)合成、细胞分化、碳水化合物代谢和柠檬酸循环相关转录本表达的增加。在35 DAF之后,与色素合成和积累、及其他次级代谢物合成通路的转录本,在果实成熟之前高度表达。以上结果表明,在果实生长发育的不同阶段,存在特定转录本异构体的差异表达。通过长读长RNA测序,我们在辣椒果实中识别到大量的SDAS事件。
图7 果实发育中的剪切事件。左)差异性可变剪接(顶部)和显著差异性可变剪接(底部)的条形图;右)可变剪切事件基因的KEGG富集分析。
5、胎座发育基因表达
胎座在果实大小和辣椒素积累中起重要作用,因此那些在发育过程中持续上调或下调表达的基因可以揭示关键的胎座发育机制。在胎座中鉴定到的83,011个表达的转录本中,有34,556个是胎座特异性表达的。
在12个基因簇中,簇1和簇4分别显示了持续下降和持续上升的表达趋势(图8左),对簇4的转录本的分析表明,胎座发育期间代谢活动较高,初级和次级代谢途径相关基因的表达增加。簇12、8和11分别在开花后35、45和55天达到峰值,表明这些基因可能在胎座成熟和辣椒素积累过程中发挥着关键作用。在胎座发育的整个过程中,SE是最常见SDAS类型(图8右)。
图8. 辣椒胎座发育中的表达变化。左)胎座中表达转录本的聚类分析; 右上) 差异可变剪切事件统计; 右下)显著差异可变剪切事件统计。
6、辣椒素生物合成相关基因研究
辣椒素作为一种赋予辣椒果实辛辣特性的关键化合物,其含量直接决定了辣椒的辣度。在胎座发育过程中,辣椒素含量在FB1阶段最低,在FB10达到最高(3.47 g/kg),然后在FB11略微下降。总体上辣椒素含量随着果实的发育而增加。
我们重点分析了辣椒素生物合成途径中相关基因的表达模式,共有435个转录本被注释到苯丙烷类生物合成和缬氨酸、亮氨酸和异亮氨酸等降解途径。值得注意的是,一个辣椒素合酶转录本(gene_Capana08g00145.t1)在10到25 DAF上调,表明其在辣椒素生物合成中的早期诱导作用。综合富集分析结果表明,辣椒素的生物合成主要来源于缬氨酸、亮氨酸和异亮氨酸的降解以及柠檬酸循环和/或嘧啶代谢。
图9. 辣椒果实(胎座)中的辣椒素生物合成。A)胎座中的辣椒素含量。B) 辣椒素生物合成通路解析。
7、辣椒全长转录组变异数据库
为了方便研究者访问全谱转录组数据,我们开发了辣椒全长转录组变异数据库(PFTVD 1.0)(http://pepper-database.cn/)。PFTVD 1.0具备强大的搜索功能和基因组浏览器,为用户提供了一个全面的资源平台,主要包含“转录组学”、“基因组学”、“分析”和“工具”四大模块。在“转录组学”模块中,用户可以访问mRNA表达、基因表达、基因网络和生物标志物等信息。通过组织类型或发育阶段的筛选,用户能够轻松搜索和可视化转录组数据。“基因组学”模块支持五种类型的查询,包括基因、mRNA、可变剪接、转录因子以及蛋白质相互作用网络。“工具”模块提供了BLAST比对、引物设计、JBrowse基因组浏览器以及序列下载等功能,满足用户的多样化需求。
图10. PFTVD 1.0中实现的分析功能。
8、研究意义
本研究首次对辣椒发育过程中的转录组数据进行了全面解析,特别是果实和胎座发育过程,为辣椒的分子生物学研究提供了宝贵的资源。本研究首次提供了整个胎座发育过程中表达的转录本的动态变化,填补了该领域的数据空白。通过构建辣椒全长转录组变异数据库,研究团队不仅为科研工作者提供了一个功能强大的数据挖掘工具,还为进一步的功能基因组学研究提供了重要参考。
贝纳基因协助文章完成Nanopore全长转录组的测序、分析和数据库搭建工作。湖南农业大学园艺学院青年教师刘周斌为第一作者,杨博智老师为共同第一作者,邹学校院士,欧立军教授为本文的共同通讯作者。贝纳基因张天缘、陈虎、许汪洁共同参与该研究为该论文共同作者。
贝纳基因精研于Nanopore全长转录组测序服务,现已完成6000+样本的Nanopore全长转录组测序,项目经验包括:人、哺乳动物、模式植物、药用植物、农作物、鱼类、昆虫、真菌、病毒等样本,测序及分析经验丰富,可为广大科研工作者提供专业的三代转录组测序及定制化分析服务。
点击文末阅读原文,获取文献链接
往期精彩:
NAR解读|Direct RNA测序揭示U6 snRNA m6A 修饰在mRNA准确剪接中的关键作用
NC文献解读| Direct RNA测序能够消除传统抗体方法检测m6A修饰的假阳性问题
文献解读|小鼠肝脏对反复毒性损伤的耐受性与脂肪变性和炎症有关
Plant Cell文献解读 | 稻瘟病菌侵染植物的转录组景观揭示了时间共调控和结构保守的效应因子家族
文献解读 | The Plant Cell期刊发表十字花科植物基因间区长链非编码RNA的鉴定与功能注释成果
项目文章 | 纳米孔长读长RNA测序揭示人类血管平滑肌细胞中功能性的可变剪接变体
m7GHub V2.0:一个用于解析表观转录组m7G甲基化修饰的数据库
项目文章|贝纳基因Direct RNA测序助力牛脂肪细胞成脂机制研究
贝纳基因使用Nanopore平台完成全球第一个大型复杂植物基因组(菊花基因组)的组装和后续分析工作。提出并推动千种本草基因组计划,并构建药用植物基因组数据库,推动药材研究的发展。
贝纳基因使用Nanopore平台完成数千份细菌基因组、宏基因组测序和数据分析;完成数千份全长转录组和Direct转录组测序及分析。提出并推动基于Nanopore测序的万种微生物基因组完成图计划和十万人的Nanopore宏基因组研究计划。
贝纳基因开发了基于Nanopore平台的微生物检测体系,自主开发的数据库涵盖现已正式发表的所有微生物基因组,大型测序仪单机一次运行可以产生7.2T数据,小型便携式测序系统可用于临床检测和野外作业。
贝纳课堂-Nanopore交流QQ群:992789813(本群已满)
贝纳课堂-Nanopore交流QQ群2:923119248
生物信息交流QQ群:198746977
客服QQ:3277498363