项目文章 | ATAC-seq和RNA-seq揭示棉花纤维伸长过程中的关键基因

学术   2024-12-18 11:30   湖北  

2023年7月5日,郑州大学/中国农业科学院棉花研究所李付广研究团队在Physiologia Plantarum上发表题为“Characterization of chromatin accessibility and gene expression reveal the key genes involved in cotton fiber elongation”的文章,通过染色质可及性和基因表达的分析,揭示棉花纤维伸长过程中的关键基因。爱基百客为本研究提供了ATAC-seq技术服务

 研究背景

棉花是世界上最重要的纤维作物,在纺织行业中具有显著的经济重要性。鉴于纺织行业各种应用的需求不断增长,有必要了解纤维的发展机制,以便通过遗传工程或分子育种提高其强度、长度和产量。因此,特别需要识别参与纤维发育的转录因子(TF),其可能限制棉花纤维的产量和质量。此研究旨在通过比较短纤维突变体ligon linless-2 (Li2)与野生型(WT)的染色质可及性和基因表达,揭示关键基因。

 研究思路

 研究结果

1Li2突变体的纤维表型分析
田间生长的Li2突变体和WT植株之间在植物大小或花朵形态上没有显著差异(图1A)。扫描电镜分析显示,Li2和WT胚珠的表面纤维原的分布和密度也无显著差异(图1B)。表型分析表明Li2突变体和WT具有相似的表型和纤维启动过程。然而,从8DPA开始观察到Li2突变体和WT之间的纤维长度差异,在纤维伸长阶段这一差异越来越大(图1C-E)。结合前人的研究,选择8DPA的时间点作为理想的材料。

图1. Li2和WT的表型差异


2. 棉花染色质可及区域的鉴定和基因组分布
ATAC-seq结果显示大多数Li2突变体和WT的Peak位于启动子区域或基因间区域。小部分Peak位于内含子和外显子区域。TSS信号结果显示,在Li2突变体和WT中,TSS中心周围观察到最强的信号,表明TSS附近的区域是可及的。Peak结果由MACS软件获得,研究总结了两种材料三次重复实验中鉴定的峰值区域,并将Peak分布在基因组上进行了映射(图2A)。结果找到了与Peak最高位置最接近的TSS对应的基因(如果没有最高位置,则取中点位置),表明这个Peak与这个基因相关。
有趣的是,Li2的全基因组Peak比WT高出21%。在移除位于基因间区域的开放区域Peak后,保留了Li2突变体中的67,167个Peak和WT中的54,795个Peak进行进一步分析。大多数基因(42442个)在两种基因型中都存在,而16,394和7645个差异基因仅在Li2突变体或WT中发现(图2B)。两种基因型之间与ATAC-seq差异基因相关的Peak分布存在差异,大多数Li2突变体中的Peak分布在启动子区域,而WT中的大多数Peak主要分布在内含子(图2B)。在每种基因型中,THS的分布大多在TSS上游1kb内(图2C),大多数基因只包含一个THS(图2D)。

图2. ATAC-seq的数据分析和差异peak鉴定

3. 鉴定差异靶基因
研究分析Li2突变体和WT的8DPA纤维RNA-seq数据,以确定开放染色质区域变化对基因表达的影响。差异表达基因(DEG)分析显示,Li2突变体相较于WT有5077个上调和4905个下调基因(图3A)。随后,研究将ATAC-seq鉴定的差异基因和RNA-seq鉴定的DEG进行关联分析。在Li2突变体中,9794个基因与启动子Peak相关,分别与234个上调和177个下调DEG重叠;而在WT中,1906个基因与启动子Peak相关,分别与60个下调和28个上调DEG重叠,这些基因被称为差异靶基因(图3B)。
GO分析显示上调基因主要涉及植物型次生壁生物合成、葡聚糖转移酶活性、高尔基体、木聚糖生物合成过程和转移酶活性,而下调基因主要涉及微管结合、基于微管的运动、动力蛋白复合体、DNA复制启动和核小体(图3C)。与微管相关的动力蛋白样蛋白基因(KIF15、KIF11和CEPNE)的表达显著下调,这在一定程度上会影响细胞发育。与木聚糖合成相关的GhGUX基因(GUX2和GUX3)显著上调,这将对植物次生壁的合成产生重大影响,最终影响纤维的发展(图3D)。GUX(木聚糖的葡萄糖替代物)家族基因可以从1,4-B-D-木聚糖合成成熟木聚糖。这将影响细胞壁的组成,并可能影响细胞伸长。GUX基因在Li2突变体中高度表达,这导致棉花纤维细胞的发育。

图3. 整合ATAC-seq和RNA-seq数据的结果

4. Motif富集分析和棉花纤维转录调控网络鉴定
在染色质的Peak区域,可能存在调节附近基因表达的TF结合位点(图4A)。研究确定了两个材料在peak中过度代表的序列motif,以识别参与纤维伸长的TFs。为此,通过MEME-ChIP分析了peak区域内的重复掩模序列。Li2突变体的peak包含87个过表示的motif,而WT 的peak包含39个过表示的motif。然后,使用STRING数据库构建了一个富集的TF网络,有22个motif存在于两种材料的peak中,而在Li2突变体peak或WT的 peak中分别有62个和14个motif被独特地发现。

图4. 鉴定Li2突变体和WT的转座敏感位点中的序列motif
为了确定差异表达的转录因子(TF),研究利用RNA-seq数据识别了在Li2或WT中有差异表达的六个TF(图4B)。随后,利用Fimo扫描motif所在的peak序列,预测了这些TF的靶基因。根据预测靶基因的功能注释,绘制了差异TF的调控网络图(图5)。其中,TCP14是一种已报道的具有多种功能的蛋白,涉及细胞壁和激素相关基因的调节。

图5. TCP14靶基因参与多种细胞过程和激素响应

5. 鉴定参与纤维伸长的关键基因
研究将499个差异靶基因与FLGWAS数据结合起来,以鉴定与纤维伸长相关的高置信度SNP基因。在Li2突变体和WT之间,共识别出13个具有高置信度SNP的基因。例如,F5HFLA7在CDS区域有非同义突变,且通过SNP位点形成的两个单倍型之间的纤维长度存在显著差异。FLA7属于成束蛋白样阿拉伯半乳聚糖蛋白,这类蛋白广泛存在于所有植物组织和细胞中,含有羟脯氨酸的糖蛋白对植物生长和发展至关重要。FLA7(GH_A05G0558)在纤维伸长期间显示出非常高的表达(图6),可能在纤维伸长中发挥重要作用。F5H(ferulate 5-hydroxylase)通过Feruloyl-CoA影响5-羟基-单宁醛的合成。Feruloyl-CoA是G-木质素合成的前体,而5-羟基-单宁醛是S-木质素合成的前体。木质素的合成将影响纤维细胞的伸长。

图6. 通过qRT-PCR检测差异靶基因在不同组织中的空间表达模式


6. Li2突变体D13染色体缺失分析
根据以往研究,Li2突变体是在染色体D13末端的串联反向重复。基于ATAC-seq的测序结果,意外的发现Li2突变体中GH_D13G2601 (GHIRX7)GH_D13G2603的启动子区都有一个peak,而WT中GH_D13G2603启动子区有一个peak。GHIRX7Li2突变体的RNA得到了扩增。因此,作者认为GH_D13G2601GH_D13G2602并非缺失。在以前的研究中,据报道GHIRX7基因被删除,并负责Li2的短纤维表型。在这项研究中,研究发现GHIRX7没有被删除,需要进一步探讨其对Li2表型的影响。最近的研究表明,在Li2突变体的D13染色体末端发现了大规模的结构重排。基因Gh_D13G2437(GH_D13G2604)位于复制区反向重复序列的连接处,此研究结果与前文一致。
  结   论  

综上所述,此研究利用ATAC-seq技术,将数据与RNA-seq和FLGWAS数据整合,以全面理解WT和Li2突变体在纤维发育中的分子及遗传机制。研究确定了与纤维伸长相关的关键基因,为进一步研究棉花纤维伸长机制和表征参与Li2表型发育的特定基因提供了基础(图7)。这些关键基因的特征对于准确理解Li2突变体中短纤维表型的分子和遗传基础,以及设计棉花纤维产量和品质改良策略至关重要。

图7. TFs影响棉花纤维伸长的示意图

   关于我们  
武汉爱基百客生物科技有限公司(简称爱基百客),位于武汉高农生物园,是一家专业提供表观组学科研服务、单细胞与空间组学测序分析和高通量测序分析的新型生物科技服务企业。公司先后引入ChIP、WGBS、ATAC-seq、DNBSEQ-T7、10x Genomics、SeekOne® DD、DNBelabC-TaiM4和Stereo-seq等实验平台,不断提升公司的科研服务能力。

运营至今合作的科研客户超2000家,涵盖国内知名科研院所、高校以及相关生物企业,科研成果曾多次在Science、Cancer Cell、Nature Communications、J HEMATOL ONCOL、Plant Cell 等国际高水平学术期刊发表,受到了客户广泛好评,是国内成长最迅速的高通量测序科研服务企业之一。

项目咨询

 了 解 更 多 
{ 往 期 精 彩 回 顾 }

 精选合集,欢迎收藏哟! 

点个「在看」 天天发SCI

爱基百客生物
爱基百客是一家专业提供表观组学、单细胞与空间组学以及高通量测序分析的新型生物科技服务企业,旗下拥有DNBSEQ-T7、10xGenomics等平台,依托表观技术的优势,为生命科学研究和医疗健康等领域提供方案设计到数据分析一站式服务。
 最新文章