大队列ATAC-seq:揭秘基因调控的“密码本”

学术   2024-12-04 11:30   湖北  
 
 · 引 言


在生命科学的广阔天地中,基因组如同一个庞大的信息库,储存着生物体所有的遗传指令。然而,基因组中的大部分区域并不直接编码蛋白质,而是作为非编码区存在。这些非编码区虽然不直接参与蛋白质合成,却在基因表达调控中扮演着至关重要的角色。它们像是隐藏在基因组深处的“开关”,调控着基因何时、何地以及以何种方式被激活或关闭。

近年来,随着高通量测序技术的发展,科学家们得以更深入地研究这些非编码区。其中,一种名为ATAC-seq(Assay for Transposase-Accessible Chromatin using sequencing)的技术,因其能够高效地检测染色质的可及性,从而揭示基因调控的奥秘,而备受关注。利用ATAC-seq获取染色质可及性的高分辨率图谱,不仅可以展示哪些区域的染色质是开放的,哪些区域是封闭的,还能揭示不同细胞类型和组织中基因表达的调控模式。

然而,随着研究的深入,科学家们意识到,要全面解析基因组的调控机制,仅依靠小规模的样本研究是不够的。因此,大队列ATAC-seq应运而生。这种研究方法通过对大量样本进行ATAC-seq测序,旨在构建更为全面和精细的基因调控网络,从而为我们理解复杂疾病的发病机制、药物反应差异等提供新的视角。

ATAC-seq技术简介

ATAC-seq,即转座酶可及染色质测序技术,是一种用于研究染色质可及性的高通量测序方法。该技术通过利用转座酶Tn5容易结合在开放染色质的特性,将转座DNA设计为接头,随机插入染色质的开放区域,然后对Tn5酶捕获到的DNA序列进行测序,从而获取染色质可及性的高分辨率图谱。


技术优势


ATAC-seq技术具有以下几个显著优势

·  高灵敏度:ATAC-seq技术能够检测到低丰度的转座酶插入事件,从而实现对染色质可及性的高灵敏度检测。

·  高分辨率:通过测序得到的DNA片段长度通常较短,这使得研究人员能够精确定位到染色质的可及位点。

·  高通量:ATAC-seq技术可以同时处理大量样本,实现大规模的基因组学研究。

·  适用性广:ATAC-seq技术适用于各种类型的细胞和组织,包括原代细胞、干细胞、肿瘤细胞等。


应用领域


ATAC-seq技术在多个领域都有广泛的应用

·  基因组学研究:ATAC-seq技术可用于绘制基因组的染色质可及性图谱,揭示基因组的结构和功能。

·  表观遗传学研究:ATAC-seq技术可用于研究DNA甲基化、组蛋白修饰等表观遗传修饰对染色质可及性的影响。

·  转录调控研究:ATAC-seq技术可用于鉴定转录因子(TF)的结合位点,揭示基因转录调控的机制。

·  疾病研究:ATAC-seq技术可用于比较正常组织和病变组织的染色质可及性差异,发现与疾病相关的基因调控变化。

大队列ATAC-seq的研究进展

近年来,随着测序技术的飞速发展和成本的降低,大队列ATAC-seq研究逐渐成为基因组学研究的热点,下面给大家罗列一些研究案例:


1. 癌症中的大队列ATAC-seq研究

癌症是一种复杂的疾病,其发生和发展涉及多种基因和非编码区域的调控变化。为了全面解析人类癌症的基因组调控景观,Corces等人利用大队列ATAC-seq,对来自包括乳腺癌、肺癌和结直肠癌等23种癌症类型的410个肿瘤样本进行了分析。研究发现了562,709个转座酶可及的DNA元件,不仅扩展了已知顺式调控元件的目录,还证实了癌症亚型之间的染色质可及性模式的异质性。通过足迹分析,研究确定了与基因表达相关的转录因子的活性模式。这些转录因子在癌症中的表达模式与其在正常细胞中的模式存在显著差异,表明它们在癌症中的调控作用发生了改变。此外,研究利用基因表达和染色质可及性数据的关联,预测了大量的远端增强子与基因之间的相互作用。这些相互作用可能影响癌症的发生和发展。最后,通过整合全基因组测序数据,研究识别出与癌症相关的非编码突变,这些突变通过改变染色质可及性来影响基因表达。

2. 高原适应中的大队列ATAC-seq研究

高原低氧适应是人类进化中的一个重要现象。藏族人群长期生活在高海拔地区(平均海拔4000米),与汉族低地人群相比,藏族人群在低氧环境下的血红蛋白浓度较低,但较少出现高原反应。为了揭示这一现象背后的适应性机制,Xin等人对从5名藏族和5名汉族人脐带静脉中分离的HUVECs细胞在低氧条件下诱导不同时间点(0小时、6小时、1天、3天和5天)后的50个样本进行了大队列ATAC-seq和RNA-seq分析。研究发现了多个与低氧响应相关的染色质可及性区域,这些区域在不同时间点和细胞类型中表现出不同的可及性模式。例如,在低氧条件下,某些增强子的可及性显著增加,而某些启动子的可及性则显著减少。然后,通过分析转录因子的结合模式,研究人员识别出多个在低氧条件下起关键作用的转录因子。这些转录因子通过与特定DNA序列的结合,调控下游基因的表达,从而影响细胞的低氧响应。此外,RNA-seq数据分析显示,低氧条件下多个基因的表达水平发生了显著变化,特别是与血管生成和免疫反应相关的基因。这些变化可能与藏族人群的低氧适应密切相关。

3. 免疫系统衰老中的大队列ATAC-seq研究

随着年龄的增长,免疫系统的功能逐渐下降,导致老年人更容易感染和患慢性疾病。然而,性别在免疫系统衰老中的作用尚未被充分研究。为了揭示性别在免疫系统衰老中的作用,Márquez等人利用大队列ATAC-seq,对年龄跨度为22-93岁的172名健康成人(91名女性,81名男性)的外周血单个核细胞(PBMC)进行了分析。研究发现,男性和女性的PBMC在染色质可及性上存在显著差异。男性在单核细胞和先天免疫相关区域的染色质可及性较高,而女性在B细胞和适应性免疫相关区域的染色质可及性较高。染色质可及性变化表现出两个主要的年龄相关阶段,第一个阶段发生在38-41岁之间,第二个阶段发生在66-71岁之间。这些变化与性别无关,但在男性中更为显著。此外,RNA-seq数据分析显示,男性和女性的PBMC在基因表达上也存在显著差异。男性在单核细胞和先天免疫相关基因的表达上较高,而女性在B细胞和适应性免疫相关基因的表达上较高。这些发现证实了年龄和性别在免疫系统衰老中的交互作用。


4. 水稻基因组调控中的大样本ATAC-seq研究

水稻基因组的复杂性使其成为研究植物基因组调控的理想模型。尽管已有大量研究集中在水稻的基因组结构变异和基因表达调控上,但对水稻非编码调控元件的系统解析仍然有限。为了全面解析水稻的基因组调控景观,Zhu等人利用ATAC-seq,对3个品种水稻23个不同组织/器官共计72个样本进行了分析。研究共鉴定出117,176个独特的开放染色质区域(OCR),占水稻基因组的约15%。这些OCR主要分布在基因的上游和远端区域,与已知的增强子和启动子区域高度重叠。通过整合RNA-seq数据,研究人员预测了59,075个OCR-gene的链接,其中增强子构成了69.54%的链接。这些链接揭示了水稻基因表达的复杂调控网络。此外,通过优化深度学习模型,研究成功解码了组织特异性的染色质可及性模式。这些模型能够准确预测不同品种间的染色质可及性变化,为水稻基因组调控研究提供了新的工具。

5. 玉米基因组调控中大样本ATAC-seq研究

玉米基因组庞大且复杂,包含大量的转座元件。尽管已有大量研究集中在玉米的基因组结构变异和基因表达调控上,但对玉米的非编码调控元件的系统解析仍然有限。Zhu等人利用ATAC-seq,对214份玉米自交系的叶片染色质可及性进行了分析。研究共鉴定出82,174个开放染色质区域(ACR),其中约39.55%的ACRs在不同样本间表现出显著变异。这些ACRs主要分布在基因的内含子和远端区域,与转录因子结合位点高度重叠。通过整合RNA-seq数据,研究人员预测了27,004个染色质可及性数量性状位点(caQTLs)。这些caQTLs中,有相当一部分能够破坏转录因子的结合位点,从而影响染色质可及性和基因表达。此外,研究进一步分析了玉米SNP基因型与染色质可及性之间的关系。结果表明,SNP基因型对染色质可及性的影响在不同基因型间存在显著差异,提示遗传变异在玉米基因组调控中的重要作用。


6. 瓜类作物基因组调控中大样本ATAC-seq研究

瓜类作物(如黄瓜、西瓜、甜瓜等)在果实发育过程中表现出快速的细胞分裂和扩张,这一过程受到复杂的基因组调控机制的控制。Xin等人利用ATAC-seq,对六种瓜类作物在两个关键发育阶段的两个组织共计24个样本的染色质可及性进行了分析。研究首先从六种瓜类作物和五种外群中共鉴定出392,438个保守的非编码序列(CNSs),其中包括82,756个仅在瓜类作物中特异性存在的序列。随后,使用ATAC-seq技术,研究从六种瓜类作物中鉴定出20,865-43,204个染色质可及区域(ACRs),这些区域覆盖了1.72-5.43%的基因组。整合CNSs和ACRs,发现4,431个同源正交CNSs,其中包括1,687个仅在葫芦科作物中特异性存在的CNSs,这些CNSs可能调控757个相邻的同源基因的表达。最后,通过CRISPR/Cas9技术对两个特异性CNSs进行突变,验证了这些CNSs在果实发育中的调控作用。突变导致了相邻基因表达模式的显著改变,并显著影响了果实的形状和大小。这些发现为通过基因编辑技术改良瓜类作物果实品质提供了新的思路。

ATAC-seq的技术挑战与解决方案

尽管大队列ATAC-seq研究在基因组学领域取得了显著的成果,但仍面临一些技术挑战。以下是一些常见的挑战及其解决方案:


1. 数据处理和分析的复杂性

大队列ATAC-seq研究产生的数据量巨大,给数据处理和分析带来了很大的挑战。为了应对这一挑战,研究人员需要采用高效的计算方法和工具来进行数据的预处理、质量控制、比对和统计分析。例如,可以利用分布式计算框架如Hadoop或Spark来加速数据处理过程;同时,还可以利用机器学习算法来自动识别和去除低质量的测序数据。


2. 样本的异质性和批次效应

在大队列ATAC-seq研究中,样本的异质性和批次效应可能会影响结果的准确性和可靠性。为了减少这些因素的影响,研究人员需要采取一系列措施来确保样本的质量和一致性。例如,可以在实验设计阶段尽量选择年龄、性别、健康状况等相似的样本;同时,在数据预处理阶段可以采用多种方法来消除批次效应,如使用ComBat算法进行校正。


3. 跨物种比较的难度

由于不同物种之间的基因组和染色质结构存在差异,因此在进行跨物种比较时可能会遇到一些困难。为了克服这一挑战,研究人员需要选择合适的参考基因组和比对方法来进行跨物种比较。此外,还可以利用进化生物学的方法来分析不同物种间染色质可及性的保守性和特异性,从而揭示其在进化过程中的作用。

ATAC-seq的未来展望

随着技术的不断进步和研究的深入,大队列ATAC-seq在未来有着广阔的应用前景。以下是一些可能的研究方向:


1. 更多物种和组织的拓展

目前的大队列ATAC-seq研究主要集中在人类和少数几种模式生物上。未来,随着技术的成熟和成本的降低,我们可以期待更多物种和组织的大队列ATAC-seq数据的产生。这将有助于我们更全面地了解不同生物体的基因调控机制,揭示更多与生物多样性相关的基因和通路。


2. 单细胞ATAC-seq技术的发展

单细胞ATAC-seq技术是在单细胞水平上研究染色质可及性的新技术。与传统的ATAC-seq技术相比,单细胞ATAC-seq能够提供更高分辨率的基因调控信息,揭示细胞异质性对基因表达的影响。未来,随着单细胞ATAC-seq技术的进一步发展和优化,我们将能够更深入地了解不同细胞类型在生物体中的作用和相互作用。


3. ATAC-seq与其他组学技术的整合

ATAC-seq技术可以与RNA-seq、ChIP-seq、DNase-seq等其他组学技术相结合,形成多维度的基因组学研究策略。这种整合分析方法不仅可以提供更全面的基因调控信息,还有助于揭示不同组学数据之间的关联和互作关系。例如,通过整合ATAC-seq和RNA-seq数据,我们可以同时分析染色质可及性和基因表达的变化,从而更准确地鉴定出关键的调控元件和靶基因。


4. 精准医疗中的应用

随着精准医疗的不断发展,大队列ATAC-seq技术在疾病诊断和治疗中的应用前景日益广阔。通过分析患者的基因组数据,我们可以识别出与疾病相关的基因变异和调控元件,从而为患者制定个性化的治疗方案。此外,大队列ATAC-seq数据还可以用于评估药物的疗效和副作用,为药物研发提供有力支持。

 结  论 

大队列ATAC-seq技术为解析基因组调控机制提供了强有力的工具。通过对不同生物体、不同组织和不同发育阶段的染色质可及性数据进行系统分析,研究人员能够揭示基因表达的复杂调控网络,识别关键的转录因子和调控元件,并验证其在生物学过程中的功能。这些研究不仅加深了我们对基因组调控机制的理解,还为疾病治疗、作物改良等提供了新的思路和方法。

项目咨询

   关于我们  
武汉爱基百客生物科技有限公司(简称爱基百客),位于武汉高农生物园,是一家专业提供表观组学科研服务、单细胞与空间组学测序分析和高通量测序分析的新型生物科技服务企业。公司先后引入ChIP、WGBS、ATAC-seq、DNBSEQ-T7、10x Genomics、SeekOne® DD、DNBelabC-TaiM4和Stereo-seq等实验平台,不断提升公司的科研服务能力。

运营至今合作的科研客户超2000家,涵盖国内知名科研院所、高校以及相关生物企业,科研成果曾多次在Science、Cancer Cell、Nature Communications、J HEMATOL ONCOL、Plant Cell 等国际高水平学术期刊发表,受到了客户广泛好评,是国内成长最迅速的高通量测序科研服务企业之一。

  • 参考文献

【1】Corces, M. R., Granja, J. M., Shams, S., Louie, B. H., Seoane, J. A., Zhou, W., ... & Chang, H. Y. (2018). The chromatin accessibility landscape of primary human cancers. Science, 362(6413), eaav1898.
【2】Xin, J., Zhang, H., He, Y., Duren, Z., Bai, C., Chen, L., ... & Su, B. (2020). Chromatin accessibility landscape and regulatory network of high-altitude hypoxia adaptation. Nature communications, 11(1), 4928.
【3】Márquez, E. J., Chung, C. H., Marches, R., Rossi, R. J., Nehar-Belaid, D., Eroglu, A., ... & Ucar, D. (2020). Sexual-dimorphism in human immune system aging. Nature communications, 11(1), 751.
【4】Zhu, T., Xia, C., Yu, R., Zhou, X., Xu, X., Wang, L., ... & Xie, W. (2024). Comprehensive mapping and modelling of the rice regulome landscape unveils the regulatory architecture underlying complex traits. Nature Communications, 15(1), 6562.
【5】Zhu, Y., Ngan, H., Zhu, T., Nan, L., Li, W., Xiao, Y., ... & Yang, N. (2024). Pan-cistrome analysis of the leaf accessible chromatin regions of 214 maize inbred lines. bioRxiv, 2024-10.
【6】Xin, H., Liu, X., Chai, S., Yang, X., Li, H., Wang, B., ... & Zhang, Z. (2024). Identification and functional characterization of conserved cis-regulatory elements responsible for early fruit development in cucurbit crops. The Plant Cell, 36(6), 2272-2288.
 了 解 更 多 
{ 往 期 精 彩 回 顾 }

 精选合集,欢迎收藏哟! 

点个「在看」 天天发SCI

爱基百客生物
爱基百客是一家专业提供表观组学、单细胞与空间组学以及高通量测序分析的新型生物科技服务企业,旗下拥有DNBSEQ-T7、10xGenomics等平台,依托表观技术的优势,为生命科学研究和医疗健康等领域提供方案设计到数据分析一站式服务。
 最新文章