【Nature Communications】干湿结合5张图拿下!泛癌研究IF14.7还得看深圳湾实验室李磊课题组!

文摘   2024-07-15 19:01   山东  

大家好!专为大家提供前沿科研讯息、生信思路分析辅助的船长又来啦~ 不知道大家会不会觉得生信数据太多不知从何下手?船长最近在看文的时候发现了一篇泛癌好文,仅仅5张图就完成了成果汇报,拿下了Nature Communications!

泛癌是什么?泛癌是指通过癌症基因组学和转录组学对多种癌症类型或亚型进行整合分析,以识别这些类型中的共同特征,如基因、生物标志物、通路等特征。随着全球癌症率逐年上升,对于相关遗传因素与机制的研究就愈发重要。而深圳湾实验室系统与物理生物学的李磊课题组就抓住了这个热点对泛癌选择性多聚腺苷化进行了分析。

组学分析,泛癌,涉及到这俩领域时少不了大规模数据的参与,想想就头大。然而,李磊课题组巧妙地汇总了所有的数据,还将新旧发现进行了整合。从头至尾这篇研究都非常的有参考意义,废话不多说,大家快和船长一起学习吧!ps:还在担心实验思路不精彩?生信分析不会做?数据不会处理?船长来帮你!扫码添加船长微信,免费付费服务应有尽有,发文再也不用愁!

题目:选择性多聚腺苷酸化转录组全关联研究揭示了一类独特的泛癌易感基因

杂志:Nature Communications

影响因子:IF=14.7

发表时间:2024年2月

定制生信分析

云服务器租赁

加好友备注“99”领取试用

后台回复321获取原文献,文献编号20240717

研究背景

全基因组关联研究(GWAS)是一种使用高通量基因组学组学探索人类全因组内的疾病相关多核苷酸多态(SNP)的方法。目GWAS已帮助我们识别了上百个与癌症相关的风险,这对我们更好的理解癌症遗传和肿瘤发生机制提供新的见解。但是,这些变异中有超过90%都处在人类基因组的非编码区域,而许多疾病的非编码变异体目前仍然未被破译。选择性多聚腺苷酸化(APA)是一个非常重要的癌症发展过程,但在过往GWAS中常被忽略。APA涉及利用不同的多聚腺苷酸化位点产生具有不同3′非编码区(UTR)长度的mRNA异构体。这些 3′UTR 变化与mRNA表达水平或剪接模式无关,但能够影响基因的调控。与APA相关的SNP在疾病易感性中具有潜在影响。因此,该研究为了唤起APA在癌症遗传学中被低估的影响力,对APA以及涵盖22种主要癌症类型的GWAS数据集进行整合并全面分析。

研究思路

该研究首先整合了从文献、UK Biobank、FinnGen以及JENGER中收集的GWAS数据,并在确保纳入了足够的样本量后进行质量控制。在将数据与 hg19/GRCh37 组装统一后,该研究利用 PLINK 聚类确定了先导 SNP,并使用 dbSNP147 进行了SNP注释并利用 LDSC 对SNP 遗传率和遗传相关性进行了估算;利用fgwas 和 LD 回归对分子 QTL 进行了富集分析。并且为了评估GWAS和QTL关联的重叠性,使用FUSION进行APA的TWAS进行了共定位测试。此外,该研究还进行了双荧光素酶报告基因检测、RACE、细胞增殖实验,以及使用CRISPR-Cas9进行的基因沉默研究以验证结果。最后,该研究利用STRING分析通路富集和蛋白质相互作用开发了癌症GWAS数据库(TCGD)。计算下图为作者的研究思路:

       

数据来源

数据集/队列

数据库

数据类型

详细信息

GTEx

dbGaP (Genotype-Tissue Expression project)

原始全转录组和基因组测序数据

Accession number: phs000424.v8.p2.24,已处理数据可通过GTEx门户网站获取 (http://gtexportal.org/)

TCGA            

GDC Data Portal,Xena 2

RNA-seq和基因型数据,表达数据

公开的RNA-seq和基因型数据可通过GDC数据门户获取 (https://portal.gdc.cancer.gov/),表达数据可通过Xena Hub (https://tcga.xenahubs.net) 获取

TC3A

TC3A

PDUI数据

PDUI数据可通过TC3A (http://tc3a.org) 获取

NHGRI–EBI GWAS Catalog,UK Biobank GWAS,Finn Gen,JENGER

NHGRI–EBI GWAS Catalog,UK Biobank,Finn Gen,JENGER

GWAS汇总统计数据

GWAS汇总统计数据可通过NHGRI–EBI GWAS Catalog (https://www.ebi.ac.uk/gwas/) ,UK Biobank GWAS (http://www.nealelab.is/uk-biobank/),Finn Gen (https://www.finngen.fi/en)以及JENGER (http://jenger.riken.jp)获取

LDSC 1000 Genomes Project Reference

Broad Institute LDSCORE

LDSC参考数据

LDSC参考数据可通过Broad Institute网站获取 (https://data.broadinstitute.org/alkesgroup/LDSCORE/)

GTEx v8 TWAS models            

PredictDB

表达和剪接TWAS模型

GTEx v8的表达和剪接TWAS模型可通过PredictDB (https://predictdb.org/) 获取

  

主要结果

1.3′aQTL解释了大部分癌症遗传性

该研究为了评估3′aQTL对癌症遗传性的影响,利用fgwas发现3′aQTLs显著富集于35.88% 的组织-癌症配对中的癌症相关基因组区。其中,相比于eQTLs,在18.82%的配对中3′aQTLs具有更大的影响效应,比如能在全血中影响前列腺癌或在皮下脂肪组织中影响乳腺癌。该研究还使用S-LD score进行了分割遗传力分析,发现3′aQTL对癌症遗传性的贡献略低sQTLs。在全血和脂肪组织中的3′aQTLs对乳腺癌、前列腺癌、皮肤癌和基底细胞癌等各种癌症都表现出出富集关联。总之, 3′aQTLs在塑造癌症易感性遗传结构中具有重要的调控作用,特别是在特定组织背景下。

图1 对富集对不同组织人类癌症性状遗传性的3′aQTL综合分析

2.3′aQTLs与癌症GWAS风险位点共定位并独立于基因表达和剪接QTL

该研究利用coloc39分析发现3′aQTLs与包括17种癌症类型的34哥GWAS特征显著相关。其中,766个eQTLs,560个sQTLs和250个3′aQTLs与GWAS风险定位点共定位,并且大部分与非编码RNA有关。且共定位多与3′aQTLs有关,而非eQTLs或sQTLs。比如CASP8基因仅其3′aQTLs与GWAS风险位点产生共定位。随后进行的通路分析则表明3′a 基因富集于与线粒体蛋白质定位相关的通路中,而 e 基因和 s 基因则富集于与 DNA 损伤修复和染色质组织相关的通路中。该研究还进行了精细映射分析,结果显示3′aQTLs提高了癌症GWAS可信集的遗传分辨率。此外,对3′a基因进行序列分析还发现其与e和s基因相比有着不同的特征,如较短的编码区和较长的3'UTR。这个特征的特异性则表明3′a基因可能通过加强转录后调控而发挥其潜在的调控作用。上述发现均表明3′aQTLs代表了一种与癌症GWAS风险位点相关的新型调控变异。并且和传统的e或sQTLs不同的是可能在多种癌症类型的进展和易感种有着关键作用。

图2 共定位识别癌症性状相关基因

3.APA 转录组关联分析揭示新型癌症易感基因

该研究利用来自49个GTEx组织和18个TCGA肿瘤组织数据建立了可用于预测APA与癌症风险关联的模型。通过将建立的模型运用在癌症GWAS摘要数据上,该研究识别了642个APA相关易感事件,而其中一部分在常规基因和剪接TWAS分析中被忽略。值得强调的是,其中47个基因同时也被3′aTWAS分析和共定位分析识别,表明了与癌症风险的高度相关。在包含的所有癌症类型中,乳腺癌和前列腺癌有着最多的APA相关易感基因,表明了他们的高度遗传特性。许多被识别的基因也被多种癌症涉及,强调了他们的广泛性。该研究还进行了CRISPR-Cas9以验证相关基因的功能,发现一些APA基因在癌症增值中有着重要作用。总而言之,这些受APA影响的已知和新癌症易感基因为理解癌症发展机制提供了新的见解。

图3 3′UTR APA 与多种组织和癌症中的癌症易感基因相关

4.CRLS1 是一种新型 APA 介导的乳腺癌易感基因

通过对GTEx和TCGA数据集进行共定位和3′aTWAS分析,该研究确定了磷脂酰肽合成酶 1(CRLS1)是一个受APA调节的新的乳腺癌易感基因。CRLS1的长3′UTR在3′aQTL替代等位基因(rs2235816 G>A)中被高度表达,而在MCF-7乳腺癌细胞中发现的cDNA末端快速扩增技术 (RACE)实验验证了这个发现。该研究还进行了荧光素酶报告基因系统对结果进行进一步研究,发现CRLS1的长3′UTR变体导致了蛋白质水平升高。这表明APA对CRLS1蛋白丰度有调节作用。除此以外3′aQTL的替代等位基因增强了荧光素酶信号,这也表明对蛋白质水平的提高。该研究还发现rs2235816位于CSTF2(切割刺激因子2)的结合位点内,可能也参与了CRLS1的生物调控。CRLS1的静默被发现能显著抑制细胞增殖和集群生成,这与其3′UTR变体能增加乳腺癌风险的假设一致。

图4 受APA介导的CRLS1 的 3′UTR 使用与乳腺癌易感有关

5.已知和新的癌症易感性 APA 基因形成连贯的功能通路

最后,该研究将本次识别的新癌症易感相关的APA介导基因整合进已知的癌症途径,形成了连贯的功能通路。通过对DORGE、CGC和MSigDB等公共数据集和数据库进行分析,该研究确定了60个癌症基因,涵盖了如乳腺癌、基底细胞癌、宫颈癌、结肠直肠癌、肺癌、淋巴瘤、卵巢癌、前列腺癌和皮肤癌等癌症类型。随后,该研究利用STRING发现这些APA介导基因形成了含关键生物途径的强大网络,包括如细胞内蛋白质运输等重要途径,涉及如代谢重编程,细胞凋亡等关键机制。这些APA介导易感基因表达出与已知的癌症基因如TP53和BRCA1/2的高度一致性,强调了在癌症生无需额中的重要功能角色。

图4 APA介导的基因在代谢重编程和细胞凋亡通路中高度富集,并与多类已知癌症风险基因有关

文章小结

该研究主要关注APA对不同基因3‘UTR长度的调控。通过对包含了22种主要癌症类型的GWAS数据集进行分析,该研究发现了APA在癌症遗传学种被低估的作用并与癌症风险紧密相关。此外,该研究还发现了新的癌症易感基因,并将这些新发现的基因路径与已知癌症途径进行整合,为未来研究提供了框架。通过计算生物以及疾病基因组学对高通量临床相关数据进行分析整合正是这篇文章的出彩之处,李磊课题组甚至还建立了一个公开数据库供其他科研人员参考使用,简直锦上添花诚意满满~ 想要设计出同样精彩的研究?拿到数据不知道怎么上手?需要公开数据库链接?船长统统拿下!扫码添加船长微信,更多学习资源、免费思路设计、付费生信分析不错过,还有服务器租赁等服务着你~

船长寄语


船长可以为您提供以下服务哦:评估思路(免费)、生信分析、方案设计、服务器租赁、特色数据库搭建等!欢迎大家扫码咨询,有问必答!

生信分析

思路设计

服务器租赁

扫码咨询船长

往期推荐



1、要想发高分,dirty work少不了!DNA甲基化结合多组学和单细胞转录组,只需一点实验就拿下了1区9.1分!
2、可是导师,人生是旷野!仅凭单细胞转录组拿下14.7分的Nature Communications什么水平!
3、2024如果你考虑cell旗下的杂志,这30本支持一稿多投!
4、双热点又来镇场子啦!西南医科大学结合铁死亡+铜死亡+整合单细胞数据直接拿下Q1区SCI,换个方向就能复现!

         

 

   

生信海
怕错过生信热点?来生信海,船长日更不落伍!船长擅长思路设计、个性化生信分析、高分文献复现、特色数据库搭建等,欢迎来撩~
 最新文章