二区发文新方向:多聚腺苷酸化APA-qtl

学术   2024-11-30 07:03   北京  
今天给各位介绍这一篇近期发表在Nature Communications上的文章,该团队利用55个庞大(n>50000)的全基因组研究数据集和7574个个体的23955个RNA测序样本,共同探究选择性多聚腺苷酸化在发现新的癌症易感性基因中的重要作用。究竟怎么样,我们一起看看吧!


APA个性化方案设计
扫码咨询

生信人助您省心发高分

一、研究背景

选择性多聚腺苷酸化 (alternative polyadenylation, APA)是前体信使RNA (messenger RNA, mRNA)形成具有编码能力的成熟mRNA的重要加工过程,研究表明在癌症的发生发展中起着重要作用,然而目前的转录组学研究在识别癌症易感性基因时大多忽略了这一重要过程。在此背景下,该研究团队开始了相关实验。


二、实验结果

图1. 研究概述和癌症相关的全基因组关联研究(GWAS)汇总统计。


1、22种癌症类型的GWAS汇总统计图集

为了全面展现APA对人类癌症的遗传影响,该团队使用Dapars v2.0算法从GTEx项目中49个人类组织和TCGA数据集中18个肿瘤组织获得了23955个基因型匹配的RNA-seq样本,并在大型数据集中识别动态3′UTR-APA事件,并进一步使用矩阵eQTL来识别与每种组织或癌症类型中3′UTR不同的常见遗传变异类型。接着从已发表研究或公开队列的GWAS汇总结果经质控并消除潜在的混淆因素(如重复患者)后,保留了22种癌症类型的55个合理(N>50000)的GWAS汇总统计数据,用于分析。接着利用功能注释以确定前导 SNP 的位置分布以确定癌症风险。95.66% 的 GWAS 前导 SNP 在非编码区域,其中 14.78% 位于 3'UTR 和下游区域(图 1d),其中 3'UTR 区域的前导 SNP 对整个基因组表现出强烈的富集(P = 1.88 × 10−3,图 1e),这也证明了APA过程在癌症中确实发挥着重要作用。为了阐明共同遗传架构在不同癌症类型中的作用程度,该团队采用连锁不平衡分数回归 (LDSC)从 GWAS 汇总统计中计算遗传力估计结果。分析表明,遗传力因各特定癌症类型而异。为了进一步探索不同癌症类型之间的关系,该团队进行了成对遗传相关性 (rg) 分析。结果表明,22.09%的癌症对表现出显着的相关性(P = 0.05 ,Bonferroni 校正阈值)。这些数据强调了在癌症风险的背景下,在3‘UTR和下游区域探索遗传变异的重要性。此外,遗传因素有助于增加某些癌症类型的风险,同时也在生物相关之间表现出一定程度的共享遗传成分。

图2. 3‘aQTL对人类癌症性状遗传力富集的综合分析。


2、3′aQTL占据癌症遗传力的显著比例

接着该团队应用功能性全基因组关联研究(fgwas)评估APA调节变异体在人类癌症中的作用,并分析3′aQTL在癌症GWAS中的富集,结果表明3′aQTL在35.88%的重要组织-癌症对中富集。当进一步与eQTL进行比较时,发现3′aQTL的组织-癌症对具有比eQTL更大的影响,其中包括多个组织-癌症对,如前列腺癌症的全血(3′aQT富集度=1.68,95%CI:0.66–2.54,图2a)和癌症的脂肪皮下组织(3′a QTL富集度=2.16,95%CI:1.07–2.87,图2b)。对xQTL GWAS P值和全基因组SNPs的分位数-分位数图(QQ图)进一步验证了这些结果(图2c,d)。

图3. 共定位识别癌症特征相关基因。

3、3‘aQTL与GWAS癌症风险位点共定位

为了系统地研究癌症GWAS风险位点是否与3 'aQTLs具有相同的因果变异,我们使用coloc进行了共定位分析。结果表明,17 种癌症类型的 34 种GWAS 癌症特征都与至少一种类型的分子 QTL 共定位(图 3a)。在此基础上,进一步确定了与GWAS癌症风险位点共定位的766个eQTL、560个 sQTLs和250 个3 ' aQTLs(图3b)。与之前的研究一致,在包括结直肠癌和淋巴瘤在内的多种癌症类型的长非编码RNA中观察到很大一部分共定位(图3b)。其中3′aQTL、eQTL和sQTL共定位在GWAS风险基因占比中位数分别为28.57%、44.74%和35.36%(图3c–e)。如在TCGA数据集中观察到的,3′aQTL与GWAS癌症风险基因共定位,且这些3′aQT中的很大一部分独立于eQTL和sQTL发生。这再次证明了已鉴定的3′aQTL可能包含癌症因果风险变异。除此之外,在许多癌症类型中,3′a基因在很大程度上不同于e基因和s基因。

图4. APA转录组广泛关联研究(TWAS)结果。


4、APA全转录组分析揭示新的癌症易感基因

接着该团队利用转录组学和GWAS癌症汇总统计,来估计基因预测的APA事件与癌症风险之间的关联。该团队使用了49个GTEx组织和18个TCGA肿瘤组织的数据进行了一项多组织3′UTR-APA转录组全关联研究(3′aTWAS)。最终确定了642个APA相关易感性事件(FDR<0.05),其中62.46%被传统的基因和剪接TWAS分析忽略(图4b)。接着,该团队分析了癌症类型的鉴定基因,发现乳腺癌和前列腺癌具有最大数量的显著APA相关易感基因(图4b),这可能是由于这两种癌症类型的高度遗传性。此外,这些基因中的大部分在多种癌症类型中共同存在(图4c)。


为了进一步评估APA-连接的癌症易感基因的作用,该团队基于CRISPR-Cas9基因重要性筛选的数据确定了基因沉默对癌症相关细胞系增殖的影响(图4e、f)。并利用CERES评分来表示基因必需水平,这校正了基因靶向引导RNA的拷贝数和缺失的计算影响。结果显示,在潜在相关组织鉴定的27个APA-连接基因证明其在癌症细胞增殖中发挥着重要作用(CERES评分<-0.5)。令人惊讶的是,与众所周知的癌基因MYC48相比,其中8个基因表现出相似甚至更高水平的重要性。以上结果表明,该团队的APA转录组关联分析成功地鉴定了许多已知和新的易感基因,这些基因在多种癌症类型中具有重要意义。

图5.乳腺癌APA相关易感基因。


5、新的APA介导乳腺癌易感基因-CRLS1

在接下来的实验中,该团队将重点放在心磷脂合成酶1(CRLS1)上,因为它在GTEx和TCGA数据的共定位和3′aTWAS分析中都得到了验证。此外,CRLS1在相关的乳腺癌基因中展现出条件独立性(图5b),这意味着APA介导的风险变体基本上能解释该基因组区域内的GWAS信号。接着通过荧光素酶报告基因测定进一步研究APA在调节CRLS1蛋白丰度中的作用,并将具有突变近端多腺苷酸化信号的较短的3′UTR和较长的3′UTR插入双荧光素素酶报告基因系统中。与含有短3′UTR的相比,含有较长3′UTR表现出更显著的萤光素酶活性。这表明,延长的3′UTR促进了CRLS1蛋白水平的升高。


接着,该团队模拟APA介导的蛋白质变化以研究CRLS1失调的表型后果。首先使用siRNA沉默CRLS1的表达,并分析其对细胞增殖的影响。与对照相比,敲低CRLS1显著抑制细胞增殖并减少集落形成。而利用shRNA耗尽CRLS1后,观察到增殖减少。这些结果与3′aTWAS分析一致,表明了CRLS1的长3′UTR增加了乳腺癌风险(乳腺组织中的Z得分=6.10)。为了进一步验证,该团队选择了其他三个排名最高的推定癌症APA相关易感基因——自分泌运动因子受体(AMFR)、RPA-相互作用蛋白(RPAIN)、自噬相关10(ATG10),并观察到这些基因的替代3′UTR改变可能影响蛋白丰度和细胞增殖的一致结果。

图6 新鉴定的APA相关癌症易感基因在代谢和凋亡相关途径中的富集通路。


6. 已知和新的APA癌症易感基因形成一致的功能途径

最后,为了研究确定的APA-连接易感基因是否通过相同的网络或途径与已知的癌症基因连接,该团队从文献、遗传和表观遗传学特征(DORGE)、癌症基因普查(CGC)和分子特征数据库(MSigDB)发现癌基因和抑癌基因中获取了其在公开可用的癌症相关基因集中的存在。并使用STRING 测量基因产物与已知癌症敏感蛋白之间的蛋白质-蛋白质相互作用(PPI)网络连接。结果表明,3′aTWAS优先PPI网络的成员对关键的生物途径表现出显著的富集(图6)。这些途径包括细胞内蛋白质转运(P=1.13×10−2),这是癌症进展和适应新环境过程中参与代谢重组的关键过程。此外,分析显示APA相关易感基因在与细胞凋亡和坏死相关的途径中富集,如细胞凋亡的执行阶段(P=8.75×10−4)和TRAIL信号传导(P=6.07×10−3),这与肿瘤的发生发展至关重要。以上结果表明,研究中确定的新候选基因广泛参与了与癌症至关重要的基因网络。更令人新奇的是,新的癌症敏感基因与已知的癌症基因(如TP53和BRCA1/2)形成了一致的功能途径,这表明这些新基因可能在癌症风险预测中发挥着重要作用。

三、总结

APA在人类原发性癌症和癌症细胞系中非常常见,但与癌症易感基因相关的特异性APA事件和功能性遗传变异的调节机制仍然难以捉摸。该团队首次进行了一项全面调查,以了解APA介导的基因变异如何导致人类癌症风险增加。该团队通过联合转录组学与收集汇总的GWAS数据集发现并通过实验验证了CRLS1在乳腺癌中的遗传调控。这为癌症的病理学和遗传学提供了新的机制见解。日后深入研究APA连接基因无疑将为人类癌症的生物学调控和疾病病因提供更多的线索。更多详情还请大家移步原文,仔细品鉴。

APA个性化方案设计
扫码咨询

生信人助您省心发高分



最新文章汇总(持续更新ing)


最新热点方向

1、今天开心,安利一个超好发版干湿结合思路

2、掌握孟德尔随机化发20分不是梦

3、研究中草药难发SCI?

4、公开数据纯分析发7+,内容不卷赢在选题

5、人手一篇的“淋巴转移”,摇身一变50+


生信人课堂

1、临床医生科研规划

2、热点基因集预后实操课程

3、孟德尔随机与基因组

4、R语言入门


课题设计 | 生信分析 | 数字产品

概普生物 让科研丰富

生信人

专注于基因技术相关知识分享
扫码关注 获取更多






END





生信人
共同学习生物信息学知识,共同探究生物奥秘。
 最新文章