扫码咨询
生信人助您省心发高分
一、研究背景
选择性多聚腺苷酸化 (alternative polyadenylation, APA)是前体信使RNA (messenger RNA, mRNA)形成具有编码能力的成熟mRNA的重要加工过程,研究表明在癌症的发生发展中起着重要作用,然而目前的转录组学研究在识别癌症易感性基因时大多忽略了这一重要过程。在此背景下,该研究团队开始了相关实验。
二、实验结果
图1. 研究概述和癌症相关的全基因组关联研究(GWAS)汇总统计。
1、22种癌症类型的GWAS汇总统计图集
为了全面展现APA对人类癌症的遗传影响,该团队使用Dapars v2.0算法从GTEx项目中49个人类组织和TCGA数据集中18个肿瘤组织获得了23955个基因型匹配的RNA-seq样本,并在大型数据集中识别动态3′UTR-APA事件,并进一步使用矩阵eQTL来识别与每种组织或癌症类型中3′UTR不同的常见遗传变异类型。接着从已发表研究或公开队列的GWAS汇总结果经质控并消除潜在的混淆因素(如重复患者)后,保留了22种癌症类型的55个合理(N>50000)的GWAS汇总统计数据,用于分析。接着利用功能注释以确定前导 SNP 的位置分布以确定癌症风险。95.66% 的 GWAS 前导 SNP 在非编码区域,其中 14.78% 位于 3'UTR 和下游区域(图 1d),其中 3'UTR 区域的前导 SNP 对整个基因组表现出强烈的富集(P = 1.88 × 10−3,图 1e),这也证明了APA过程在癌症中确实发挥着重要作用。为了阐明共同遗传架构在不同癌症类型中的作用程度,该团队采用连锁不平衡分数回归 (LDSC)从 GWAS 汇总统计中计算遗传力估计结果。分析表明,遗传力因各特定癌症类型而异。为了进一步探索不同癌症类型之间的关系,该团队进行了成对遗传相关性 (rg) 分析。结果表明,22.09%的癌症对表现出显着的相关性(P = 0.05 ,Bonferroni 校正阈值)。这些数据强调了在癌症风险的背景下,在3‘UTR和下游区域探索遗传变异的重要性。此外,遗传因素有助于增加某些癌症类型的风险,同时也在生物相关之间表现出一定程度的共享遗传成分。
图2. 3‘aQTL对人类癌症性状遗传力富集的综合分析。
2、3′aQTL占据癌症遗传力的显著比例
接着该团队应用功能性全基因组关联研究(fgwas)评估APA调节变异体在人类癌症中的作用,并分析3′aQTL在癌症GWAS中的富集,结果表明3′aQTL在35.88%的重要组织-癌症对中富集。当进一步与eQTL进行比较时,发现3′aQTL的组织-癌症对具有比eQTL更大的影响,其中包括多个组织-癌症对,如前列腺癌症的全血(3′aQT富集度=1.68,95%CI:0.66–2.54,图2a)和癌症的脂肪皮下组织(3′a QTL富集度=2.16,95%CI:1.07–2.87,图2b)。对xQTL GWAS P值和全基因组SNPs的分位数-分位数图(QQ图)进一步验证了这些结果(图2c,d)。
图3. 共定位识别癌症特征相关基因。
3、3‘aQTL与GWAS癌症风险位点共定位
图4. APA转录组广泛关联研究(TWAS)结果。
4、APA全转录组分析揭示新的癌症易感基因
接着该团队利用转录组学和GWAS癌症汇总统计,来估计基因预测的APA事件与癌症风险之间的关联。该团队使用了49个GTEx组织和18个TCGA肿瘤组织的数据进行了一项多组织3′UTR-APA转录组全关联研究(3′aTWAS)。最终确定了642个APA相关易感性事件(FDR<0.05),其中62.46%被传统的基因和剪接TWAS分析忽略(图4b)。接着,该团队分析了癌症类型的鉴定基因,发现乳腺癌和前列腺癌具有最大数量的显著APA相关易感基因(图4b),这可能是由于这两种癌症类型的高度遗传性。此外,这些基因中的大部分在多种癌症类型中共同存在(图4c)。
为了进一步评估APA-连接的癌症易感基因的作用,该团队基于CRISPR-Cas9基因重要性筛选的数据确定了基因沉默对癌症相关细胞系增殖的影响(图4e、f)。并利用CERES评分来表示基因必需水平,这校正了基因靶向引导RNA的拷贝数和缺失的计算影响。结果显示,在潜在相关组织鉴定的27个APA-连接基因证明其在癌症细胞增殖中发挥着重要作用(CERES评分<-0.5)。令人惊讶的是,与众所周知的癌基因MYC48相比,其中8个基因表现出相似甚至更高水平的重要性。以上结果表明,该团队的APA转录组关联分析成功地鉴定了许多已知和新的易感基因,这些基因在多种癌症类型中具有重要意义。
5、新的APA介导乳腺癌易感基因-CRLS1
在接下来的实验中,该团队将重点放在心磷脂合成酶1(CRLS1)上,因为它在GTEx和TCGA数据的共定位和3′aTWAS分析中都得到了验证。此外,CRLS1在相关的乳腺癌基因中展现出条件独立性(图5b),这意味着APA介导的风险变体基本上能解释该基因组区域内的GWAS信号。接着通过荧光素酶报告基因测定进一步研究APA在调节CRLS1蛋白丰度中的作用,并将具有突变近端多腺苷酸化信号的较短的3′UTR和较长的3′UTR插入双荧光素素酶报告基因系统中。与含有短3′UTR的相比,含有较长3′UTR表现出更显著的萤光素酶活性。这表明,延长的3′UTR促进了CRLS1蛋白水平的升高。
接着,该团队模拟APA介导的蛋白质变化以研究CRLS1失调的表型后果。首先使用siRNA沉默CRLS1的表达,并分析其对细胞增殖的影响。与对照相比,敲低CRLS1显著抑制细胞增殖并减少集落形成。而利用shRNA耗尽CRLS1后,观察到增殖减少。这些结果与3′aTWAS分析一致,表明了CRLS1的长3′UTR增加了乳腺癌风险(乳腺组织中的Z得分=6.10)。为了进一步验证,该团队选择了其他三个排名最高的推定癌症APA相关易感基因——自分泌运动因子受体(AMFR)、RPA-相互作用蛋白(RPAIN)、自噬相关10(ATG10),并观察到这些基因的替代3′UTR改变可能影响蛋白丰度和细胞增殖的一致结果。
图6 新鉴定的APA相关癌症易感基因在代谢和凋亡相关途径中的富集通路。
6. 已知和新的APA癌症易感基因形成一致的功能途径
三、总结
APA在人类原发性癌症和癌症细胞系中非常常见,但与癌症易感基因相关的特异性APA事件和功能性遗传变异的调节机制仍然难以捉摸。该团队首次进行了一项全面调查,以了解APA介导的基因变异如何导致人类癌症风险增加。该团队通过联合转录组学与收集汇总的GWAS数据集发现并通过实验验证了CRLS1在乳腺癌中的遗传调控。这为癌症的病理学和遗传学提供了新的机制见解。日后深入研究APA连接基因无疑将为人类癌症的生物学调控和疾病病因提供更多的线索。更多详情还请大家移步原文,仔细品鉴。
生信人助您省心发高分
1、临床医生科研规划
4、R语言入门
概普生物 让科研丰富