可变剪切的失调与许多人类疾病密切相关,了解转录物剪切的遗传变异对解析癌症的分子机制至关重要。因此,可变剪切也是癌症研究的热点方向。生信人早在四五年前就开始推出可变剪切相关的分析思路及方法。小编今天再和大家分享一篇23年11月发表在GASTROENTEROLOGY(IF:29.4/Q1)杂志上关于可变剪切的文章。该文章全面分析了剪切数量性状位点(sQTLs)在癌症中的功能,并重点分析了其在结直肠癌(CRC)中的独特作用机制。时隔几年可变剪切仍能发30分,可见可变剪切热度不减。长话短说,小编今天就带大家一睹为快。
生信人助您省心发高分
一.文章摘要
研究对TCGA泛癌样本进行了全面的sQTL分析,识别出33种癌症中控制信使RNA剪切的遗传变异,并对154例结直肠癌(CRC)样本进行了独立验证。此外,研究也纳入了大规模、多中心、多种族的病例对照样本,对识别的关键sQTIL与CRC风险的相关性进行分析。最后研究也进行了一系列体外和体内生物学实验,分析并验证候选sQTL和靶基因的潜在机制。最终研究揭示了sQTL的分子特征及其在肿瘤易感性中的独特作用。
二.文章的主要内容及结果
1.33种癌症剪切数量性状位点图谱的功能特征
研究首先在泛癌中分析了sQTL的功能特征。研究使用TCGA数据,识别了33种癌症的9026例肿瘤样本中的168,694个可变剪切(AS)事件和4,599,598个sQTL(图1A)。研究观察到随着样本量的增加,剪切事件和sQTL的数量也稳步增加(图1B),这意味着新的剪切事件和sQTL仍有待发现。研究也观察到癌症特异性的sQTL-AS对占总对数的51.86%,这意味着它们在不同癌症中具有独特的调节作用(图1C)。研究通过位置富集分析也观察到sQTL在外显子区域显著富集(图1D)。研究也注释了sQTL在不同调控层面的分子特征,结果发现在启动子和增强子等调控区域sQTL显著富集(图1E)。在本分析中包含的所有研究分析了59个转录因子(TF),观察到NRF1、MYC和MNT优先结合sQTL(图1F)。研究也观察到sQTL在RNA结合蛋白(RBPs)的结合位点富集(图1G)。此外,研究也发现只有16.8%的sQTL影响整体基因表达(图1I),表明基因表达和剪切事件的独立调控。此外,多种癌症中表达数量性状位点(eQTL)和sQTL在GWAS信号中都便显出了过量的低P值(图1I)。研究也发现在检测的13个性状中,sQTL和eQTL分别解释了约0.37%-9.47%和1.01%-8.78%的遗传力(图1J)。
图1 33种人类癌症类型sQTL的识别和功能刻画
2.sQTL靶向基因增强了对生物学过程的解释
研究接着对sQTL的靶基因进行了分析刻画。研究识别了sQTL的靶基因(sGenes),并观察到其在多种癌症相关通路(图2A)和突变基因(图2B)中富集。sGenes还被发现具有大量的扩增和缺失负荷(图2C)。此外,研究也观察到sGene的表达与CD8+ T细胞和调节性T细胞等免疫细胞的浸润密切相关(图2D)。研究也基于药物敏感性基因组学数据识别了29,924对sGene-drug(图2E)。
图2 sGenes的特征分析
3.中国结直肠癌患者剪切数量性状位点分析
研究接着对结肠癌的sQTL进行了重点分析。研究收集了来自中国人群的154个结直肠肿瘤和配对正常组织,并构建了首个sQTL图谱(图3A)。研究识别出11个优先结合到含有sQTL区域的RBPs,其中包括几个剪切因子(图3B)。研究也观察到肿瘤组织中多数sQTLs与eQTLs具有显著差异(图3C),且eQTLs与影响同一基因的sQTLs之间的距离较大(图3D)。此外,这两类QTL也在CRC的GWAS中表现出了过量的低P值(图3E)。研究也发现了32个在肿瘤特异性sQTL中富集更强的RBPs(图3F),这些sQTL也在CRC中显著上调(图3G)。此外,研究还观察到与正常特异性sQTL相比,亚洲人群中CRC相关变异富含CRC特异性sQTL(图3I)。研究也观察到使用eQTL或sQTL PRS的风险分层更好(图3J)。
图3 中国结直肠癌患者sQTL谱的验证
4.剪切数量性状位点变异rs61746794与多人群结直肠癌风险显著相关
研究接着分析了与CRC风险显著相关的sQTL。文章首先将sQTL(图4A)与CRC风险的关联进行整合,结果发现了与结直肠癌风险最显著相关的位点rs61746794(表1和图4B)。研究接着将rs61746794在来自北京的1524例和1522例对照以及来自前列腺、肺癌、结直肠癌和卵巢癌筛查试验的1233例和7398例对照中进行进一步的I期复制,并发现T等位基因与CRC风险增加显著相关。在复制II阶段,研究也在来自武汉的4500例病例和8500例对照以及来自英国生物银行的5246例病例和31476例对照中验证了这种显著相关性。最后,研究将发现和复制阶段的结果结合起来,发现rs61746794[TT]基因型仍与亚洲和欧洲人群中CRC风险增加相关(表1)。
表1 个体单核苷酸多态性与三期及联合样本结直肠癌风险的相关性分析
5.剪切数量性状位点变异rs61746794 T等位基因促进PRPF8介导的PRMT7外显子16剪切
研究接着对rs61746794 T等位基因相关外显子进行了分析。研究根据Ensembl数据库(GRCh37)的注释和TCGA SpliceSeq的分析结果,观察到人类PRMT7基因模型共包含20个外显子,主要可以拼接成28个转录本。其中有6个转录本参与AA_exon 16剪切事件,分别记为PRMT7-V1至PRMT7-V6(图4C)。研究接着发现rs61746794的T等位基因与TCGA和该研究数据中PRMT7外显子16的替代受体位点密切相关(图4D和E)。研究也发现当rs61746794-C等位基因转变为T等位基因时,PRMT7外显子16受体位点产生了更强的信号(图4F和G)。
图4 rs61746794可能改变CRC中PRMT7外显子16剪切的功能性sQTL
接着研究试图分析rs61746794等位基因特异性活性的潜在机制。根据ENCORI数据库结果研究发现PRPF8特异性结合PRMT7-V1和PRMT7-V2中含有rs61746794的区域(图5A)。此外,研究使用RBP免疫沉淀和RNA拉下实验验证了PRPF8与rs61746794-C相比,主要结合在rs61746794-T区域(图5B和C)。多个数据集中也都观察到与正常组织相比,PRPF8在肿瘤组织中显著过表达(图5D)。研究也在TCGA和自己的数据中观察到,PRPF8的表达与CRC中外显子16.1的包含水平呈负相关(图5E)。此外,PRPF8的表达水平与PRMT7- v1的表达呈负相关,而与PRMT7- v2的表达在群体(图5F)和细胞系中呈正相关。研究也观察到PRPF8的敲低会导致PRMT7外显子16的剪切信号显著减弱(图5G和H)。
图5 PRPF8优先结合rs61746794-T等位基因,促进致癌PRMT7剪切
6.PRMT7亚型通过催化H4R3和H3R2甲基化增加结直肠癌的风险
文章最后分析了PRMT7亚型增加CRC风险的机制。研究发现MT7作为一个潜在的致癌基因能够促进CRC的进展(图6A和B),与正常组织相比PRMT7_AA_16.1的剪切百分比在肿瘤组织中也显著下调(图6C),这表明外显子16.1的剪切可能与CRC的发展有关。因此,研究通过实验验证发现与PRMT7- v1或对照载体相比,PRMT7-V2过表达会显著增强细胞增殖和集落形成能力(图6D和E)。研究也观察到在体内过表达PRMT7-V2的异种移植物的生长明显高于PRMT7- v1和对照(图6F)。此外,与PRMT7- v1过表达的细胞相比,研究在PRMT7- v2过表达的细胞中识别了72个显著差异的甲基化肽,代表49种独特的蛋白质,其中包括组蛋白H3(R9)和H4(R20)肽的甲基化信号(图6G和H)。研究通过实验检测到已知的PRMT7底物,如DDX23和CALM3,并观察到PRMT7-V2过表达细胞中H3R2me2s和H4R3me2s的修饰均有所增加,但H3和H4未见明显变化(图6I)。为了进一步确定prmt7依赖性组蛋白甲基化的转录调控作用,研究进行了RNA测序,结果显示经典致癌信号通路中基因的转录发生了广泛的变化,包括YAP、AKT和KRAS通路(图6J和K)。
到这里文章的主要内容就介绍完了。文章首先全面分析了泛癌中剪切数量性状位点(sQTLs)的特征及功能,并通过生信及实验分析重点探索了其在结直肠癌(CRC)中的独特作用机制。总之,该文章聚焦可变剪切,从泛癌入手逐渐聚焦关键癌型及关键事件,从公共数据分析筛选,对关键结果进行多种验证,逻辑清晰,内容丰富,十分值得小伙伴们参考。
更多个性化方案设计
扫码咨询
生信人助您省心发高分
1、临床医生科研规划
4、R语言入门
概普生物 让科研丰富