带你玩转不一样的可变剪切新思路

学术   2025-01-01 16:07   北京  

提起可变剪切,公众号的粉丝们可能不会太陌生。19年的时候还给大家总结了可变剪切的一系列发文(点击查看原文),这些文章都是基于剪切百分比值(PSI)做的研究。与之前研究可变剪切思路不同,今天的思路是从两个与可变剪切息息相关的基因家族为切入点 :异质核核糖核蛋白(hnRNP)家族、富含丝氨酸/精氨酸 (SR) 剪接因子家族


首先给大家科普下相关知识:

  • 可变剪接(AS)

也叫选择性剪接,广泛存在于真核生物细胞内,AS从共同的基因产生多种不同RNA转录本以及结构相似的蛋白亚型,是遗传物质多样化表达的代表方式。AS在肿瘤发生、发展中起重要作用。对比正常组织,肿瘤样本存在广泛的AS事件。异常的AS体可通过抑制凋亡、促进耐药、促进DNA损伤修复、推进细胞周期循环等多种途径促进肿瘤的发生发展。


  • 异质核核糖核蛋白(hnRNP)家族

是高等真核生物中含量最丰富的核蛋白,是一类RNA结合蛋白。HnRNPA/B亚家族是hnRNPs的核心成员,与癌症的发生和发展密切相关。研究表明HnRNPA/B在多种肿瘤中高度表达,被确定为一种有前途的癌症生物标志物。HnRNPA/B促进肿瘤细胞的各种生物学过程,包括增殖,迁移和侵袭。


hnRNPA2/B1 在癌症中的代表性分子机制

  • 富含丝氨酸/精氨酸 (SR) 剪接因子家族
SRs的异常表达与肿瘤发生之间的关系主要是由于关键基因的可变剪接模式改变决定的。SRs的异常表达常导致上皮-间充质转化、转移和血管生成等癌相关过程的改变。SR蛋白在癌细胞扩增,凋亡等过程中发挥的关键作用。

SRs与癌症发生发展


可变剪切新思路

扫码咨询


那么接下来我们就看来看研究是如何展开分析的:

Journal of Translational Medicine;IF:8.440



研究对象

急性白血病(AML)中异质核核糖核蛋白家族(hnRNPs)、富含丝氨酸/精氨酸 剪接因子家族(SRs)的32个可变剪切因子。

数据队列
训练集:TCGA-LAML、GTEx
验证集:GSE14468, GSE37642-GPL96, GSE37642- GPL570, GSE71014

主要结果

1、hnRNP和SR家族的32个可变剪切因子(SF)遗传变异景观
  • 大部分SFs(27)在AML和normal样本间存在异常表达(热图A)
  • 32个SFs呈现低的突变频率(突变瀑布图B)
  • 32个SFs的拷贝数变异频率展示,eg.HNRNPU拷贝数扩增表达增加(棒棒糖图C)
  • 32个SFs的染色体物理位置展示(圈图D)


2、受hnRNP和SR家族的32个可变剪切因子介导的剪切调控模式
  • 为了更好的识别SFs与AML生物学过程的关联,使用SFs对AML样本进行了无监督聚类,将AML分成了4个亚型(consensus matrix 热图A;验证SFs的聚类结果t-SNE散点图B)
  • 4个不同的AML可变剪切亚型间SFs的表达差异,cluster-A的SFs表达普遍较低(热图C)
  • 4个不同的AML可变剪切亚型间生存差异,cluster-D类预后最好,cluster-C则相反(K-M曲线图D)
  • 每个SF在AML不同可变剪切亚型间表达也呈现出显著差异(箱线图E)
  • 4个不同的AML可变剪切亚型间的突变差异,B组的突变频率更高现(突变瀑布图E)


3、不同AML剪切调控模式的生物学特征差异
  • 4个不同AML可变剪切亚型间KEGG信号通路、肿瘤相关hallmark 基因集GSVA分析,eg.cluster-A有更高的免疫反应富集,不同的剪切模式在生物学过程、免疫学特性、临床病理因素等方面存在明显差异(聚类热图A、B)
  • 4个不同的AML可变剪切亚型间可变剪切事件(AS)差异,与其它亚型相比cluster-A差异的AS最多(韦恩图C;热图D)
  • cluster-A可变剪切亚型AS事件主要为AP(可变启动子)和AT(可变终止子)(upset图E)
  • 对于cluster-A中的 AS事件对应的209个基因进行了KEGG通路富集分析,主要与RNA转运等通路相关(和弦图F)


4、不同AML剪切调控模式的免疫相关特征差异及潜在用药预测
通路富集分析表明不同剪接调控模式免疫相关通路存在显著差异。因此,进一步分析了模式之间的免疫细胞浸润、免疫功能活性和免疫检查点表达差异。

  • 发现cluster-C富集了更多的炎性免疫细胞eg.M2巨噬细胞,CD8 + T细胞则最低(箱线图A)
  • cluster-A呈现了更高的抗原呈递细胞共刺激分子(APC)等免疫功能特征(箱线图B)
  • 免疫检查点差异表达分析显示,cluster-A中HAVCR2等表达水平显著高于其他亚群(箱线图C)
  • 不同剪切调控模式与AML常用治疗药物的敏感性分析发现cluster-D对阿糖胞苷有更高的敏感性(箱线图D)
  • 不同AML剪切调控模式中cluster-C对抗PD-1免疫治疗更有效(submap分析热图D)


5、构建和验证可变剪切相关的预后风险评分模型
不同可变剪切模式有不同的病理学特征和治疗方式,cluster-A、B间SFs表达差异最大,cluster-C、D间预后差异最大,因此筛选了cluster-A、B 和cluster-C、D分别间的差异基因(与SFs和AML预后相关相关的基因)

  • cluster-A、B 和cluster-C、D差异基因交集,被认为是与SFs和AML预后相关相关的基因(韦恩图A)
  • 基于cox回归筛选预后相关的因子(森林图B)
  • Lasso回归分析确定最终构建模型因子(lasso系数路径图C;lasso交叉验证曲线D)
  • 预后风险评分模型的预测效能(K-M曲线图E;ROC曲线)
  • 单因素和多因素cox回归确定后风险评分能作为AML的独立预后因子(森林图G-H)
  • 风险评分与剪切模式、生存状态之间的关联(冲积图I;箱线图J)


6、预后风险评分模型的验证以及构建列线图以预测AML的整体生存期
  • 基于GEO的四个验证队列对可变剪切相关风险预后模型预测效能进行了独立数据集验证(K-M曲线图A-D;ROC曲线图E-H)
  • 为了更准确的预测AML的OS,结合临床病理特征构建了列车线图(列线图I)
  • 时间依赖的校准曲线验证列线图的1,3,5年对AML的预测效能(校准曲线图J)
  • 列线图和其它临床病理特征对AML的预测效能AUC比较,列线图最高(折线图K)


7、可变剪切因子SRSF10 在AML中显著上调并且促进了AML(实验)
在32个SFs中SRSF12和SRSF10在AML中显著上调。因为SRSF12是预后保护因子,因此仅对危险因子SRSF10进行深入研究,探索与 AML发生发展的关系。

  • SRSF10在AML和正常样本间的表达差异展示(箱线图A)
  • SRSF10在TCGA泛癌中的表达差异,在AML中表达最高,预示着SRSF10可能参与血液肿瘤发生和发展(箱线图B)
  • PCR实验验证了SRSF10在AML比正常样本中显著高表达(柱状图CD)
  • 构建SRSF10过表达(oeSRSF10)和敲低(shSRSF10)的转染细胞系,PCR和WB实验验证SRSF10的mRNA表达和蛋白质表达水平(图EF)
  • CCK8实验表明与对照相比,SRSF10过表达组(SRSF10-oe)细胞的增值能力更高;并且SRSF10敲低组(SRSF10-sh1和、SRSF10-sh2)与对照组相比细胞增殖明显减少(图G)
  • EdU染色也显示SRSF10-oe组细胞比对照组细胞有更多的DNA复制。然shSRSF10组DNA复制阶段细胞少于对照组(图7H,I)
  • V-FITC/PI 染色标记凋亡细胞,流式细胞术检测发现SRSF10敲低组(SRSF10-sh1、SRSF10-sh2)细胞凋亡率均高于对照组(图J)
  • 进一步通过流式细胞术检测了SRSF10敲低后细胞周期的变化。结果表明,与对照组相比,SRSF10敲低组(SRSF10-sh1、SRSF10-sh2)细胞在 G1期的停滞更为明显(图K)


小结

这篇研究是典型的干湿结合文章,没有大规模测序也没有很复杂的生信分析,典型的分型+预后模型思路,中科院二区8+期刊收录。

研究内容:可变剪切相关基因家族切入+不同的可变剪切模式功能、免疫学特征+不同表型不同个性化用药治疗+预后

分析结构:分型+预后模型+实验验证

写在最后:单独依靠纯生信就能轻易发文章的红利时期已经过去了,在生信分析卷不动的时候,返璞归真,找准新颖贴合疾病的切入点+生信分析+简单的实验成为科研的必经之路,毕竟生信分析也只是数据分析的手段而已,大量数据的深度学习训练总需要落地验证才能让结果更可信。话不多说,对今天思路感兴趣的来吧!

可变剪切新思路
扫码咨询

END

不想错过每天的热点和技术
欢迎大家添加生信人为星标推荐

撰稿  ▎Eric
排版  ▎小北

最新思路推荐
肿瘤免疫

细胞死亡

单细胞

m6A专题

生信人
共同学习生物信息学知识,共同探究生物奥秘。
 最新文章