可变剪切分析神器——rMATs

文摘 2024-08-26 09:09 江苏

一、写在前面

选择性剪接（Alternative splicing，AS）是剪除未成熟mRNA中的内含子、保留外显子后生成成熟mRNA的过程。在各类疾病发生和发展过程中，异常的选择性剪接起着重要作用。目前RNA-seq已经成为定量分析选择性剪切的有力工具，这篇文章中，作者在先前研究两个样本RNA-seq数据之间的MATS(multivariate analysis of transcript splicing)的基础上，针对重复（replicate）的样本进行分析，开发了一种新的方法称为rMATS。我们在此前的课程转录组教程中已经包含了rMATS的实战(Bulk RNASeq| 转录组实战)，这里让我们一起来看看这个方法的具体内容吧。

二、主要内容

1. 非配对重复中的rMATS统计模型。

从RNA-seq数据中进行选择性剪接分析的基本原理即比较不同亚型的reads数占所有亚型的比例，以外显子跳跃事件为例，发生时会出现外显子（I）增加和外显子跳跃（S）两种亚型，统计不同亚型reads的比例即为外显子包含水平（ψ）（Fig.1）。ψ的数值受到多种因素的影响，当RNA-seq的reads数越多时，得到的ψ值将越可靠。在相同样本的重复RNA-seq数据中，由于生物技术原因，结果也存在可变性，因此在方法的开发中需要考虑这些因素。

在rMATs中，作者通过分层框架来同时考虑不同重复之间的估计不确定性和重复之间的可变性。外显子的读取包括上层外显子reads，跳跃外显子reads和下层外显子reads。详细计算公式如图所示（Fig.S1）。其中，二项分布模拟了ψ的数值不确定性受总读数n的影响，而重复样本的可变性用混合模型中的随机效应来模拟（Fig.2）。

Fig.1：

Fig.S1：

Fig.2

1. rMATS的模拟研究。

之后，作者进行模拟研究来评估rMATS的性能。选择两个样本（每个样本10个重复的RNA-seq数据），共5000个外显子，其中5%的外显子存在差异剪接。而95%的外显子不存在差异剪接，即两个样本间Δψ≤5%，并计算标准差SD来衡量样本之间的可变性。使用rMATS来分析这些模拟数据，结果发现在所有三组模拟中，rMATS对重复数据的分析优于对合并数据的分析，特别是当样本可变性增加时（Fig.3）。

2. 前列腺癌的rMATs分析。

为了证实rMATs的实用性，作者分析了两个前列腺癌细胞系（各n=3）的RNA-seq数据，其中PC3E细胞表现出上皮细胞特性，GS689细胞具有侵袭特性而表现为间充质表型。选择ARHGAP17基因进行分析并经过RT-qPCR进行验证（Fig.4），结果显示RT-qPCR的结果与前列腺癌细胞系的RNA-Seq数据分析有94%的一致率。

Fig.4

3. 样本大小和测序深度影响检测方法的精确度，

RNA-seq进行选择性剪接分析时常见的问题便是对于测序深度的选择，预算固定时，需要在测序深度和重复样本数之间做选择，通过增加重复的数量能够更好地估计重复之间的可变性，但这样做会降低测序深度并增加单个重复的估计不确定性。因此作者设计了一个实验来检测样本大小和测序深度对于分析精确度的影响，结果表明较低的重复数量便有较高的真阳性率，如在SD = 0.01和0.02时，只需要3个重复就可以分别达到92%和90%的真阳性率（Fig.5A）。同时，当增加测序深度后，作者发现相比于200M，1.6GB的测序深度能够得到更大的真阳性率（Fig.5B）。总的来说，当样本之间变异系数较大时，需要较多的重复才能够达到较高的真阳性率，而样本变异系数较低时，3个重复便能够达到较高的真阳性率；同时，在不考虑预算的情况下，测序深度的增加能够提供较高的检测精度，但需要较多的样本数量来减少组间变异性。

Fig.5：

4. 配对重复中的rMATS统计。

转录组测序通常选择配对设计研究，配对研究的选择能够减少个体的特异性变异，提供统计精确度。rMATs能够通过协方差结构对于配对重复进行建模，结果显示一些外显子在两个配对样本之间具有很强的相关性，而另一些外显子在不同个体上的差异小于配对样本，因此作者引入相关系数 ρi参与计算，使用双变量正态分布来模拟样本组内重复之间的变化以及成对重复之间的相关性（Fig.6）。为了进一步验证rMATs分析配对模型的实用性，作者对于肾癌细胞的RNA-seq进行差异性剪接分析，发现使用配对信息导致统计的显著性增加（Fig.7A）,同时Δψ的SD值也会变小（Fig.7B）。以上结果表明rMATS统计模型可以揭示配对模型中更微妙但一致的剪接变化。

Fig.6：

Fig.7

5. rMATS和其他分析方法的比较。

最后作者将rMATS(未配对模型)的性能与Cufflinks(2.2.1)和DiffSplice(0.1.1)进行比较，后者使用Jensen-Shannon散度(JSD)度量来测试两个样本组之间剪接水平/异型比例的差异。结果显示无论是单个样本，还是重复样本的分析，ROC曲线均显示出rMATs的假阳性率较低（Fig.8）。

Fig.8：

三、总结讨论

综上所述，作者的数据为RNA-Seq的选择性剪接分析提供了指导原则，证明了生物学重复对于设计研究的重要性，同时合并RNA-seq或合并来自多个重复样品的RNA-Seq数据不是解决变异性的有效方法，并且异常值的产生会导致结果的假阳性率变高，因此重复数据的使用对于差异性剪接分析是必不可少的。rMATS的使用教程、测试数据可见：Bulk RNASeq| 转录组实战。总的来说，rMATs是对于重复数据进行差异选择性剪接的有力工具。

如何联系我们

公众号后台消息回复不便，这里给大家留一下领取资料及免费服务器(足够支持你完成硕博生涯的生信环境)的微信号，方便各位随时交流、提建议（别问在么，添加时直接说来意）。此外呼声一直很高的交流群也建好了，欢迎大家入群讨论：

永久免费的生信、科研交流群

大家可以阅读完这几篇之后添加

给生信入门初学者的小贴士

如何搜索公众号过往发布内容

您点的每个赞和在看，我都认真当成了喜欢

http://mp.weixin.qq.com/s?__biz=MzAwMzIzOTk5OQ==&mid=2247520911&idx=1&sn=1662a0b8ba6daa27cac8de6e581f3bfd

Biomamba 生信基地

本人为在读博士研究生，此公众号旨在分享生信知识及科研经验与体会，欢迎各位同学、老师与专家的批评指正，也欢迎各界人士的合作与交流。

最新文章

1: 1复现纯生信文章图表

第一次线下实验交流会完美收官！

Nature Genetics |基因组所周永锋团队建立葡萄全基因组选择育种体系

不知不觉，已分享了近两百篇单细胞知识帖

博士后与科研助理招聘|中山大学-广州医科大学联合招聘神经生物学与生物信息学方向

10X Visium上游定量过程

求学| 寻找博士名额

snATAC联合scRNA揭示小鼠肾脏细胞分化程序和疾病靶点

Biomamba生信基地招聘启事

scRNA-seq揭示脓毒症预后水平预测的关键靶点！

首个！写作大模型MediPen重磅上线！彻底颠覆写作模式，一键扩写，真实参考文献全自动插入！

一文学会pheatmap热图绘制

终于有出版社出手了！确定送审再投稿！

1024程序员节，送超大Biomamba鼠标垫

真·独享服务器

《Advanced Science》新型Arf1抑制剂促进癌症干细胞衰老并增强抗肿瘤免疫

我学制才三年，审稿要我一年？

诚招生信高手| 上交医松江实验室黄鑫组（肿瘤微环境、干细胞）

零代码分析单细胞测序数据| 交互式分析

基于病理学的AI模型，应用于散发性牙源性角化囊肿的诊断和预后

零代码分析单细胞测序数据| 进阶分析一网打尽

ggplot2图片自定义与拼图

零代码分析单细胞测序数据| 基因集分析

重磅！又1本官方SCI，支持“一稿多投”和“免费预审”

零代码分析单细胞测序数据| 图片美化

Y叔诚招博后创新岗年薪不低于60w

零代码分析单细胞测序数据| 基础分析教程

拍断大腿(T^T)

创造点实验条件

一文教你自己做单细胞转录组数据分析！

如何光明正大地"编数据"

单细胞常见Figure 1 视频教程

惊呆了！综述可以一键生成了！全部真实参考文献，比人工找的还好

诺贝尔化学奖也太交叉了

蛋白质分析常用流（tao）程（lu）

跨越三十年的《Cell》与《Nature》, 终成诺奖

单细胞转录组保姆级教程，视频+软件+代码全都有

单细胞挖掘+自测空转解析BPH结节形成的核心亚群及关键通路！

节假日期间服务器正常开通~

用R语言画一面五星红旗!

scATAC分析学习手册

《Nature Medicine》: 基于组织病理学的深度学习预测小细胞肺癌的分类及突变

一文了解并掌握samtools

空间转录组做到啥程度能博士毕业？

四大专题生信培训-视频、直播、资料免费送

jupyter如何切换内核

《Narure Biotechnology》教你怎么"捏造"单细胞数据

进程介绍

Science 核糖体翻译共组装结果复现

R语言科研绘图，这些技巧带你几分钟搞定Nature级美图！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉