最新m6A单细胞分析思路分享

学术   2024-12-19 06:59   北京  

N6-甲基腺苷(m6A)近年来备受关注,然而大部分m6A研究都是基于组织数据进行的。目前已发现m6A具有显著的细胞特异性,这使得在单细胞水平对m6A进行分析变得至关重要。因此,今天小编想和大家分享一篇最近发表在GENOMICS PROTEOMICS & BIOINFORMATICS(11.5/Q1)杂志上的文章,该文章开发了单细胞水平定量m6A的方法,这对于更好地结合m6A与单细胞分析具有重要意义。


Scm6A: A Fast and Low-cost Method for Quantifying m6A Modifications at the Single-cell Level

Scm6A:一种在单细胞水平上定量m6A修饰的快速低成本方法

添加微信

精彩推送不错过


一.文章摘要

该研究开发了一种基于机器学习的单细胞m6A定量方法:Scm6A,利用了来自m6A反式调控因子表达水平的输入特征(trans)和顺式序列特征(cis),具有显著的预测效率和可靠性。研究也通过m6A-seq及Scm6A对相同CD4+和CD8+ T细胞进行分析,观察到Scm6A计算的m6A水平与m6A-seq定量呈显著正相关,进一步验证了Scm6A的稳健性和精确性。同时,研究也在肺癌样本中展示了m6A在不同T细胞亚型中的表达模式和调控机制。总之,该工作开发了一种新颖、可靠、准确的单细胞m6A检测方法。


二.文章的主要内容及结果

1.RF在单细胞m6A计算中优于其他机器学习模型

文章首先建立了单细胞m6A预测模型。图1A展示了该研究的主要流程。具体来说研究首先收集了593个可靠的m6A调控因子的表达数据和与m6A相关的保守序列特征。接着研究建立了随机森林(RF)、k近邻(KNN)、多核支持向量回归(SVR)、线性回归(LR)和线性支持向量回归(LinearSVR) 5种机器学习模型,并基于trans和cis数据,计算了上述模型的所有最优参数,结果观察到RF模型始终优于其他机器学习模型(图1B)。此外,研究也根据测试精度对五种机器学习方法构建的模型进行了ROC分析,结果发现RF模型的Scm6A性能最优(图1C,D)。因此,研究确定了最适合单细胞m6A的定量方法,并将其命名为Scm6A。



图1 单细胞m6A预测模型评估


2.验证Scm6A的准确性和可靠性

文章接着对Scm6A的准确性进行了验证。研究对4名健康参与者的外周血样本进行了scRNA-seq分析,提取了593个可靠的m6A调控因子的表达数据,作为Scm6A的反式作用输入,以及42个m6A保守序列信息作为顺式作用输入。接着研究使用Scm6A计算了CD4+和CD8+T细胞的m6A(图2A)。研究也对MACS分离的CD4+和CD8+T细胞进行m6A-seq分析,用于比较同一基因区域内m6A水平的相关性(图2B),结果研究观察到Scm6A预测的m6A水平与MACS中m6A-seq量化的m6A水平之间存在显著相关性(图2C,D)。因此,Scm6A被证明是一种精确可靠的单细胞m6A分析工具。



图2 验证了Scm6A的可靠性和准确性


3.通过m6A-seq识别m6A在CD4+和CD8+T细胞中的潜在作用

文章接着通过m6A-seq数据分析了m6A在CD4+和CD8+ T细胞中的潜在作用。研究发现CD4+ T细胞的m6A峰倾向于富集在终止密码子附近,而CD8+T细胞的m6A峰富集在编码区和启动密码子附近(图3A)。此外,研究也分析了CD4+和CD8+T细胞的基序富集情况(图3B),并使用m6A-seq和表达数据分析发现2055个差异表达基因和113个包含不同m6A位点的基因(图3C),这两组基因的交集包含62个基因(图3D)。研究也发现这些基因的表达水平与差异甲基化位点的m6A水平呈正相关(图3E和F)。这些潜在的m6A调控基因也被发现在T细胞分化等通路中富集(图3G),这表明m6A控制着T细胞分化相关基因的表达。

图3 人PBMC分离T细胞m6A测序结果的生物信息学分析


4.通过Scm6A识别m6A在CD4+和CD8+T细胞中的潜在作用

研究接着分析了Scm6A与scRNA-seq的组合分析是否有效。通过基序富集分析,研究发现Scm6A计算的m6A峰与m6A-seq分析识别的m6A峰富集基序一致(图3A)。此外,研究也对scRNA-seq识别的CD4+ T细胞和CD8+ T细胞中的m6A水平进行了无监督聚类分析,结果观察到两组单细胞m6A谱能够按细胞类型分开(图3B)。研究进一步以单细胞分辨率预测了单个样本中CD4+和CD8+ T细胞的m6A水平,并可视化相同细胞类型的组内相似性和不同细胞类型组之间的异质性(图4C),结果观察到含有这些m6A修饰的基因在T细胞分化和细胞分化过程中富集(图4D)。研究还发现m6A沉积基因的表达水平与差异甲基化位点的m6A呈正相关(图4E)。这些发现进一步强调了Scm6A作为单细胞水平m6A分析方法的可靠性。



图4 Scm6A分析结果的生物信息学分析


5.Scm6A在不同肺癌亚型中的应用揭示了m6A在耗竭的CD8+T细胞中的作用和调节因子

文章最后在肺癌中应用Scm6A分析了T细胞耗竭与m6A的关联。研究首先利用Scm6A探索了不同肺癌类型(图5A,B)中耗竭CD8+T细胞和其他细胞类型的m6A图谱,结果发现在肺鳞癌和非小细胞肺癌中,耗竭CD8+ T细胞的m6A谱和分子特征存在差异(图5A-C),耗竭CD8+ T细胞相关的m6A也被观察到在IL-7通路中富集(图5D)。此外,研究也发现这些耗竭CD8+ T相关的m6A水平与19个m6A调控因子相关(图5E)。

图5 利用Scm6A从肺癌患者的scRNA-seq数据中探索单细胞水平的m6A


到这里文章的主要内容就介绍完了。总结一下,文章开发了一种在单细胞水平定量m6A的方法,并对该方法进行了全面的评估与验证,最后也举例介绍了该方法的分析应用。m6A近几年来持续受到关注,一直热度不减。该文章不同于之前的bulk分析,聚焦于单细胞水平评估m6A,这无疑为小伙伴们研究m6A提供了新的思路,感兴趣的小伙伴们不要错过呀。


添加微信

精彩推送不错过

最新文章汇总(持续更新ing)


最新热点方向

1、今天开心,安利一个超好发版干湿结合思路

2、掌握孟德尔随机化发20分不是梦

3、研究中草药难发SCI?

4、公开数据纯分析发7+,内容不卷赢在选题

5、人手一篇的“淋巴转移”,摇身一变50+


生信人课堂

1、临床医生科研规划

2、热点基因集预后实操课程

3、孟德尔随机与基因组

4、R语言入门


课题设计 | 生信分析 | 数字产品

概普生物 让科研丰富

生信人

专注于基因技术相关知识分享
扫码关注 获取更多






END


生信人
共同学习生物信息学知识,共同探究生物奥秘。
 最新文章