不设置🌟有时会收不到公众号内容,code一段时间后会失效,代码见文末
这篇nature方法写的太详细了,能学到不少东西,估计能解决很多同学数据处理上的困惑。特别是基因模块分析上面,用的人太多了,今天把之前所有涉及到模块的,汇了个总:
单细胞测序并不是真正的每个细胞的所有基因都能测到,其实有很多的dropout,错误的识别成了0,MAGIC就是一种恢复缺失基因表达的计算方法,这个方法可是发表在了Cell上.
在这篇研究中,Hotspot方法被用于识别结直肠癌(CRC)肿瘤细胞中与特定细胞状态相关的基因模块。该方法的应用旨在揭示肿瘤内和肿瘤间的表型异质性,这对理解癌症进展中的基因表达协调至关重要。以下是详细的讲解和方法选择的原因,作者描述的非常详细,我之前也经常介绍模块,Hotspot也说过,但大部分都是以非负矩阵分解分解(NMF)为主:
下面是我之前所有模块分析的汇总:
小鼠模型的结果一定要和人的一致吗,不一样照样发顶刊——生信代码分享,NMF在空间应用
Bulk RNA-seq怎么找到与预后相关的细胞类型和靶基因——学习下这篇NC,代码分析
记录3篇蛋白质组学应用的经典范文——同样是WGCNA模块分析,为什么他们发了那么多顶刊
记:我从北大张泽民院士的这篇Cancer cell中学到了哪些生信代码技巧01
现在细胞通讯分析太卷了,只做配体与受体相互作用分析根本就不够——功能要全
1. Hotspot方法的简介
Hotspot是一种用于单细胞RNA测序数据的分析工具,专门识别在细胞之间具有显著自相关性的基因模块。它通过构建细胞的k-最近邻图,并在该图上进行局部自相关计算,从而发现细胞子集中具有协同表达关系的基因。
2. 为何选择Hotspot方法
局部相关性捕捉:Hotspot的设计使其能够在复杂的单细胞数据集中发现仅在特定细胞群体中存在的共表达模式,而非要求整个数据集都表现出这种模式。这在肿瘤研究中尤为重要,因为癌细胞存在高度异质性,不同的细胞亚群可能有其特定的基因表达特征。
抗干扰能力强:由于单细胞测序数据中常存在掉落现象(dropout),即一些基因表达数据在部分细胞中缺失,Hotspot能够通过其局部相关性计算,减小数据不完整带来的干扰,确保分析结果的准确性。
适应异质性:在癌症研究中,不同肿瘤微环境下的细胞常表现出显著的表达差异和异质性。Hotspot方法能够通过其灵活的局部分析,在不同的微环境中检测到协同表达的基因模块,从而揭示肿瘤的不同细胞状态和潜在机制。
3. Hotspot方法的优势
捕捉细胞群体间的异质性:与其他如Pearson相关性分析或传统的线性降维方法不同,Hotspot不依赖于全局基因表达的平均相关性,而是聚焦于局部区域的细胞关系。因此,它能够发现和识别仅在特定细胞群体中才会表达协同的基因集合。
适应非线性表达模式:Hotspot可以分析复杂的、非线性的基因表达模式,而这在癌症研究中十分常见。相比之下,其他如非负矩阵分解(NMF)等方法更适合处理全局一致的线性模式,可能无法准确解析复杂的细胞关系。
鲁棒性和灵活性:Hotspot能处理批次效应和不同细胞间的变异,在跨样本和跨患者的情况下仍能保持识别结果的稳定性。
4. 为何不选用其他方法
全局相关性方法的限制:如Pearson相关性等方法假定基因表达在整个数据集中的相关性保持一致,这在异质性强的癌细胞中难以应用。其结果常被数据中占优势的细胞群体主导,从而忽视了较小但生物学上重要的细胞亚群。
线性降维方法的局限:NMF和PCA等线性方法在处理复杂非线性数据时表现不佳,尤其在癌症中,基因调控网络和表达模式往往是高度非线性的。此外,这些方法通常假定整个数据集可通过固定的线性组合来解释,无法灵活应对单细胞数据中出现的异质性和稀疏性。
非灵活的聚类方法:某些方法如传统的聚类分析(如k-means)虽能识别细胞群,但无法细致地识别在特定亚群中协同表达的基因模块,也无法充分应对高维、稀疏的单细胞数据。
5. 应用过程和验证
研究团队将Hotspot应用于26,145个肿瘤细胞中,并使用前2,097个高变异基因进行分析。通过深度调整的负二项观测模型(danb)和30个邻居参数,团队识别出具有显著自相关的基因,并进行了模块的聚类
。这种方法确保了识别的基因模块不仅与患者肿瘤的上下文相关,还展示了特定基因的协同表达及其在肿瘤环境中的生物学功能。
本文的主要研究内容
研究结直肠癌转移的文章非常多,结直肠癌的转移过程因其高度复杂性与患者预后相关性,吸引了大量关注。近期一篇发表于《自然》杂志的研究深入探讨了结直肠癌转移的细胞状态变化及其对治疗和疾病进展的影响,为这一领域提供了新的见解。
该研究由美国纪念斯隆凯特琳癌症中心领导,涉及对31位结直肠癌患者的组织样本进行深入分析,这些样本涵盖正常结肠组织、原发肿瘤和转移性肿瘤。研究团队采用单细胞RNA测序、器官类生成及多重免疫荧光等多种前沿技术,系统性地揭示了癌症细胞在转移过程中经历的多阶段细胞状态变迁。
研究表明,原发性结直肠癌细胞多以LGR5+肠道干细胞样状态为主,而在转移过程中,这些细胞逐渐失去肠道特性,转化为具有高度可塑性的胎儿祖细胞状态。此状态被视为一种发展中的再生状态,细胞在该阶段具有多系分化潜力,能够响应不同的微环境信号而分化成包括鳞状和神经内分泌样在内的非典型谱系。值得注意的是,这种细胞状态转变不仅在接受过化疗的患者中显著增加,且与患者生存率降低相关。
在功能验证中,研究团队利用患者来源的类器官模型进一步探索了不同肿瘤微环境对细胞可塑性的影响。结果显示,转移性细胞相比原发肿瘤细胞具有更强的自发多系分化能力。在肝脏微环境中,转移性类器官模型表现出更强的适应能力,进一步证实了转移癌细胞的高可塑性和微环境诱导的分化潜力。
研究还发现了转录抑制因子PROX1在这种细胞状态转变中的重要作用。PROX1在胎儿祖细胞状态中被诱导,其抑制非肠道谱系基因的表达,从而限制细胞的非典型分化。然而,随着癌症进展,PROX1的抑制作用逐渐减弱,细胞转而表现出更强的多系分化潜力,尤其在转移阶段,PROX1的下调促进了非典型基因的表达。
该研究不仅揭示了结直肠癌转移过程中细胞状态的变化,还指出了这些变化在治疗和预后中的潜在应用。通过单样本基因集富集分析(ssGSEA)和多变量回归分析,研究团队进一步证明了非典型基因模块的表达与患者术后肿瘤复发及生存率较低密切相关。这一发现为未来肿瘤预后评估和个性化治疗提供了新的可能性。
总体而言,该研究强调了转移癌细胞的高度可塑性及其在应对治疗时表现出的多系分化潜力。这一机制的发现为理解结直肠癌的侵袭性和治疗抵抗提供了新的思路,未来或将推动基于细胞可塑性调控的新型治疗策略的开发。
想了解生信的,跟班的,可以看下面👇这个文章
关键词:单细胞测序,生信分析,生物信息学
引文,原文
Moorman, A.R., Benitez, E.K., Cambuli, F. et al. Progressive plasticity during colorectal cancer metastasis. Nature (2024).
后苔↩️之前贴子的岸号即可霍得之前的代码,今日关键词:241103