今天介绍的是来自Nature communication 5月发表的新研究。这是一篇关于非小细胞肺癌(NSCLC)的单细胞和空间转录组学分析的论文。研究团队对25名未经治疗的NSCLC患者的近900,000个细胞进行了单细胞和空间转录组学分析。研究揭示了肿瘤中存在一种独特的细胞类型,即癌症相关巨噬细胞样细胞(CAMLs),它们同时表达髓样和上皮细胞标记物,并在治疗反应中显示出重要价值。
更贴合临床的生信分析定制
1、背景与研究方法
肺癌是全球癌症相关死亡的主要原因,其中非小细胞肺癌(NSCLC)是最常见的类型。NSCLC包括两种主要组织学亚型:腺癌(LUAD)和鳞癌(LUSC)。尽管免疫疗法,特别是免疫检查点抑制剂(ICIs),已显著改善了NSCLC患者的预后,但治疗反应和结果仍然高度异质。
为了深入理解NSCLC肿瘤微环境(TME)中免疫细胞的多样性和功能状态,以及巨噬细胞在肿瘤进展中的作用,研究者对25名肿瘤切除术附近的NSCLC患者的近900,000个细胞进行了单细胞转录组测序和未接受过治疗的患者切片空间转录组测序。单细胞数据通过标准的Scanpy框架进行质量控制和分析,而空间组数据则使用Visium平台获取。研究中使用了多种生物信息学工具,包括Harmony以整合不同数据集,通过Scrublet去除潜在的细胞双染,以及使用CellPhoneDB分析细胞间相互作用。此外,还使用了clusterProfiler R package进行基因本体(GO),以及用REACTOME数据库的进行过表达分析。
2、单细胞揭示的细胞多样性
实验设计如图1a所示;其样本来源如图1b所示。25例采样者中,2人为健康对照,其它病患样本包含两种亚型,不同癌症期都有出现。图1c展示了单细胞UMAP聚类及细胞注释的结果。图1d为每类细胞代表性基因的表达状况。图1e显示了AT2细胞、CAML(癌相关巨噬细胞)和AIM中髓样(LYZ、CD68、MRC1)和上皮(EPCAM)基因的共表达情况。图中每个点的大小表示该细胞群中表达该基因的细胞比例,颜色则表示该基因在每个细胞群中的平均表达水平。这些细胞来自肿瘤组织,并通过单细胞RNA测序技术进行分析。图1e中的绿色对应CAML, 这些细胞只在肿瘤中出现,代表了一种独特的大髓系细胞群,并伴有上皮性肿瘤蛋白表达,可见图1f展示的标准化后CAML,AT2,AML的表达量对比。这些独特的细胞已经在各种恶性肿瘤患者的血液样本中被观察到,包括NSCLC数据集。图1g和h展示了健康对照和癌症组细胞类型占比,该图指出免疫和非免疫区室的组成在肿瘤和背景之间显着不同。在肿瘤中,我们检测到成纤维细胞和淋巴内皮细胞比例降低。图1i对应具体各细胞类型占比的对比。其中肿瘤样本中单核细胞和未成熟髓系细胞的比例显着降低,而 DC 和 B 细胞的总数会扩张。
图1:单细胞研究的结果展示
3、单细胞结合空间组分析结果
根据空间组和单细胞对应后各自细胞注释的结果,可发现注释后两种细胞类型各自表达量的皮尔森相关性(图2a)。图2b按腺癌(LUAD)和鳞癌(LUSC)的临床亚型分别进行了相关性热图展示。图2c显示了 LUAD 和 LUSC 中 cellphoneDB 检测到的选定 ICI 的肿瘤特异性相互作用,线条颜色标识每种细胞类型之间的相互作用是仅在 LUAD(橙色)、仅在 LUSC(绿色)中发现还是在两种肿瘤类型(蓝色)中发现。图2d突出显示的 ICI 基因和细胞类型的表达量点图,按肿瘤类型划分。每个点的大小表示簇中表达该基因的细胞的百分比,而颜色表示每组中每个基因的平均归一化缩放,再对数转换得到的表达量。图2e图显示了 LUAD 和 LUSC 中 cellphoneDB 检测到的 VEGFA/B 相互作用者的肿瘤特异性相互作用。线条颜色标识每种细胞类型之间的 L-R(配体-受子) 相互作用是仅在 LUAD(橙色)、仅在 LUSC(绿色)中还是在两种肿瘤(蓝色)中发现。图2f 显示了 LUAD 和 LUSC 中 cellphoneDB 检测到的 EGFR 相互作用者的肿瘤特异性相互作用。线条颜色标识 L-R 交互是否仅在LUAD中(橙色),仅在LUSC中(绿色)或在两个肿瘤(蓝色)中发现每种细胞类型。
通过对比图2e和f,可发现LUAD 和 LUSC 具有相似的细胞组成,但利用不同的细胞间相互作用网络。在 LUAD 数据集中发现了总体上更多的 L-R,这不是由 LUAD与 LUSC数据集中的细胞数量差异驱动的。其次,几对免疫检查点抑制剂(ICI)及其各自的抑制分子在LUAD与LUSC中共表达差异(图2C,D)。例如,LGALS9-HAVCR2 (TIM3)、NECTIN2CD226 (DNAM1) 和 NECTIN2/NECTIN3-TIGIT 在 LUAD 中经常被鉴定出来,而 CD96-NECTIN1 在 LUSC 中优先被发现(图 2C、D)。相比之下,CD80/CD86-CTLA4 和 HLAF-LILRB1/2 在两种肿瘤亚型中都被发现(图 2C、D)。该研究数据集中没有观察到任何一种肿瘤亚型中的PD1-PDL1相互作用(图2C,D)。研究初步分析表明,其他ICIs(如CTLA4、TIGIT、LILRB1/2和TIM3)可能是治疗NSCLC的有希望的靶点。
图2:空间组与单细胞结合,展示细胞间互作
4、单细胞和空间转录组学的整合对L-R相互作用的原位验证
前文提到的 L-R互作是该研究的重要发现,为了辨别生物学上显着的相互作用,必须确定被确定为相互作用的细胞类型是否确实在物理上位于同一位置。为了实现这一点,该研究将肿瘤和背景样本的单细胞与新鲜冷冻肿瘤和背景组织切片的空间转录组学图谱相结合。对来自8名患者的两个连续的10μm切片进行了10×Visium测序,其中7名与用于scRNA-seq的样本相匹配。总共分析了 36 个部分,使用来自scRNA-seq数据集的cell2location和细胞类型特异性表达谱来对组织上的细胞型丰度进行反卷积(图3a)
图3 :10x Visium 确认配体-受体的共定位
图3b表明肿瘤与对照中所有空间切片中的细胞类型频率差异与单细胞数据中获得的结果一致。例如,在肿瘤中,我们发现与背景组织相比,B 细胞 和循环 AT2 细胞 的比例增加,未成熟细胞 、NK 细胞和 LEC 的比例减少。然而,根据单细胞数据或肿瘤或背景中的空间组数据估计的其他细胞类型的比例显示出一些差异。这在非免疫人群中尤为明显,与单细胞相比,空间组估计LECs、活化的外膜成纤维细胞和循环亚群的比例更高。其他人先前也发现了不同方法之间细胞比例的差异,这强调了两种技术固有的不同采样偏差的潜在影响。尽管如此,空间组和单细胞获得的结果总体一致性表明,不同细胞类型的空间“地图”忠实地代表了它们在组织中的分布。
接下来考察cellphoneDB识别的L-R的空间共定位。如果两个基因在同一位点表达,并且高于给定基因在切片点上的中位值,则认为 L-R 是共定位的。图3c为空间 LR 共定位的热图。估计所有来自8各样本切片的每个位点的 L-R基因。图3d展示共表达箱线图显示了在所分析的每个切片中肿瘤与背景中显着不同的共定位 LR 对的频率。图3E 描述在肿瘤(上)和背景(下)中发现 数对基因中L-R 对共表达的斑点位置的空间图像.由该图可确认几种肿瘤特异性 L-R 在肿瘤中的共定位明显多于在背景切片中,包括 NRP1-VEGFA 和 ICI NECTIN2-TIGIT、LGALS9-HAVCR2 和 CD96NECTIN1(图 3C-E )。与cellphoneDB结果一致。
5、CAML 与肿瘤细胞具有相似的拷贝数畸变 (CNA)
单细胞分析中,很少见到关于CNA的部分。实际上,可以应用肿瘤核型分析(CopyKAT)来辨别单个细胞内的全基因组非整倍体。相邻基因的表达水平可以提供有价值的信息来推断该特定基因组片段内的基因组拷贝数。由于非整倍体在人类癌症中很常见,因此具有全基因组 CNA 的细胞被认为是肿瘤细胞。
使用 CopyKAT 的分析显示肿瘤组织中存在广泛的患者特异性 CNA(图 4A )。通过PAGA(基于分区的图抽象)可在AT2细胞、循环AT2/上皮细胞之间显示出分化连续性,一侧为非典型上皮细胞,另一侧为纤毛上皮细胞和过渡上皮细胞(图4B)。此外,盲法组织学评估证实了病理学家定义的肿瘤部位与 AT2 和由 cell2 位置预测的循环 AT2 细胞之间的重叠,表明它们的肿瘤细胞状态(图 4C)。观察到非典型上皮细胞的重叠较少(图4C)。与背景相比,来自肿瘤的 AT2 细胞的差异表达分析 (DEA) 显示与缺氧、TP53 通路和肿瘤代谢重新布线有关的基因上调。肿瘤上调基因中的AT2细胞参与糖酵解和氧化磷酸化。CAML群体还显示出与来自同一患者的AT2细胞和循环AT2细胞相似的大量CNA(图4A,E)。为了以统计学稳健的方式测量细胞类型之间基因组增益和丢失分布的差异,可计算了Kullback-Leibler(KL)散度(图4)。CAMLs的KL散度值与CNA的发散值相当。
图4 CAML 共享肿瘤 CNA 并与肿瘤细胞共定位
6、肿瘤巨噬细胞由于TAM进行的重编程
通过对肿瘤中巨噬细胞的差异表达分析,可以根据传统上的分类,将其分为传统上分为不同的 M1(经典激活)和 M2(可选激活)两类。图5a展示了与背景数据(无肿瘤巨噬细胞)相比的差异表达火山图,图5b通过基因本体分析的结果。两类巨噬细胞都上调了参与胆固醇和脂质转运和代谢的基因(如 ABCA1、APOC1、APOE、FABP3 和 FABP5)。对匹配的肿瘤和背景组织切片进行染色可发现,与背景组织相比,肿瘤切片中的BODIPY信号显著增加(图5C,D),证实了肿瘤中性脂质的可用性增加,这可能是由于TAM增加导致的结果。
在肿瘤切除术中鉴定出 STAB1 + Mɸ(图 5E-H,因此可通过差异表达分析鉴定一组与肿瘤 AIMɸ 或 AMɸ 相比对 STAB1 + Mɸ 具有特异性的基因。共发现 20 个基因,称其为“STAB1 特征基因”(图 5I)。有趣的是,STAB1 + Mɸ 独特地表达 SLC40A1,它编码铁转运蛋白,铁转运蛋白是唯一已知的从细胞质中输出亚铁的蛋白质,并且是巨噬细胞铁释放活性的关键(图 5I、J)。
图5:肿瘤巨噬细胞由于TAM进行的演化
7、 总结
该研究之所以能够以25样本,且只进行了单细胞和空间组,且没有对应临床表型(纵向研究)的情况下就发到1区的NC上,是因为其进行的高级分析揭示了具有生物学价值的发现。收集的患者样本包含了两种常见的 NSCLC 亚型。之后细胞间互作分析揭示了配体受体互作,并在两种亚型间找到了差异,具有临床指导意义。通过空间组数据,可以对配体受体进行原位验证,多组学的共同发现说明了结果的可靠性。之后通过单细胞数据找到拷贝数畸变,并于空间组中找到的肿瘤细胞进行了对应。之后对肿瘤微环境中的差异表达,发现STAB1 + Mɸ 显示出与肿瘤特异性巨噬细胞具有转录相似性,肿瘤特异性巨噬细胞同时表达与 Mɸ 和上皮细胞相关的基因,并表现出与肿瘤细胞中发现的相似的拷贝数畸变。这些研究基于基因表达特征、肿瘤特异性拷贝数畸变和与肿瘤细胞的物理接近程度,允许识别肺肿瘤微环境中Mɸ群体的多种分子变化,这将有助于为开发针对NSCLC的治疗策略铺平道路。
更贴合临床的生信分析定制
1、临床医生科研规划
4、R语言入门
概普生物 让科研丰富