肺腺癌的N6-甲基腺苷表观转录组图谱

学术   2024-11-07 18:04   湖北  

对原发性肿瘤进行全面的 N6-甲基腺苷(m6A)表转录组分析在很大程度上仍是一项未知研究。在这里,我们分析了 10 个非肿瘤性肺组织和 51 个肺腺癌(LUAD)肿瘤的 m6A 表转录组,整合了相应的转录组、蛋白质组和广泛的临床注释。我们发现了通过 m6A 修饰与疾病进展密切相关的基因簇和基因。与非肿瘤性肺组织相比,我们发现肿瘤中有 430 个转录本甲基化水平较低,222 个转录本甲基化水平较高。m6A修饰促进了EML4的翻译,导致其在原发性肿瘤中广泛过表达。在功能上,EML4通过与ARPC1A相互作用来调节细胞动力学,从而增强薄片的形成、细胞运动、局部侵袭和转移。在临床上,高EML4蛋白丰度与metas tasis的特征相关。METTL3小分子抑制剂可显著降低EML4 m6A和蛋白丰度,并有效抑制体内肺转移。本文于20248月发表于Cancer Discovery, IF29.7

研究技术路线:

研究结果

1. 低输入m6A MeRiP-Seq能有效分析肺癌和NL组织的表转录组

应用本研究组先前开发的优化 m6A MeRIP-seq 方法(12),我们对 10 NL 组织和 53 个原发性 LUAD 肿瘤进行了分析,每个样本使用 2 μg RNA(图 1A)。原发性肺部肿瘤来自大学健康网络患者衍生肺癌模型建立(UHN-PLCME)项目的一部分患者,这些患者有转录组学和蛋白质组学数据以及丰富的临床年表。NL组织是从肺癌切除术患者肺叶切除标本的正常肺组织中采集的组织学上非非整形肺组织。大肠杆菌(E. coliK-12尖峰 RNA 用于文库大小归一化。平均而言,超过80%MeRIP IP读数被唯一映射,其中85.8%来自蛋白编码基因,10.5%来自长基因间非编码RNAlincRNA)基因。值得注意的是,只有 0.06% 的唯一映射 IP 读数来自核糖体 RNArRNA/小核 RNAsnRNA/小核仁 RNAsnoRNA)。对来自注释基因的读数计数进行的主成分分析显示,在 m6A 免疫沉淀 RNAIP)和总 RNAINPUT)两类样本中,NL 组织和肿瘤之间存在明显的差异(图 1B)。在 INPUT 文库(图 1B)中,有两个肿瘤样本被确定为异常值,它们的尖峰读数百分比很高(图 1B),这表明它们的 RNA 质量很差或 RNA 定量不准确。因此,这两个肿瘤样本被排除在下游分析之外。NL 和肿瘤样本中的 m6A 峰数分别在 14,170 15,806 之间和 8,141 15,878 之间。虽然 m6A 峰在 lincRNA 的基因体中分布相对均匀,但在 NL 和肿瘤样本中,蛋白编码基因中的 m6A 峰主要聚集在终止密码子附近(图 1C)。与之前的报道一致,“RRACH ”主题在大多数样本中都有富集。峰值的数量和分布以及共识基序的检测,凸显了低投入 m6A MeRIP-seq 方法在分析患者标本的 m6A 表转录组方面的有效性。

如果一个基因在至少两个样本(NL 或肿瘤)中含有一个或多个 m6A 峰,则该基因被定义为 m6A 甲基化基因。在 NL 和肿瘤样本中总共检测到 11,409 个这样的基因,平均每个基因有 1.8 个峰(图 1D)。为了可靠地确定 m6A 水平,我们进一步排除了一半以上 NL 或肿瘤样本 INPUT IP 文库中丰度低于 1 的基因。这样筛选出了 6,140 个未甲基化基因和 8,030 个甲基化基因,其中包括 184 个甲基化的 lincRNA(图 1D)。然后,我们用三种不同的方法测定了每个基因的 m6A 水平:(i) 每个峰的 IP 信号与相应 INPUT 信号的最大比值(max peak),(ii) 所有峰的 IP/INPUT 之比(sum peak),(iii) 全转录本 IP/INPUT 之比(sum gene)。m6A-LAIC-seq 是一种同时提取 m6A 甲基化和非甲基化转录本的技术(17),可作为基因水平 m6A 定量的基准。

所有三种方法在 H1-hESC 细胞中都有很强的相关性,在 NL 和肿瘤样本中也表现出相似的趋势。全转录本 IP/INPUT 比值与 m6A-LAIC-seq 测定的甲基化转录本百分比的相关性最强(r = 0.67P < 2.2 × 10-16),因此成为后续分析的首选方法。在 NL 和肿瘤样本中,甲基化基因的全转录本 IP/INPUT 比值(m6A 水平 hereaf ter)明显高于未甲基化基因(图 1E),进一步证明了它是通过 m6A MeRIP-seq 数据进行 m6A 定量的最佳方法。在 NL 和肿瘤样本中,m6A 水平与 H1-hESC 中观察到的 m6A 水平高度相关,这与之前的发现一致,即特定基因的 m6A 水平在不同细胞类型中高度保守。这种一致性使我们能够将数据集中的 m6A 水平预测为 m6A-LAIC-seq 所表征的甲基化百分比。值得注意的是,log2m6A 水平)范围为 -6 00 2 2 6 分别对应于 20% 40%40% 60% 60% 80% 的甲基化百分比(图 1F)。

Figure 1 非肿瘤性肺(NL)和肺腺癌(LUAD)组织中的 m6A 表观转录组特征分析

2. m6A 水平与 m6A 调节因子之间的不同关联模式

m6A 水平受 m6A 写入器和擦除器的动态调节。因此,我们试图系统地评估队列中每个甲基化基因的 m6A 调控因子 mRNA 丰度与 m6A 水平之间的相关性。我们将催化核心成分中的三个基因(METTL3METTL14 WTAP)、作家复合体中的三个重要调控适配体(VIRMACBLL1 ZC3H13)以及两个侵蚀因子(ALKBH5 FTO)纳入分析。首先,我们检测了这些调节因子在我们的队列和 TCGA LUAD 队列中的 mRNA 丰度。在两个队列中,METTL3 VIRMA 均显示出显著的上调,而与 NL 组织相比,肿瘤中的 WTAP FTO 均显著下调(。这一观察结果表明,肿瘤中的 m6A 存在着复杂的失调。

接下来,我们根据肿瘤样本中 8030 个甲基化基因的调控因子 mRNA 丰度与 m6A 水平之间的相关关系进行了聚类分析。作者复合体和侵蚀者被清楚地分开并聚成两个不同的组(图 2A)。这 8030 个甲基化基因根据其相关性模式形成了三个组(G1G2 G3)(图 2A)。大多数 G1 基因的 m6A 水平与作家复合物呈正相关,而与擦除器呈负相关(图 2A)。G2 基因的特点是与 METTL3 METTL14 呈正相关,但与 CBL11VIRMA 和两个擦除器呈负相关。大多数 G3 基因与作家复合物呈负相关,而与侵蚀者呈正相关(图 2A)。m6A 水平与调控因子丰度之间的这种不同关联与之前的报道一致,即敲除 m6A 写入复合体后,某些基因的 m6A 水平升高,而另一些基因的 m6A 水平降低。在 A549 细胞中,G3 m6A 调控因子结合靶基因的比例明显低于 G1 组和 G2 组(图 2BPearson's χ2 检验)。同样,在 HeLa HEK-293 细胞中,G3 基因与 G1 基因相比,m6A 调节因子的焦油获取基因比例明显下降。关于 m6A 阅读器的结合靶标,我们收集了在 A549HeLa HEK-293 细胞中发现的 YTHDFYTHDC2 IGF2BP 蛋白的焦距基因的公开数据。我们发现,G3 组中 YTHDC2 IGF2BP 蛋白的靶基因明显减少,而 G2 组中 YTHDF 蛋白结合靶基因的比例明显高于 G1 G3 组。总之,G3 基因表现出不同的 m6A 调节剂和阅读剂结合模式,m6A 调节剂和阅读剂的结合率明显较低。G3 基因的 m6A 水平可能受到间接效应或其他未定性调控机制的影响。

在三组基因中,G1 基因的 m6A 水平最低(Wilcoxon 秩和单侧检验: G1 vs. G2 G1 vs. G3P < 2.2 × 10-16G2 vs. G3P = 0.49)和较高的 est mRNA 丰度(Wilcoxon 秩和单侧检验:P < 2.2 × 10-16;图 2C)。值得注意的是,G1 基因表现出典型的峰值分布模式,主要富集在 3 UTR 和终止密码子附近(图 2D)。相反,与 G1 基因相比,G2 G3 基因的编码序列(CDS)区域中 m6A 峰的数量相对较多(图 2DKolmogorov-Smirnov 检验:G2 G3 基因的 m6A 峰数量相对较多;G2 G3 基因的 m6A 峰数量相对较少): G1 vs. G2 P = 1.06 × 10-4G1 vs. G3P = 4.38 × 10-3G2 vs. G3P = 6.38 × 10-2)。我们进一步评估了这些基因的基因组特征,因为它们可能会影响 m6A 信号的分布。具体来说,由于用于 m6A MeRIP 的片段 RNA 约为 200 个核苷酸(nt),因此在对基因组区域进行元基因分析时,如果 CDS 极短,峰值分布将向基因的 5′端移动。三组基因在 5-UTR、整个 CDS 区域和 3-UTR长度上的差异可以忽略不计(补充图 S2F),这表明 G2 G3 基因的非规范峰分布并非技术伪影。G1 基因含有的外显子数量最多,最后一个 CDS 的长度最短,而 G3 基因含有的外显子数量最少,最后一个 CDS 的长度最长(图 2E)。G1 组、G2 组和 G3 组中的基因 RBM22PLA2G15 GIMAP4 分别说明了这一点(图 2F)。京都基因与基因组百科全书》的通路分析表明,G1 基因与癌细胞存活和转移相关的术语有关,如“病灶粘附”、“ad herens junction”、“缺氧诱导因子-1HIF-1)”和NOTCH 信号通路”(图 2G;补充表 S2)。有趣的是,G2 G3 基因中富集最多的特征是单纯疱疹病毒 1HSV-1)感染,主要包括锌指(ZNF)基因(图 2G)。ZNF 基因是一大类以串联 ZNF 结构为特征的转录因子,其峰值分布向 CDS 5′方向移动的程度更深。ZNF 基因与其余 G2 G3 基因的 CDS 长度在统计学上没有明显差异,这进一步证实了非典型分布并非技术伪影的观点。与 m6A 调控因子的独特关联模式以及非典型的 m6A 峰值分布表明,该基因组可能受 m6A 的调控而尚未被确定。

Figure 2 根据 m6A 水平与 m6A 调节剂丰度之间的相关性对甲基化基因进行分类

3. 独特的 m6A 亚型与良好的临床结果有关

为了探索肺癌患者肿瘤中 m6A 修饰的异质性,我们根据前 20% 甲基化基因的 m6A 水平,按四分位数间距 (IQR) 进行了共识聚类。由此确定了五个 m6A 亚型(图 3A)。我们对 RNA 和蛋白质水平采用了类似的一致聚类方法。与相当一部分基因的 RNA 和蛋白质丰度之间的正相关性一致,RNA 和蛋白质亚型之间存在明显的重叠。然而,m6A 亚型与 RNA 或蛋白质亚型之间没有发现明显的重叠。此外,两种基于 RNA 表达的 LUAD 分类方法也与 m6A 亚型进行了比较。在四簇(C1-C4LUAD 分类系统中,C1 C2 的特点是增殖相关基因的高表达以及与小细胞肺癌的相似性。相比之下,C4 亚类与正常肺相似,生存率更高。C3 亚类同时具有 C4 和正常肺的特征。在“支气管/菱形/鳞状”分类系统中,支气管亚类与早期肿瘤和良好的预后有关。

根据上述分类的特点,UHN-PLCME 队列中的大多数肿瘤被分类为 C3/C4 亚类(92.2%51 例中有 47 例)和支气管亚类(58.8%51 例中有 30 例)。这些分类与我们的 RNA 和蛋白质亚型有显著关联。相比之下,在比较这些分类与 m6A 亚型时,我们没有观察到明显的重叠。这种不相关性突出了 m6A 亚型的独特性,强调了传统的基于 mRNA 表达的分类可能忽略的潜在的独特分子机制。

值得注意的是,与其他组相比,P2 组患者的 m6A 水平最低。无论是按 IQR 排列的前 20% 甲基化基因(图 3A 3B)还是所有甲基化基因,这一观察结果都是正确的。P2 亚型的核心写入复合体成分 WTAP RNA 和蛋白质丰度相对较低,而擦除剂 ALKBH5 以及多种读取复合体蛋白质的蛋白质水平相对较高。有趣的是,与其他组相比,P2 亚型的存活率明显更高(图 3C)。对 P2 亚型和其他组的 RNA 表达谱进行比较分析,发现上调基因 246 个,下调基因 199 个(图 3D)。对这些差异表达基因的功能富集分析表明,“细胞周期”是 P2 组上调基因在GO/BPKEGG中富集最多的通路,而下调基因则在免疫相关通路中富集(图 3E)。导致免疫相关通路富集的下调基因大多是免疫球蛋白分子。综上所述,我们发现了一种与良好临床结局相关的独特 m6A 亚型。

Figure 3 基于 m6A 表观转录组的 LUAD 亚型分析

4. BLVRA m6A 水平可预测肺腺癌的临床结果,与 mRNA 和蛋白质水平无关

为了了解单个甲基化基因的临床意义,我们研究了 mRNA、蛋白质和 m6A 水平与各种临床病理特征之间的相关性。这些特征包括性别、吸烟状况和肿瘤分期,在所有研究的 51 例肿瘤中都有记录。每个转录组、蛋白质组和表转录组数据集都包含与特定特征唯一相关的基因。TBRG4SEC24B TXLNA m6A 水平分别与性别、吸烟状态和肿瘤分期有最显著的相关性。这些关联通常与相应基因的 mRNA 和蛋白水平无关。然后,我们将分析扩展到临床结果。队列包括45名有临床随访数据的患者,其中82%为早期癌症(I期和II期)。在这 45 名患者中,共有 635 个甲基化基因有互补的 RNA 和蛋白质数据可供分析。40个基因的m6A水平与总生存率相关(P0.05),其中BLVRA最为显著(图4A4B;对数秩检验:P3.4×10-4)。值得注意的是,BLVRARNA和蛋白质丰度都不能作为预后指标(图4B)。同样,在TCGA LUAD队列中,BLVRA mRNA水平与患者生存率无关。与这些发现一致的是,BLVRA m6A水平与其mRNA或蛋白丰度无关(图4C)。然而,BLVRA 蛋白和 mRNA 水平高度相关,表明 BLVRA 蛋白的稳态丰度主要由其 mRNA 驱动。BLVRA m6A图谱显示了一个典型的信号分布,在终止密码子附近有一个突出的峰值,这表明这个奇异的峰值很可能是影响BLVRA m6A水平的一个预后因素。事实上,终止密码子附近的 m6A 峰值强度(峰值区域 IP/INPUT 比值)与整个转录本的 m6A 水平高度相关(图 4D),而且这种相关性对存活率也有显著影响。在峰顶附近,我们发现了一个共识基序(图 4E)。为了验证这个位点,我们选择了代表低、中、高 m6A 水平的三个肿瘤样本,使用基于单碱基伸长和连接的定量聚合酶链反应(qPCR)扩增方法(称为SELECT”;图 4D-4F)量化了该基团内A ”位点的 m6A 水平。在这些肿瘤样本中,该A ”位点的甲基化水平与峰值和全转录本水平的甲基化水平非常吻合(图 4F)。

使用 SELECT 方法,我们进一步评估了由 80 例早期 LUAD 患者组成的验证队列中A ”位点的 m6A 水平,这些患者均有转录组分析和临床随访数据。与 UHN-PLCME 队列一致的是,在验证队列中,只有高水平的 m6A(而非 BLVRA mRNA 水平)才预示着不良生存率(图 4G)。在 m6A BLVRA mRNA 水平之间没有观察到明显的相关性(图 4H)。在多变量 Cox 回归分析中,在对年龄、性别、吸烟状况和肿瘤分期进行调整后,高 BLVRA m6A 水平仍与癌症相关死亡风险的增加显著相关[UHN-PLCME队列:危险比(HR)(95% 置信区间(CI)):10.471.02-10.1] 10.47 (1.02-107.7)P = 0.048;验证队列:HR (95% CI)2.48 (1.08-5.70)P = 0.033]。因此,BLVRAm6A水平作为首个被发现的此类水平,成为LUAD患者的潜在预后因素。

为了了解为什么高 BLVRA m6A 水平与 LUAD 患者较短的生存期相关,我们对 UHN PLCME 队列中按高 BLVRA m6A 水平和低 BLVRA m6A 水平二分的肿瘤样本进行了差异 RNA 表达分析。基因组富集分析发现,在 BLVRA m6A 水平高的肿瘤中,上皮细胞向间质转化(EMT)是基因上调最显著的富集特征。这一点尤为重要,因为已知 EMT 与耐药性、免疫逃避、转移和癌症进展过程中的不良结果有关。接下来,我们分析了两种公认的 EMT 刺激下的 BLVRA m6A 水平,包括转化生长因子 betaTGF-β)和肝细胞生长因子(HGF;)。经 HGF 处理后,NSCLC 细胞中 BLVRA m6A 的修饰明显升高,其 mRNA 或蛋白水平变化不大,而 TGF-β BLVRA m6A 水平没有影响。利用 dCas13b-ALKBH5 融合蛋白系统特异性地去除 HGF 处理的 A549 细胞中 BLVRA 转录本的 m6A 修饰。尽管 m6A 水平明显降低,但我们并没有观察到 BLVRA mRNA 或蛋白丰度的实质性变化,这表明虽然 BLVRA m6A 水平可作为 LUAD EMT 刺激和临床结果的生物标记物,但它并不会对 RNA 稳定性或翻译效率产生实质性影响。

Figure 4  BLVRA m6A水平与患者的生存结果有独立关联

5. 患者肿瘤中普遍存在的 m6A 低甲基化现象

为了确定 LUAD 中肿瘤样本和 NL 样本中 m6A 修饰的独特特征,我们分析了两种样本类型的 m6A MeRIP-seq 数据。NL 组织中检测到的 m6A 峰的中位数为 15,442 个,显著高于肿瘤样本中的 11,618 [ 5A(左);Wilcoxon 秩和单侧检验:P = 1.16 × 10-6]。在 NL 组织中,包括蛋白编码 RNA lincRNA 在内的每一类 RNA m6A 峰数都明显较高。与 NL 组织相比,在肿瘤中观察到的峰值数量变化要大得多[ 5A(左);Levene 检验:P = 3.5 × 10-3]。为了进一步研究这种变化,我们对北大西洋公约组织和肿瘤样本进行了组内配对比较。在 NL 组织中观察到了较高的 m6A 峰重叠率(>68.6%),而肿瘤样本的重叠率明显较低,从 38.4% 81.4% 不等[ 5A(右);Wilcoxon 秩和单侧检验:P < 2.2 × 10-16],表明肿瘤内异质性较高。大多数 m6A 峰(12,562 个)在 NL 和肿瘤样本中都能检测到,这被视为“共同峰”(图 5B;超计量检验:P < 2.2 × 10-16)。在 NL 和肿瘤样本中分别检测到 1,607 6,519 m6A 峰,分别称为NL 特异峰”和“肿瘤特异峰”(图 5B)。肿瘤特异性峰占优势可能是由于肿瘤样本量较大,而且肿瘤间异质性较高。事实上,只有 10% 的肿瘤特异性峰出现在大于 20% 的肿瘤样本中,而一半的 NL 特异性峰和 80% 的常见峰出现在大于 20% 的各自样本中。在每个样本中都观察到m6AmRNA水平之间的负相关,NL中的相关系数从-0.45-0.39不等(平均值=-0.42),类似于在人类胚胎干细胞中观察到的相关系数。相比之下,肿瘤样本中的cor关系不那么一致,显示出更大的变异性[补充图S6C,左;-0.33 (-0.45, -0.19)Wilcoxon秩和单侧检验: P = 2.44 × 10-5]. 在分析整个队列中的单个基因时,NL 样本中的反相关性很明显,但肿瘤样本中几乎没有这种模式。

肿瘤中的 m6A 水平明显低于 NL 组织(单侧 Z 检验:P = 3.04 × 10-8),且差异较大(Kolmogorov-Smirnov 检验:P < 2.2 × 10-16;图 5C),与峰值水平的 ob servation 相符(图 5A)。差异甲基化分析确定了 652 个差异甲基化基因(DMG),包括肿瘤中 430 个低甲基化基因(20 lincRNA)和 222 个高甲基化基因(4 lincRNA)(图 5D 5E)。为了确保这些发现的稳健性,我们进行了验证分析,从 51 LUAD 样本中随机抽取 10 个肿瘤 100 次,然后将这些子集与 10 NL 样本进行比较。比较结果表明,在整个数据集中发现的高甲基化和低甲基化基因中,平均有 70% 以上在子样本比较中得到了一致的观察结果。此外,在由 15 LUAD 肿瘤样本和 15 NL 样本组成的独立队列中,使用 m6A MeRIP qPCR 检测法对三个代表性低甲基化基因(AP1M1KLRG2 ZNF688)和三个代表性高甲基化基因(MAT2AEML4 R3HDM2)进行了靶向验证。与 NL 样本相比,我们观察到肿瘤样本中低甲基化基因的 m6A 水平明显较低,而高甲基化基因的 m6A 水平较高。

值得注意的是,91.2%的低甲基化基因含有共同峰,而具有共同峰的高甲基化基因比例仅为59%。在 51 个肿瘤样本中,发现了 2,600 多个肿瘤特异性甲基化基因,这些基因在肿瘤亚群中特异性甲基化,这与在峰值水平上观察到的肿瘤间高度异质性一致(图 5A)。这些基因在与免疫学相关的通路中富集程度最高,包括“免疫球蛋白受体结合”和“抗原结合”。虽然本研究中使用的肺组织样本主要由高纯度的肺上皮细胞组成(肿瘤细胞度>60%),但大块组织样本中也有其他类型的细胞浸润,如免疫细胞。为了检验富集的免疫学特征是否与肿瘤特异性免疫浸润有关,我们评估了 UHN-PLCME TCGA LUAD 队列中 NL 和肿瘤样本中六种主要免疫细胞亚型(B 细胞、CD4 T 细胞、CD8 T 细胞、巨噬细胞、中性粒细胞和树突状细胞)的丰度。在两个队列中,B 细胞是肿瘤浸润明显高于 NL 组织的唯一细胞类型(Wilcoxon 秩和检验: UHN-PLCME P = 3.2 × 10-5TCGA LUADP = 3.5 × 10-2)。同样,具有高 B 细胞浸润的肿瘤样本中,具有 m6A 峰的 B 细胞特异性基因比例明显更高(Wilcoxon 秩和单侧检验:P = 1.2 × 10-2)。考虑到免疫球蛋白分子主要来源于 B 系细胞,肿瘤微环境中 B 细胞浸润的增加可能会影响观察到的肿瘤特异性 m6A 峰。

低甲基化倾向于发生在 RNA 丰度低但 m6A 水平高的转录本中,而高甲基化则主要出现在 RNA 丰度高但 m6A 水平低的转录本中(Wilcoxon 秩和单侧检验:P < 2.2 × 10-16)。低甲基化和高甲基化基因在 NL 样本和肿瘤样本之间均未显示出明显的 RNA 丰度差异(补充图 S6MWilcoxon 秩和双侧检验:低:P = 0.18;高:P = 0.17): P = 0.17). 具体来说,68.1%的低甲基化基因(293/430)和 69.4%的高甲基化基因(154/222)在 NL 和肿瘤样本的 RNA 水平上没有显示出显著差异(图 5D)。这些数据表明,NL 与肿瘤样本之间的绝大多数甲基化差异并不会导致肿瘤中 RNA 丰度的显著变化。

Figure 5 LUAD 中,EML4 通过 m6A 高甲基化上调

6. m6A 高甲基化可增强 EML4 翻译并促进 LUAD 的转移潜力

RNA水平无明显变化的447DMGs中,EML4特别值得关注:(i) 它在高甲基化基因中排名第二(图5F),并且在终止密码子附近有一个m6A峰(图5G)。(ii)EML4因其在EML4-ALK融合基因中的作用而闻名,EML4-ALK融合基因可产生转化型融合酪氨酸激酶,这种致癌驱动突变存在于大约5%NSCLC病例中。然而,EML4 在癌症(包括 LUAD)中的独立功能在很大程度上被忽视了。与 UHN-PLCME 队列一致,在 TCGA LUAD 队列中,与邻近的正常样本相比,Tu mors 中的 EML4 mRNA 丰度没有明显上调[Wilcoxon 秩和单侧检验:log2FC(肿瘤/正常))= 0.53P < 1.55 × 10-8]。与整个转录本的 m6A 水平一致,肿瘤样本中的 EML4 m6A 峰强度(峰区 IP/INPUT 比值)与正常组织相比明显升高(图 5HWilcoxon 秩和单侧检验:P = 2.03 × 10-4)。

虽然敲除 m6A 的关键作者 METTL3 EML4 mRNA 丰度的影响极小,但却导致峰值区域周围以及预测最接近峰值的图案中A ”位点的甲基化水平显著下降,同时降低了 EML4 蛋白丰度和翻译效率(图 5I)。因此,在 dCas13b-ALKBH5 融合蛋白系统的作用下,从 EML4 转录本的A ”位点特异性地去除 m6A,导致 EML4 蛋白丰度和翻译效率显著降低,与对照组相比,对其 mRNA 水平的影响可以忽略不计(图 5J 5K)。临床肿瘤分析联盟(CPTACLUAD 队列中 99 个配对 LUAD 肿瘤和邻近正常组织的蛋白质组和转录组数据显示,肿瘤样本中 EML4 蛋白丰度的上调比 mRNA 丰度的上调更明显[pro tein FC(肿瘤/正常)= 2.78Wilcoxon秩和单侧检验: P=1.27×10-12mRNA FC(肿瘤/正常)= 1.40Wilcoxon 秩和单侧检验: P=7.35×10-9;图 5L]。此外,77.8% LUAD 肿瘤(99 例中的 77 例)与相应的邻近正常组织相比,EML4 蛋白呈上调趋势。免疫组化(IHC)也显示原发性 LUAD EML4 蛋白表达增强(n = 55,配对学生 t 检验:P < 0.0001;图 5M)。

EML4 蛋白的翻译。鉴于翻译发生在细胞质中,我们研究了六种主要的细胞质定位的 m6A 阅读器,包括 YTHDF1YTHDF2YTHDF3IGF2BP1IGF2BP2 IGF2BP3。敲除 IGF2BP1 IGF2BP3 导致 EML4 蛋白丰度和翻译效率显著下降,而 EML4 mRNA 水平的变化可以忽略不计。相比之下,其他 m6A 阅读器的耗竭对 EML4 的丰度和翻译效率没有显著影响。RNA 结合蛋白免疫沉淀(RIPqPCR 分析证实了 IGF2BP1 IGF2BP3 EML4 mRNA 的结合。通过核糖体图谱分析,在 HeLa 细胞中也观察到了类似的 EML4 转译效率调控模式。具体来说,敲除 METTL3 会显著降低 EML4 的翻译效率,而敲除 YTHDF 家族蛋白则没有明显影响[log2METTL3 敲除/对照 FC=-1.07]。根据翻译效率是调节蛋白丰度的主要转录后机制这一假设,蛋白与 mRNA 的比值可作为转录率的代表。与细胞系模型中 EML4 m6A 的翻译促进功能相一致,在 UHN-PLCME 队列中,EML4 m6A 水平高的肿瘤中 EML4 蛋白和蛋白-mRNA 比率水平均显著高于 EML4 m6A 水平低的肿瘤。这加强了 EML4 m6A LUAD 中加强蛋白质翻译的作用。综上所述,这些数据表明,在经典的 METTL3-METTL14 甲基转移酶复合物的催化下,EML4 m6A 超甲基化被 m6A 阅读器 IGF2BP1 IGF2BP3 识别,从而导致原发性 LUAD 中蛋白翻译的增强和普遍的过度表达。我们试图阐明 EML4 LUAD 肿瘤发生中的功能作用。用 siRNA 敲除 EML4 可显著降低体外 NSCLC 细胞(A549 H358)的迁移和侵袭能力,Transwell 试验对此进行了评估,但细胞增殖没有明显变化(图 6A 6B)。同样,EML4 CRISPR 基因敲除(KO)细胞的迁移能力也明显受到影响,这证实了 siRNA shRNA 作用的特异性(图 6A-6C)。王等人观察到 EML4 过表达对细胞增殖有统计学意义但不明显的影响,H358 细胞的生长增加,A549 细胞的生长减少。然而,在过表达 EML4 A549 H358 细胞中都观察到肿瘤细胞迁移能力明显增强(图 6A 6D)。伤口愈合试验和活细胞成像进一步证实了EML4对细胞运动的影响(图6D6E)。因此,我们使用小鼠肺转移模型进一步研究了EML4在体内转移中的作用,该模型是通过向免疫缺陷小鼠尾静脉注射A549H358细胞建立的。EML4 基因敲除显著减少了肺转移并延长了生存期(图 6E-6G),而过表达则增加了这些小鼠肺部的肿瘤转移(图 6H)。总之,这些体外和体内结果表明,EML4 主要促进 LUAD 中肿瘤细胞的迁移、侵袭和最终转移。

与调控细胞运动的作用一致,EML4敲除、KO和过表达诱导NSCLC细胞发生明显的细胞形态变化(图6I),表明其在细胞骨架调控中发挥作用。具体而言,EML4 基因敲除和 KO 导致肿瘤细胞成对扩散 [ 6I(左)],而与对照细胞相比,EML4 基因过表达的细胞表现出更扩张的形状 [ 6I(右)]。有趣的是,在大部分 H358 细胞中,EML4 过表达诱导了轴突状细胞突起[ 6I(右)]。据报道,作为棘皮动物微管相关蛋白家族的成员,EML4可直接与微管结合,在HeLaU2OS细胞的间期与微管共定位,在HeLa细胞的整个有丝分裂期与微管共定位。然而,免疫荧光(IF)染色显示,EML4 在间期 NS CLC 细胞的胞浆中存在不同程度的融合(图 6J)。EML4仅在A549细胞有丝分裂过程中与α-微管蛋白共定位在有丝分裂纺锤体上,在细胞分裂过程中与α-微管蛋白共定位在中体上。这表明,EML4 可促进肺肿瘤细胞的运动,而不会直接与微管球结合。此外,在部分 NSCLC 细胞中,EML4 呈膜定位,过量表达时膜定位增加(图 6J)。

为了进一步阐明 EML4 促转移作用的分子机制,我们对 EML4 修饰细胞和对照 A549 细胞及 H358 细胞进行了 RNA 测序(RNA-seq)(图 6K)。我们还比较了 CPTAC 队列中 EML4 蛋白表达水平高和低的 LUAD 肿瘤的基因表达谱(图 6K)。通路富集分析显示,“mem brane ”和cell periphery ”是排名最高的常见术语。在测试的两种细胞系中,当 EML4 基因敲除时,这两个词被删除;当 EML4 基因过表达时,这两个词被富集;在 EML4 蛋白高表达的 LUAD 肿瘤中,这两个词也被富集(图 6K)。在细胞系和临床样本中发现的其他常见富集术语与细胞突起和神经突触有关(如突触、轴突和树突;图 6K)。为了进一步阐明 EML4 促转移作用的分子机制,我们对 EML4 修饰的 A549 细胞和对照的 H358 细胞进行了 RNA 测序(RNA-seq)(图 6K)。我们还比较了 CPTAC 队列中 EML4 蛋白表达水平高和低的 LUAD 肿瘤的基因表达谱(图 6K、)。通路富集分析显示,“mem brane ”和cell periphery ”是排名最高的常见术语。在测试的两种细胞系中,当 EML4 基因敲除时,这两个词被删除;当 EML4 基因过表达时,这两个词被富集;在 EML4 蛋白高表达的 LUAD 肿瘤中,这两个词也被富集(图 6K)。在细胞系和临床样本中发现的其他常见富集术语与细胞突起和神经突触有关(如突触、轴突和树突;图 6K)。这些术语与细胞形状控制、细胞运动和迁移密切相关,表明转录组图谱反映了 EML4 诱导的表型变化。然而,对 RNA seq 数据中差异表达基因的过度重叠分析只发现了几个常见的差异表达基因,如突触标记蛋白 12 (SYT12) 和丝氨酸蛋白家族 E 成员 1 (SERPINE1)--已知这两个基因在包括 NSCLC 在内的多种类型癌症中促进肿瘤发生和转移。在通路水平而非单个基因水平上的一致性表明,EML4 可能通过直接转录调控以外的机制促进细胞运动。

为了进一步了解 EML4 的功能机制,我们在 A549 细胞中进行了共免疫沉淀结合质谱分析(Co-IP/MS),发现了 26 个与 EML4 独特的潜在相互作用蛋白,这些蛋白在 IgG 对照沉淀中没有发现。尤其令人感兴趣的是 APRC1A,它是肌动蛋白相关蛋白 2/3Arp2/3)复合物的一个成分,因其在细胞运动和转移中的关键作用以及与 EML4 一样的细胞质和细胞膜定位而闻名。Arp2/3 蛋白复合物是肌动蛋白细胞骨架的核心调节因子,可控制肌动蛋白丝分支的成核和肌动蛋白的聚合,从而调节涉及肌动蛋白细胞骨架的各种细胞结构和功能。Arp2/3 复合体对纤毛膜的形成和动力学至关重要,纤毛膜是膜突起的一种主要类型,也是导致间质细胞迁移的关键力量。Arp2/3 复合体的过度激活会导致转移,并与各种癌症的侵袭性和肿瘤进展有关。使用免疫沉淀的 Flag 标记 EML4 相关蛋白复合物对 ARPC1A 进行 Western 印迹分析,证实了 EML4 ARPC1A NSCLC 细胞中的相互作用(图 6L)。IF 染色显示,EML4 ARPC1A 在细胞质和纤毛边缘共定位(图 6M)。功能研究进一步表明,过表达 EML4 能显著增强 ARPC1A 在片层边缘的富集(图 6N)。与 Arp2/3 复合物的已知功能一致,EML4 KO 细胞中的薄片形成显著减少,而 EML4 的过表达则显著增加了薄片的形成。相反,ARPC1A 的沉默与 EML4 缺失的效果相反,会诱导类似的形态变化,并抑制细胞迁移和片状黏附的形成。此外,ARPC1A 缺失后,EML4 过表达诱导的细胞迁移和片层形成的增强作用显著减弱(图 6O-6Q)。这些数据共同表明,EML4 通过与 LUAD 中的 ARPC1A 相互作用,增强了薄片的形成和肿瘤细胞的迁移能力。

Figure 6  EML4 可促进 NSCLC 细胞体外迁移和侵袭以及体内转移

7. EML4蛋白表达与LUAD的转移特征有关

m6A 介导的 EML4 蛋白在原发性 LUAD 肿瘤中的广泛过表达,加上 EML4 的促转移功能,促使我们探索 EML4 蛋白丰度与转移相关病理特征之间的临床相关性。在CPTAC队列(Pearson's χ2检验;P = 0.049)和我们的内部队列(Pearson's χ2检验;P = 0.029)中,原发性LUAD肿瘤中EML4蛋白表达的升高与淋巴结状态显著相关。相反,在原发性 LUAD 肿瘤中 EML4 mRNA 表达与淋巴结状态之间没有观察到明显的关联(Pearson χ2 检验;P = 0.331)。此外,转移瘤(淋巴结转移:n = 36;远处转移:n = 3)中的 EML4 蛋白丰度明显高于匹配的原发性 LUAD 肿瘤(n = 39,配对学生 t 检验;P < 0.0001;图 7A)。与匹配的原发肿瘤相比,79.5%的转移瘤(39 例中的 31 例)的 EML4 蛋白水平明显升高。原发肿瘤和淋巴结转移灶中的 EML4 蛋白丰度与阳性淋巴结数量和阳性淋巴结站数量显著相关。此外,广泛淋巴结转移(N2)的 EML4 蛋白表达明显高于局限性淋巴结转移(N1)。然而,与 EML4 相比,转移瘤中 METTL3 蛋白丰度并没有明显升高。在原发性 LUAD 肿瘤或转移瘤中,METTL3 EML4 蛋白丰度之间也没有明显的相关性,这表明 EML4 m6A 高甲基化不是由 METTL3 蛋白上调引起的。综上所述,临床标本中的这些分析结果突出表明,EML4LUAD转移进展的新型驱动因素。

Figure 7 METLL3 小分子抑制剂靶向 EML4 可减少体内转移
8. METTL3 小分子抑制剂抑制体内 EML4 蛋白表达和转移

我们的研究结果表明,EML4是预防LUAD转移的一个很有前景的治疗靶点。由于在体外沉默 METTL3 能有效减少 EML4 m6A 修饰和蛋白丰度(图 5I),我们假设超压 METTL3 将减少 EML4 m6A 修饰和蛋白丰度,从而抑制 LUAD 的转移。与我们的预期一致,METTL3 的敲除显著降低了肿瘤细胞的体外迁移和体内转移(图 7B 7C)。同样,METTL3 抑制剂 STM2457 也显著降低了 EML4 m6A 的水平及其蛋白表达(图 7D 7E)。这种减少与肿瘤细胞迁移的下降相吻合(图 7E)。重要的是,过表达 EML4 能显著恢复 METTL3 敲除和 STM2457 处理细胞的迁移能力(图 7E 7F)。这些数据表明,METTL3敲除和STM2457抑制细胞迁移的作用主要是通过调节EML4 m6A和蛋白丰度来介导的。接下来,我们评估了 STM2457 在体内预防我食管癌的功效。我们建立了一个小鼠肺转移模型,向每只非肥胖糖尿病/重度联合免疫缺陷(NOD/SCID)小鼠静脉注射 1 × 106 A549 细胞。自注射肿瘤细胞之日起,小鼠被随机分配接受对照组(药物)或 STM2457 治疗。最初连续 5 天每天给药,之后每 3 天给药一次,持续 36 天(图 7G)。我们在尾静脉注射后 2 个月评估了小鼠肺部 metasta ses。我们的数据显示,与载体组相比,STM2457 治疗显著减轻了肺转移(P < 0.01;图 7H)。根据小鼠体重和血液学参数的评估,STM2457 治疗无明显毒性(图 7H)。因此,通过抑制 METTL3 靶向 EML4 可为抑制 LUAD 转移提供一种可行且有前景的治疗策略。

研究结论:

总之,我们的工作开创了 LUAD m6A 表观转录组学蓝图。通过将其与相应的转录组学、蛋白质组学和临床数据进行比对,我们提供了一个丰富的数据集,揭示了临床环境中 m6A 改变的复杂动态,为新的治疗见解铺平了道路。

参考文献:

Wang S, Zeng Y, Zhu L, Zhang M, Zhou L, Yang W, Luo W, Wang L, Liu Y, Zhu H, Xu X, Su P, Zhang X, Ahmed M, Chen W, Chen M, Chen S, Slobodyanyuk M, Xie Z, Guan J, Zhang W, Khan AA, Sakashita S, Liu N, Pham NA, Boutros PC, Ke Z, Moran MF, Cai Z, Cheng C, Yu J, Tsao MS, He HH. The N6-methyladenosine Epitranscriptomic Landscape of Lung Adenocarcinoma. Cancer Discov. 2024 Jun 25. doi: 10.1158/2159-8290.CD-23-1212IF: 29.7 Q1. Epub ahead of print. PMID: 38922581IF: 29.7 Q1.

生信分析相关性分析和聚类,表转录组、转录组和蛋白质组范围的关联分析,通路富集分析
常规分子实验RNA 测序,免疫沉淀
动物模型及病理分析小鼠肺转移模型
谢!

  
英拜
课题设计与申报|分子生物学实验|细胞|机制调控|多组学检测分析



英拜生物
英拜生物提供专业的课题设计与申报服务,拥有完善的分子实验、细胞功能实验、机制调控实验,动物模型以及多组学检测分析检测平台,为您的科研助力!
 最新文章