研究背景
主要成果
描绘了中国EOC蛋白质图谱,进一步分析了五种病理分型的蛋白质组,揭示了不同亚型的分子特征; 筛选出EOC组织与血液肿瘤恶性相关蛋白标志物; 构建预后预测模型,凸显了外周血蛋白质组学分析对特定疗法(包括免疫疗法)的良好潜力,从而为异质性EOC背景下的精准医学的发展做出了重大贡献。
研究设计
详情见图1、表1。
首先作者收集队列组织、血浆样本,使用PulseDIA技术(相较于传统DIA(数据非依赖采集)有更高的鉴定深度)对组织样本进行蛋白质组学分析,根据以上结果使用Mfuzz方法(一种基于模糊聚类原理的时间序列数据分析方法)进行分析确定了8个蛋白质簇,以识别与卵巢组织恶性程度增加相关的蛋白质。进一步分析筛选处EOC的潜在生物标志物。接着对五种不同病理亚型蛋白质组数据进行分析,揭示各自的分子机制。接下来研究复发队列中组织样本的蛋白质组,以挖掘具有预后意义的特异性蛋白,并使用靶向蛋白质组学方法验证了组织和血浆样本中的预后蛋白质。最后,基于以上数据开发了晚期原发性HGSOC预后预测模型,并成功地在外部队列中得以验证。
研究结果
中国EOC蛋白质组图谱
作者从三个中国队列中收集了753例手术切除的EOC组织,PDS-EOC队列包括EOC的五种组织学亚型,即高级别浆液性癌(HGSOC,80.2%)、低级别浆液性癌(LGSOC,3.4%)、透明细胞癌(CCOC,6.8%)、子宫内膜样癌(EMOC,7.0%)和黏液性癌(MCOC,2.5%),而其他两个队列中的样本几乎均为HGSOC(表1)。此外,作者还纳入了108例具有正常、良性和交界性卵巢组织的患者作为对照(图1A,表1)。
随后,作者使用PulseDIA对来自861名患者的1114个卵巢组织样本进行了蛋白质组学分析,其中1041个样本通过了质量控制。高置信度地定量了10,527种蛋白质(图1A)。与非癌组织相比,在癌组织中鉴定出的蛋白质数量显著增加(图1B)。值得注意的是,全局蛋白质组的无监督聚类能够很好地将正常组织和癌组织区分开来(图1C)。
EOC组织与血浆样本中的恶性肿瘤相关蛋白
首先,作者比较了正常、良性、交界性、早期和晚期原发性癌组织样本的蛋白质组,以识别在卵巢组织中与恶性程度增加相关的蛋白质。作者采用Mfuzz方法进行此分析,确定了八个蛋白质簇,这些蛋白质簇随着恶性程度的增加而持续上调(图1D)。此外,在这2551种上调的蛋白质中,有相当一部分在原发性癌组织与正常组织相比时显著上调(Benjamini-Hochberg[B-H]校正p值<0.05且|log2(倍数变化)|>1)(图1E)。这些与恶性相关的蛋白质主要富集在能量代谢和肿瘤坏死因子(TNF)相关通路中。组织渗漏蛋白-碳水化合物抗原125(CA125),这一公认的EOC生物标志物,用于监测化疗反应和检测复发,也被该策略筛选出来(图1E)。
为了进一步验证这些蛋白质在血液中的存在,作者从PDS-EOC队列中收集了168份在PDS前立即采集的血浆样本,并对它们进行了蛋白质组学分析(图2A)。确认了其中八种分泌候选蛋白在HGSOC患者血浆中相对于非癌个体显著上调(图2A-C)。这些候选蛋白包括CA125(也称为MUC16)、粘蛋白-1(MUC1)、库尼茨型蛋白酶抑制剂1(SPINT1)、血清淀粉样蛋白A-2(SAA2)、几丁质酶-3样蛋白1(CHI3L1)、基质重塑相关蛋白5(MXRA5)和透明质酸酶(HPSE)。其中,酸性鞘磷脂酶样磷酸二酯酶3b(SMPDL3B,细胞膜脂质调节)在HGSOC组中也显著上调(图2B、C)。其高表达与局部前列腺癌的迁移受损和良好预后相关。这表明,SMPDL3B也可能作为EOC的潜在生物标志物。值得注意的是,ASM3B的过表达在卵巢癌中首次被报道,提示其也可能作为EOC的潜在生物标志物。
为了区分卵巢癌与非癌组织,作者构建了15个机器学习模型。这些模型是利用前面提到的八种经过验证的蛋白质及其不同组合,采用随机森林算法开发的。其中八个模型作为优先选择(图2D-F)。值得注意的是,在实验中检测到的MUC16/CA125的重要性低于其他七种蛋白质(图2E),但也仍需在独立的前瞻性队列中进行进一步的验证。
图2 EOC潜在生物标志物在血浆样本中的验证
中国EOC五种组织学亚型的蛋白质组特征
作者对PDS-EOC队列的分析显示,与其他组织学亚型相比,HGSOC的淋巴转移、晚期阶段和化疗耐药性发生率显著较高,这是通过Fisher精确检验确定的(图3A)。然而,大多数分子研究主要集中在HGSOC上,导致这五种组织类型的系统分子特征研究不足。
为了系统地研究PDS队列中五种组织类型的蛋白质组特征,作者共鉴定出4313种在每种组织学亚型与正常卵巢组织样本之间差异表达的蛋白质(DEPs),其中2709种在五种组织类型中显示出显著的失调。在2709种DEPs中,727种在所有亚型中均出现失调,而606种为亚型特异性失调蛋白(图3A)。通过无监督聚类分析,作者发现第4类中的透明细胞卵巢癌(CCOC)特异性上调蛋白富集于中性粒细胞脱粒、补体和凝血级联反应以及多种代谢过程中(图3A,ITIH1、ITIH3和SERPINA1等),这与观察到的血栓栓塞并发症发生率较高以及CCOC组中糖原的形态学富集相一致。
在作者的研究中表明,早期报道的免疫球蛋白受体(PIGR)的EMOC的诊断标志物不仅在EMOC中显著上调,在HGSOC、CCOC和MCOC组中也同样上调(图3C)。类似的偏差也见于膜联蛋白A4(ANXA4)和细胞视黄酸结合蛋白2(CRABP2)(图3C),这表明这些生物标志物候选物可能不适合直接区分PDS-EOC的五种组织学类型。
晚期HGSOC预后相关的蛋白质
原发性HGSOC患者血浆中的预后蛋白
预后预测模型
为了验证组织和血浆样本中的预后蛋白质,作者采用了靶向蛋白质组学方法,并确认了38种组织蛋白质和34种血浆蛋白质与预后相关(图5A)。基于这些已验证的蛋白质特征和七个临床因素,作者开发了三种机器学习模型来预测最后一次化疗周期后的一年内复发情况(图5A)。模型A仅基于五个临床因素,未能区分出具有显著预后差异的两个组。然而,当纳入组织或血浆蛋白质特征时,组织模型B和血浆模型C均能有效预测来自外部验证队列的晚期原发性HGSOC患者的一年内复发情况,该外部验证队列包含与发现和测试队列不同时间段收集的临床样本(对数秩检验,p值分别为0.0094和0.012,图5B-E)。CPTAC队列也作为外部验证集,用于验证组织模型B在中国患者队列之外的适用性。由于CPTAC队列中缺少两个临床因素和AGRE5蛋白表达数据,作者调整了模型,保留了剩余十一个蛋白质特征的原始参数来预测一年内复发情况。修订后的模型在CPTAC队列中显示出显著的预测能力(对数秩检验,p=0.047,图5F)。
总结
参考文献
编译:花城诚成
校对:Evan Flle
排版:小李
封面来源:Freepik
2024-09-22
2024-09-16
2024-09-15
2024-09-01
了解更多蛋白芯片、组学进展请关注下方名片
关于旦生医学
旦生医学(ProteomicsEra Medical Co.,Ltd,)是集高端分子芯片设计、研发、生产和应用为一体的生物医药高科技企业,由留学归国高层次人才创立。企业目标是通过国际前沿生命组学、分子芯片和人工智能技术获取和解析人体健康密码(标志物),开发下一代高通量、智能化临床检测试剂、设备和蛋白药物,为人类的健康保障、疾病预防、检测和治疗提供产品、技术和咨询服务,联系方式:010-85885591,18601967980。
本文来源于公开发表论文,仅供学习交流,不构成商业目的。转载需注明来源芯医学。投稿与合作请留言或联系我们(xinyixue2022@126.com)。