中日友好医院马国林教授课题组于JCR一区《Journal of Translational Medicine》杂志在线发表题为《Immune-related lncRNAs signature and radiomics signature predict the prognosis and immune microenvironment of glioblastoma multiforme》的研究论文,基于影像转录组学探索胶质母细胞瘤免疫特征。
作者:北京协和医学院栾继昕博士研究生为文章的第一作者,聊城市人民医院张娣为并列第一作者,聊城市人民医院张传臣教授为共同通讯作者,中日友好医院马国林教授为通讯作者。
背景:多形性胶质母细胞瘤(GBM)是成人中最常见的原发性恶性脑肿瘤。本研究旨在构建免疫相关lncRNA标签和影像组学标签,以探究GBM患者的预后和免疫浸润。
方法:
从TCGA获得GBM患者的临床信息和基因表达数据用于鉴定免疫相关lncRNA;从TCIA选取相应患者的磁共振数据,提取影像组学特征;分别对以上特征进行单因素和多因素Cox回归,将P<0.05的特征用于构建免疫相关lncRNA标签和影像组学标签并计算风险评分,根据风险评分的中位数将患者分为高、低风险组,绘制风险曲线和生存曲线探讨两种标签对GBM的预后价值。采用基因富集分析(GSEA)和CIBERSORT反卷积算法得到高低风险患者基因富集的信号通路和不同免疫细胞占比,并分析了免疫检查点抑制剂靶点基因与免疫相关lncRNA标签和影像组学标签的相关性。整合免疫相关lncRNA标签、影像组学标签和临床数据建立多因素预后模型,并在区分度、校准度及临床有效性方面与基于临床危险因素构建的预后模型进行性能比较。
结果:
我们鉴定了4个免疫相关lncRNAs特征和2个影像组学特征,这些特征能够将GBM患者分为高风险和低风险组,生存分析差异显著。风险评分曲线和Kaplan-Meier曲线表明,免疫相关的lncRNAs标签和影像组学标签是GBM患者独立预后因素。GSEA表明,免疫相关lncRNA标签标记的高风险组中,基因主要富集于L1CAM交互作用,神经系统等通路;影像组学标签标记的高风险组中,基因主要富集于ROBO受体的信号传递、SLITs和ROBOs的表达调控等通路。免疫相关lncRNA标签和影像组学标签与免疫细胞浸润相关(如活化NK细胞与未活化CD4记忆T细胞等),同时两种标签与免疫检查点抑制剂靶点基因密切相关(例如PD-L1和CTLA-4)。多因素预后模型的曲线下面积(AUC)(0.890,0.887)和C指数(0.737,0.817)均大于临床预后模型,表明鉴别力显著提高。
结论:免疫相关lncRNA标签及影像组学标签能够较好的预测GBM患者的免疫状态及总生存期,有助于临床上进行预后判断及免疫疗法的选择。
关键词:多形性胶质母细胞瘤;免疫相关lncRNA;影像组学;免疫状态;总生存期
多形性胶质母细胞瘤(Glioblastoma multiform, GBM)是最常见且预后最差的中枢神经系统原发性肿瘤,根据患者诊断时的年龄和其他危险因素综合判断,其5年生存率为6-22%。该肿瘤预后受到多种因素的影响,仅仅包括患者年龄、种族、是否接受放化疗,肿瘤的大小、位置、组织细胞学成分等危险因素的预后模型往往难以准确预测患者总生存期(Overall Survival, OS)。因此寻找新的生物预后标志物,对提高GBM患者的生存率,减轻GBM患者的负担至关重要。
非编码RNA包括microRNA(miRNA)和长链非编码RNA(lncRNA),在表观遗传调控中起着至关重要的作用,可作为恶性癌症的诊断标志物。lncRNA在癌症免疫的各个方面起着重要作用,包括抗原暴露、抗原识别、免疫激活、免疫细胞浸润和免疫检查点阻断(ICB)。肿瘤微环境的免疫细胞浸润在GBM亚型和患者中表现出较大的变异,这些因素导致GBM免疫抑制,进而导致免疫治疗失败。因此鉴定与肿瘤微环境相关的免疫细胞有助于阐明GBM免疫抑制的一般机制。基于免疫检查点阻断(Immune checkpoint blockade, ICB)的免疫疗法在多种实体肿瘤中展现出良好疗效,尤其是PD-1/PD-L1信号通路阻断剂在黑色素瘤中取得了巨大成功,成为胶质瘤药物治疗领域的潜在突破口。但是大部分癌症患者对ICB治疗没有阳性反应,因此探寻有效的治疗反应预测性生物标记物,可以提高ICB治疗的阳性反应率。多项研究表明HOTAIR,MALAT1和HIF1A-AS2等lncRNA与GBM的预后有关,已有部分学者利用相关免疫指标判断GBM的预后。有学者针对GBM患者,构建了由六个免疫lncRNA组成的标签,生存分析结果显示高低风险组间有显著差异,但lncRNA与胶质母细胞瘤免疫细胞浸润、免疫检查点阻断之间的相关性尚未可知。
影像组学通过对医学影像数据进行深入挖掘和分析,可以评估肿瘤的免疫浸润及患者的免疫活化状态,预测患者接受免疫治疗的疗效,从而对患者的预后进行判断,是目前医学影像学发展的重要前沿方向。有学者采用影像组学标签评估4个不同队列实体瘤患者的CD8+T细胞浸润水平,结果显示基于CD8细胞评分的影像组学标签可有效预测免疫治疗疗效。同时一项关于影像组学标签预测胃癌免疫评分和疾病预后的研究结果显示,影像组学免疫标签可无创评估肿瘤微环境免疫评分并预测胃癌预后。基于磁共振成像的影像组学分析在GBM诊断和预后中都具有重要作用,如通过组学特征判断体细胞突变或特定分子途径的激活等,特别是增强磁共振T1WI和FLAIR序列图像在组学研究中应用最为广泛。因增强磁共振T1WI需注射含钆对比剂,可能导致肾功能不全患者发生肾源性系统性纤维化,目前基于FLAIR图像的影像组学研究在GBM诊断和预后方面的价值得到更多重视。近年来,有研究表明基于影像组学建立的预后模型性能优于临床因素预后模型,但是影像组学与胶质母细胞瘤免疫细胞浸润、免疫检查点阻断之间的相关性尚未可知。
通过免疫相关lncRNA、影像组学和临床因素的整合研究,有望更加精准的描述与疾病有关的生物学过程,有助于全面了解肿瘤分子免疫特征和样本表型的相互关系。因此,本研究基于癌症基因组图谱(The Cancer Genome Atlas, TCGA) 和癌症成像档案(The Cancer Imaging Archive, TCIA) ,构建免疫相关lncRNA标签和影像组学标签,探讨两种标签与胶质母细胞瘤免疫细胞浸润、免疫检查点阻断之间的相关性,整合两种标签及临床危险因素构建多因素预后模型并进行完善的模型验证,可判断GBM的免疫状态并为每个患者提供个体化的生存概率。
1材料和方法
1.1研究人群
研究样本的纳入标准为:(1)具有来自TCGA GBM项目的转录信息、临床信息(例如患者的性别、年龄、总生存时间等)和(2)来自TCIA的MRI数据,总共174例样本入选。研究样本的排除标准为:(1)样本具有TCGA转录组数据和TCIA MRI数据,(2)TCIA MRI数据质量高,不存在伪影,(3)临床指标信息完整。筛选后共得到62例样本(57例GBM患者,5例对照)被回顾性地纳入本研究。随后,将57个患者随机分成训练集(n=35)和验证集(n =22),比例为6:4。本研究的流程图如图1所示。
图1. 本研究的流程图
1.2 免疫相关的lncRNA获取
首先从分子标记数据库v4.0(Immune system process M13664, Immune response M19817, http:// www.broadinstitute.org/gsea/msigdb/index.jsp)获得与免疫相关的基因。将低表达的免疫基因和lncRNA进行删除,使用R语言的limma包计算免疫基因与lncRNA的皮尔森相关系数,相关系数的绝对值(|correlation|,|cor|)≥0.4,且P<0.01的为免疫相关的lncRNA,如果cor是正值说明是正调控关系,如果cor是负值说明是负调控关系。
1.3图像分割及影像组学特征选择
使用ITK-SNAP(www.itk-snap.org)软件对患者的FLAIR图像进行肿瘤三维分割。FLAIR扫描参数:层厚(thickness)=4~5.5mm,FLAIR(TR/TE=9000~12500/140~57ms),层间距(slicegap)=4~6.5mm,翻转角(flipangle)=80~90°。所有影像组学特征均使用python3.7中的Pyradiomics提取器提取。为了确认特征的可重复性,两名神经放射科医生(医生1:具有5年经验; 医生2:具有7年经验)对从训练集中随机选择的30个样本进行了感兴趣区域(ROI)分割。计算组内相关系数(intraclass correlation coefficient,ICC)以评估两名神经放射科医生测量值的可重复性。ICC>0.75的阈值被设定为考虑两位神经放射科医生之间的良好协议。ICC高于此水平的特征被认为具有可重复性。
1.4构建免疫相关lncRNA和影像组学标签
首先对免疫相关lncRNA和影像组学特征分别进行单因素Cox分析,选取其中P值小于0.05的影像组学特征和P值小于0.01的免疫相关lncRNA进行多因素Cox分析,P < 0.05 的因子被认为是独立的预后相关 GBM,用于构建免疫相关 lncRNA 特征和影像组学特征。根据所选因素的β值计算每位患者的免疫相关lncRNA或影像组学特征的风险评分。根据中位风险评分将患者分为高风险组或低风险组。建立免疫相关lncRNA和影像组学生存曲线,显示高危和低危患者的生存状态。构建结合免疫相关lncRNAs特征、影像组学特征和临床参数的多因素列线图,使临床医生能够轻松准确地预测GBM患者的生存情况。
1.5基因集富集分析
使用基因集富集分析 (Gene Set Enrichment Analysis, GSEA)以探讨免疫相关lncRNA标签和影像组学标签标记的高、低风险两组之间的功能表型。Reactome通路富集分析使用R语言中的richPathway函数,本研究进行了1000次的基因组排列,以获得每次分析的归一化富集得分。p.adjust≤0.05的基因集合被认为是有意义的基因集合。
1.6免疫细胞浸润情况
采用CIBERSORT反卷积算法估计免疫相关lncRNA和影像组学标签标记的高低风险两组之间的不同免疫细胞占比,共涉及初始B细胞、记忆性B细胞、浆细胞等22种免疫细胞的类型。使用小提琴图和相关性热图分析免疫相关lncRNA标签和影像组学标签标记的高低风险组之间的免疫细胞是否有差异,并探索免疫相关lncRNA标签和影像组学标签能否预测GBM免疫细胞浸润情况。
1.7免疫检查点阻断
免疫检查点基因表达可能与免疫检查点抑制剂的治疗反应相关,我们研究了8个以前被报道是免疫检查点抑制剂关键靶点的基因:程序性死亡1(PD-1)及其配体1(PD-L1)和其配体2(PD-L2)、细胞毒性T淋巴细胞抗原4(CTLA-4)、T细胞免疫球蛋白结构域和含粘蛋白结构域的分子3(TIM-3)、淋巴细胞活化基因3(LAG-3)、癌胚抗原相关细胞黏附分子1(CEACAM1)和吲哚胺2,3-二加氧酶1(IDO1)。为了探讨两种标签是否可以成为ICB免疫疗法治疗反应的预测标记物,我们分析了免疫检查点抑制剂关键靶点基因与免疫相关lncRNA标签和影像组学标签的相关性。
1.8构建临床因素及多因素预后模型并进行评价
构建两组不同的预后模型,一是基于临床候选预后危险因素包括年龄、性别、种族、KPS评分、IDH分型等构建的临床因素预后模型,二是基于临床候选预后危险因素、免疫相关lncRNA标签、影像组学标签的多因素预后模型。对构建的临床预后模型,通过反复从训练集中抽取样本,采用10倍交叉验证(Cross-validation)进行内部验证。然后通过验证数据集进行外部验证,以提高模型的泛化能力和临床推广价值。依据预测及预后模型国际指南与标准(TRIPOD),通过ROC曲线(Receiver Operating Characteristic Curve)下面积(Area Under Curve, AUC)、C指数(C-index)、综合判别改善指数(Integrated Discrimination Improvement, IDI)、重分类改善指标(Net Reclassification Index, NRI)来对模型的区分度进行评价。通过绘制模型的校准曲线(Calibration curve),来进行模型的校准度评价。通过决策曲线分析(Decision Curve Analysis, DCA)量化不同概率下的净获益,以确定临床因素预后模型和多因素预后模型的临床有效性。
1.9统计分析
统计分析均采用R 3.6.0(http://www.R-project.org, 2019)。所用R软件包如下:limma包用于计算免疫基因与lncRNA的皮尔森相关系数,survival包用于生存分析,timeROC包用于计算曲线下面积(AUC),用Kaplan-Meier方法绘制生存曲线,并通过log-rank检验进行比较。对训练集和验证集患者之间的连续性变量作t检验并列出P值;对分类型变量做卡方检验并列出P值,如有单元格理论频数小于5,自动增加Fish精确检验。
2 结果
2.1患者临床特征
训练集和验证集患者的临床特征如表1。根据年龄是否大于60岁分为高龄组和低龄组,在训练集和验证集,患者的中位生存时间分别为1.24年和1.62年。训练集及验证集之间的患者年龄、性别、种族、KPS评分、肿瘤分型、CpG岛甲基化仪表型(CIMP)、IDH分型、是否接受放疗、是否接受药物治疗、以及总生存期均无显著统计学差异(P=0.187-1.000)。
表1.训练集、验证集入组患者的人口统计学资料
组别 | 训练集(35) | 验证集(22) | P-value | |
年龄(岁) | 0.187 | |||
<60 | 16 (45.71%) | 14 (63.64%) | ||
>60 | 19 (54.29%) | 8 (36.36%) | ||
性别 | 0.212 | |||
female | 17 (48.57%) | 7 (31.82%) | ||
male | 18 (51.43%) | 15 (68.18%) | ||
种族 | 0.946 | |||
others | 3 (8.57%) | 2 (9.09%) | ||
white | 32 (91.43%) | 20 (90.91%) | ||
KPS评分 | 0.538 | |||
>60 | 25 (71.43%) | 14 (63.64%) | ||
≤60 | 10 (28.57%) | 8 (36.36%) | ||
分型 | 0.915 | |||
Classical | 10 (28.57%) | 6 (27.27%) | ||
N-Classical | 25 (71.43%) | 16 (72.73%) | ||
CIMP状态 | 0.635 | |||
G-CIMP | 2 (5.71%) | 2 (9.09%) | ||
NON G-CIMP | 33 (94.29%) | 20 (90.91%) | ||
IDH分型 | 1.000 | |||
Mutant | 4 (11.43%) | 2 (9.09%) | ||
Wild-type | 31 (88.57%) | 20 (90.91%) | ||
是否放疗 | 1.000 | |||
yes | 4 (11.43%) | 2 (9.09%) | ||
no | 31 (88.57%) | 20 (90.91%) | ||
是否药物治疗 | 1.000 | |||
yes | 5 (14.29%) | 3 (13.64%) | ||
no | 30 (85.71%) | 19 (86.36%) | ||
状态 | 1.000 | |||
alive | 3 (8.57%) | 2 (9.09%) | ||
dead | 32 (91.43%) | 20 (90.91%) | ||
生存时间(年) | survival_time | 1.24 ± 1.23 | 1.62 ± 1.55 | 0.261 |
2.2 免疫相关lncRNA及及影像组学特征
在分子标记数据库v4.0中总共收集了331个免疫相关基因。根据相关系数的绝对值(|correlation|,|cor|)≥0.4,且P<0.01的条件筛选出1286个免疫相关的lncRNA。其中,与PCED1B-AS1、AC109826.1、AL590764.1这三个免疫lncrna相互关联的基因均超过100个。|cor|值排名前五的免疫相关lncRNA和免疫基因的关系见表2.。
表2.免疫相关lncRNA和免疫基因的关系
immuneGene | lncRNA | cor | pvalue | Regulation |
ARHGDIB | PCED1B-AS1 | 0.910 | 6.15E-66 | postive |
TGFB2 | TGFB2-AS1 | 0.917 | 1.42E-68 | postive |
CTSS | AC109826.1 | 0.917 | 1.33E-68 | postive |
CD24 | AL355297.4 | 0.926 | 2.47E-72 | postive |
CD24 | LINC02526 | 0.986 | 1.33E-13 | postive |
ANXA11 | LINC00665 | -0.674 | 9.38E-24 | negative |
PRELID1 | LINC02035 | -0.620 | 2.50E-19 | negative |
RPS19 | BAIAP2-DT | -0.619 | 2.96E-19 | negative |
SART1 | CARD8-AS1 | -0.606 | 2.64E-18 | negative |
PRELID1 | AP003486.1 | -0.600 | 6.41E-18 | negative |
通过pyradiomics插件得到了851个影像组学特征,其中小波滤波器得到的特征744个,LoG滤波器得到的特征93个,基于形状和大小的特征14个。对影像组学特征做单因素Cox生存分析,P值小于0.05的特征有6个(表3)。
表3.与预后有关的影像组学特征
Radiomics feature | P |
log-sigma-3-0-mm-3D_gldm_LargeDependenceLowGrayLevelEmphasis | 0.040 |
log-sigma-3-0-mm-3D_glrlm_LongRunLowGrayLevelEmphasis | 0.044 |
log-sigma-3-0-mm-3D_glszm_LargeAreaHighGrayLevelEmphasis | 0.034 |
wavelet-HLH_glszm_LargeAreaHighGrayLevelEmphasis | 0.025 |
wavelet-LHH_glszm_LargeAreaHighGrayLevelEmphasis | 0.036 |
wavelet-LLH_gldm_GrayLevelNonUniformity | 0.032 |
2.3构建免疫相关lncRNA和影像组学标签
对免疫相关lncRNA进行单因素Cox生存分析,得到P值小于0.01的免疫相关lncRNA有9个,对这些特征进行多因素Cox回归分析,利用AIC信息准则筛选关键预后特征,最后得到P值<0.01的免疫相关lncRNA有4个,分别是AC025171.5、AC068888.1、AC080112.1、AC002401.4,将以上得到的4个免疫相关lncRNA作为免疫相关lncRNA标签(表4)。对影像组学特征进行单因素Cox生存分析,得到P值小于0.05的影像组学特征有6个,对这些特征进行多因素Cox回归分析,利用AIC信息准则筛选关键预后特征,最后得到P值<0.05的影像组学特征有2个,分别是log-sigma-3-0-mm-3D _gldm_ LargeDependen LowGrayLevelEmphasis、log-sigma-3-0-mm-3D_glszm_LargeAreaHighGrayLevel Emphasis,将以上得到的2个影像组学特征作为影像组学标签(表4)。
表4.免疫相关lncRNA与影像组学特征
Radiomics signature | LncRNAs signature | ||||
Radiomics features | Coefficient | P-value | LncRNAs | Coefficient | P-value |
log-sigma-3–0 mm-3D_gldm_LargeDependenceLowGrayLevelEmphasis | − 2.66E-02 | 0.026 | AC025171.5 | 1.021 | P < 0.01 |
AC068888.1 | 1.443 | P < 0.01 | |||
log-sigma-3–0 mm-3D_glszm_LargeAreaHighGrayLevelEmphasis | − 2.22E-09 | 0.021 | AC080112.1 | 1.061 | P < 0.01 |
AC002401.4 | 1.191 | P < 0.01 |
2.4免疫相关lncRNAs和影像组学标签的风险曲线和生存曲线
计算免疫相关lncRNA标签和影像组学标签的风险分数,根据风险分数的中位数,将患者分为高风险或低风险组。随着风险分数的增加,患者的存活时间也在逐步下降(图2.A.B)。生存曲线显示了高风险和低风险患者的生存状况,结果显示免疫相关lncRNAs和影像组学风险评分中位数标记的高、低风险组的生存曲线均有统计学差异(log-rank检验,P<0.05),结果见(图2.C.D)。
图2.免疫相关lncRNA标签和影像组学标签的风险曲线和生存曲线。从上到下:低危组和高危组的风险评分曲线、生存状态图、表达热图和生存曲线。(A)GBM患者免疫相关lncRNA的风险评分、生存状态和免疫相关lncRNA表达的分布。(B)GBM患者影像组学特征的风险评分、生存状态和影像组学值的分布。(C)基于免疫相关lncRNAs风险评分中位数的高风险组和低风险组的Kaplan-Meier生存曲线。(D)基于影像组学风险评分中位数的高风险组和低风险组的Kaplan-Meier生存曲线。
2.5免疫相关lncRNA标签和影像组学标签的基因富集结果
为了探索与GBM进展相关的免疫相关lncRNA和影像组学标签的潜在分子机制,本研究分别在免疫相关lncRNA标签和影像组学标签标记的高、低风险组之间进行了GSEA。Reactome通路富集分析结果显示:在免疫相关lncRNA标签标记的高风险组中,基因主要富集于L1细胞粘附分子交互作用(L1CAM interactions),神经系统(Neuronal System),糖胺聚糖代谢(Glycosaminoglycan metabolism),细胞外基质的降解(Degradation of the extracellular matrix)等通路(图3a)。在影像组学标签标记的高风险组中,基因主要富集于细胞核和细胞质中的rRNA加工(rRNA processing in the nucleus and cytosol),ROBO受体的信号传递(Signaling by ROBO receptors),核仁和细胞质中rRNA加工的主要途径(Major pathway of rRNA processing in the nucleolus and cytosol),SLITs和ROBOs的表达调控(Regulation of expression of SLITs and ROBOs)等通路(图3b)。
图3.基因集富集分析的富集图。图3a.免疫相关lncRNA标签标记的高、低风险组中的差异基因富集,图3b.影像组学标签标记的高、低风险组中的差异基因富集。
2.6 免疫细胞浸润情况
接下来,我们评估了GBM中免疫相关lncRNA标签和影像组学标签与肿瘤免疫微环境之间的关系。使用CIBERSORT获得免疫细胞浸润,并分析两种风险评分与免疫细胞浸润之间的相关性。在免疫相关lncRNAs标签中,我们观察到与低风险组相比,高风险组中B细胞记忆和巨噬细胞M0的表达更高(P < 0.05),而B细胞、单核细胞和巨噬细胞M1在高危组中的水平低于低危组(P < 0.05)(图4A)。在影像组学特征中,我们观察到与低风险组相比,高风险组中巨噬细胞M1的表达更高(P < 0.05),而静息NK细胞和中性粒细胞在高危组中的水平低于低危组(P < 0.05)(图4B)。接下来,我们分析了GBM中风险评分与肿瘤微环境的相关性以及两种风险评分。我们发现与影像组学评分和T细胞CD4记忆静息呈正相关(cor = 0.34,P < 0.05),与免疫相关lncRNAs评分和NK细胞活化呈正相关(cor = 0.34,P < 0.05)。同时,我们发现与影像组学评分和免疫相关lncRNAs评分呈正相关(cor = 0.39,P < 0.05)(图4C)。
图4.免疫相关lncRNAs特征、影像组学特征与免疫细胞浸润的关系。(A)Violin图显示了通过免疫相关lncRNA标签识别的高风险组和低风险组,红色表示高风险,绿色表示低风险;(B)Violin图显示了通过影像组学特征识别的高风险组和低风险组,红色表示高风险,绿色表示低风险;(C)相关热图显示了两种风险评分与免疫细胞浸润之间的相关性。
2.7免疫相关lncRNA标签和影像组学标签与ICB关键靶点的相关性
ICB在免疫治疗中的应用已成为治疗各种癌症的一种有前景的辅助手段。因此,我们研究了我们的免疫相关lncRNA标签的可能作用,通过评估免疫检查点抑制剂的八个已知靶点(包括PD-1、PD-L1、PD-L2、CTLA-4、TIM-3、LAG-3、CEACAM1、IDO1)与免疫相关lncRNA标签和影像组学标签的关系,GBM ICB治疗中的影像组学特征(图5A)。我们发现与免疫相关的lncRNA评分和PD-L1呈负相关(cor=−0.61;P<0.05),与评分和CTLA-4负相关(cor=−0.43;P<0.05),与影像组学评分和PD-L1负相关(cor=−0.45;P<0.05);与评分和CTCA-4负相关(cor=−0.41;P<0.05)(图5B-E)。
图5.免疫相关lncRNAs特征、影像组学特征与免疫检查点基因的关系。(A)这两个特征与免疫检查点基因之间的相关性,红色表示正相关,蓝色表示负相关。(B-E)两个特征与PD-L1、CTLA-4之间的相关性(P<0.05)。
2.8独立风险因素分析
单变量Cox分析显示,CIMP(HR=9.435;P=0.027)、IDH(HR=4.396;P=0.014)、放射治疗(HR=3.099;P=0.011)、药物治疗(HR=2.491;P=0.021)、免疫相关lncRNA风险水平(HR=3.912;P<0.01)和影像组学风险水平(HR=1.976;P=0.022)是GBM总生存率的预后因素(表5);多变量Cox分析显示,放射治疗(HR=3.434;P=0.024)、免疫相关lncRNAs风险水平(HR=5.489;P<0.01)和影像组学风险水平(HR=3.300;P<0.01)是GBM总生存率的预后因素(表5)。Cox回归的森林图如图6A、B所示。多因素列线图中包括单变量Cox分析中P<0.05的预后因素,结合免疫相关lncRNAs特征、影像组学特征和临床因素的多因素列线图如图6C所示。使用列线图可以预测GBM患者1年,2年和3年生存概率。该模型的校准图显示出更好的校准性能(图6D)。
表5.GBM患者总生存期的单因素和多因素cox分析
Variables | Univariate analysis | Multivariate analysis | |||
Hazard ratio (95% CI) | p value | Hazard ratio (95% CI) | p value | ||
age >60 | 1.594 (0.916-2.773) | 0.099 | |||
sex Male | 0.978 (0.557-1.718) | 0.938 | |||
race White | 1.018 (0.365-2.843) | 0.972 | |||
KPS ≤60 | 1.241 (0.681-2.262) | 0.481 | |||
Subtype Non-classical | 0.861 (0.472-1.568) | 0.624 | |||
CIMP Non G-CIMP | 9.435 (1.285-69.261) | 0.027 | 1.368 (0.109-17.102) | 0.808 | |
IDH Wild-type | 4.396 (1.350-14.317) | 0.014 | 3.057 (0.712-13.128) | 0.133 | |
radiation No | 3.099 (1.297-7.409) | 0.011 | 3.434 (1.173-10.054) | 0.024 | |
pharmaceutical No | 2.491 (0.185-5.392) | 0.021 | 2.238(0.827-6.054) | 0.113 | |
lncRNA_risk_level High | 3.912 (1.998-7.661) | < 0.01 | 5.489 (2.674-11.271) | < 0.01 | |
radiomics_risk_level High | 1.976 (1.104-3.538) | 0.022 | 3.300 (1.681-6.481) | < 0.01 |
图6.Cox回归分析的森林图和多因素列线图。(A)单变量Cox回归分析表明:CIMP、放射治疗、药物治疗、免疫lncRNA标签、影像组学标签对预后有统计学意义,P<0.05。(B)多变量Cox回归分析表明:放射治疗、免疫lncRNA标签、影像组学标签对预后有统计学意义,P<0.05。(C)预测GBM患者生存率的多因素列线图。(D)预测GBM患者生存率的多因素列线图模型校准图。
2.9预后模型的评价
与临床预后模型相比,多因素预后模型的AUC值(训练集:0.890 vs.0.684,验证集:0.887 vs.0.811)和C指数(训练集,0.737 vs.0.658,验证集,0.817 vs.0.807)表现出更好的预测性能(表6)。IDI和NRI是统计学中用于评估预测模型性能改进的指标。当将免疫相关lncRNA特征和影像组学特征添加到临床预后模型中时,训练集中的IDI为0.071,NRI为1.327,验证集中的IDI为0.063,NRI是0.693,表明有很强的重新分类改善(表6)。此外,DCA曲线表明多因素预后模型比临床预后模型具有更高的总体净效益(图7C)。
表5.训练集和验证集不同预后模型区分度指标
指标 | 分类 | 训练集 | 验证集 |
AUC | 临床因素预后模型 | 0.684 | 0.811 |
多因素预后模型 | 0.890 | 0.887 | |
C指数 | 临床因素预后模型 | 0.658 | 0.807 |
多因素预后模型 | 0.737 | 0.817 | |
IDI | 多因素VS临床因素预后模型 | 0.071 | 0.063 |
NRI | 多因素VS临床因素预后模型 | 1.327 | 0.693 |
图7.不同预后模型的ROC曲线和DCA决策曲线。(A,B)训练集和验证集中多因素预后模型和临床预后模型的ROC曲线;蓝线表示多因素预后模型,红线表示临床预后模型。(C)DCA决策曲线,蓝线表示多因素预后模型,红线表示临床预后模型。
3.讨论
胶质母细胞瘤是一种高度异质性肿瘤,具有相似临床危险因素的不同患者预后差异很大。肿瘤微环境中的免疫状态参与了癌症的进展、转移和复发,是造成肿瘤不良预后的重要原因。研究表明,免疫相关的lncRNA和影像组学特征可以作为GBM的生物标记物,为GBM的治疗及预后提供潜在信息。然而,免疫相关lncRNA与影像组学特征与肿瘤微环境中的免疫状态是否相关尚未可知。因此,本研究基于TCGA和TCIA,构建了由4个lncRNA组成的免疫相关lncRNA标签和由2个影像组学特征组成的影像组学标签,探讨免疫相关lncRNA标签和影像组学标签与GBM免疫细胞浸润、免疫检查点阻断之间的相关性,结合临床信息建立了多因素预后模型并进行了完善的模型验证,能够较为准确的预测GBM患者的总生存期并指导患者免疫疗法的选择。
lncRNA在脑组织、视网膜等多种神经组织或细胞中均有表达,与神经系统肿瘤的发生发展具有密切联系。lncRNA是免疫反应的关键调节因子,参与癌症自噬、基因激活、炎症与免疫反应并促进免疫表型,越来越多的证据表明,免疫相关的lncRNA是癌症治疗的潜在靶点,并且对生存预后具有预测价值。本研究构建的免疫相关的lncRNA标签由4个lncRNA组成,单因素Cox分析显示其与GBM生存密切相关。免疫相关lncRNA标签标记的高风险组中,基因主要富集于L1CAM交互作用,神经系统等通路。研究表明,L1CAM强阳性表达与胶质瘤的不良预后显著相关,说明其可能是胶质瘤有希望的治疗靶点。本研究的免疫相关lncRNA标签与活化NK细胞含量呈正相关,有学者研究发现白细胞介素2(IL-2)激活的自然杀伤细胞(NK细胞)对人脑胶质瘤具有抑制杀伤作用,可以延缓胶质瘤的生长,这与本研究的发现相似。本研究的免疫相关lncRNA标签与ICB免疫疗法相关基因(即PD-L1和CTLA-4)相关。有学者发现:PDL1表达变化与胶质瘤患者预后呈负相关,并且胶质母细胞瘤患者外周血CD4和CD8 T细胞表面的CTLA-4表达变化与预后同样呈负相关,这表明标签可能具有预测GBM对免疫疗法反应的作用。有学者利用lncRNA构建预后标签,以此评估GBM预后,如Zhang等通过分析TCGA中213个GBM肿瘤患者的lncRNA表达谱,鉴定出与总体存活率相关的6-lncRNA。Gao等通过对233名GBM患者的蛋白质编码基因(PCG)和lncRNA基因表达谱分析得到六种PCG和五种lncRNA,可以将患者分为生存率明显不同的高风险或低风险组(中位生存时间分别为7.47个月与18.27个月,P <0.001)。此外,Gao等的研究所获得的lncRNA与本研究相互有重叠,这说明了lncRNA由于不编码蛋白质,具有多重转录的稳定性,是日常实践中较好的生物预测标记物。
影像组学将数字医学图像转化为可挖掘的高维特征,并建立统计模型对特征进行分析,已广泛应用于肿瘤诊断,预后预测,治疗选择等方面。磁共振在GBM的预后评估中有重要作用,其中增强扫描及FLAIR应用最广泛。增强扫描可全面反映肿瘤位置、数目、大小、信号强弱及病灶周边情况,在一定程度上可以评估GBM预后。有学者基于磁共振T1WI增强图像提取影像组学特征构建了GBM预后模型,其训练集一年生存率AUC为0.819。FLAIR对显示肿瘤边界和水肿范围更具优势,据统计,有90%的胶质母细胞瘤复发都发生在瘤周水肿区域(Peritumoral brain zone, PBZ),人们普遍认为肿瘤细胞浸润到PBZ可能促进复发,并且证明其与GBM的预后相关。部分进展患者在增强扫描中无明显强化,但在FLAIR序列上表现为高信号。因此探讨非增强FLAIR序列在胶质瘤的预后判别中十分重要。本研究结果表明,在FLAIR序列得到的2个影像组学特征与GBM的生存密切相关,其分别来自灰度相依矩阵(GLDM)和灰度区域大小矩阵(GLSZM),这些特征表明了GBM的灰度异质性。与本研究发现一致的是,Liu等发现,灰度共生矩阵(GLCM)和灰度游程矩阵(GLRLM)中的特征反映了区域异质性,有助于判断GBM患者生存长期和短期组之间的差异。同样Chaddad等对39例GBM患者T1增强及FLAIR序列的研究发现,肿瘤强化区及水肿区提取的灰度共生矩阵(GLCM)参数与患者生存率具有良好的相关性(P<0.01)。在影像组学标签标记的高风险组中,基因主要富集于ROBO受体的信号传递、SLITs和ROBOs的表达调控等通路。SLITs和ROBOs信号蛋白是神经细胞迁移分布、轴突导向的重要信号调节因子,其通过抑制Cdc42-GTP的活性可以抑制胶质瘤细胞的侵袭作用。本研究的影像组学标签与静息记忆CD4+T细胞含量和免疫相关lncRNA标签呈正相关,有学者研究发现GBM中所富含的M2巨噬细胞、静息记忆CD4+T细胞和活化的树突状细胞是免疫治疗的理想候选细胞,这与本研究的结果相似,表明两种标签可以评估GBM的免疫细胞浸润状态。本研究通过关联分析表明,八种ICB免疫疗法相关基因相互共表达,这与先前报道的黑色素瘤中免疫检查点抑制剂关键靶点基因共表达结果相似。但是我们的研究也呈现了一些不相互关联的基因,可能是由于我们的样本数量过少的原因。
本研究所建立的多因素预后模型在区分度、校准度及临床有效性均优于临床因素预后模型。目前大多数的研究只利用临床因素构建预后模型。有部分学者根据lncRNA建立预后模型,如Zhou等建立了由免疫相关lncRNA构建的预后模型,可以将患者分为高危和低危人群,生存分析log-rank检验P=3.87e-09。也有一些学者结合影像特征建立预后模型,如Tan等发现:纳入影像特征的影像组学预后模型的表现优于临床因素预后模型(训练集AUC = 0.913和0.817;验证集AUC = 0.900和0.804)。也有一些学者联合转录组学、影像组学和临床病理参数,构建预后模型以评估胶质瘤的预后,如Chaddad等结合了影像组学特征、临床特征(治疗类型、年龄)、基因组学和蛋白质表达的复合模型获得了最大的曲线下面积(AUC=0.782,P=2.90e-05)。但他们没有对模型进行完善的区分度、校准度及临床有效性评价。本研究将免疫相关lncRNA和影像组学特征共同纳入构建多因素预后模型,其预测性能更加优越,训练集和验证集中预测一年生存率的AUC相比于临床预后模型都更高。
本研究存在一些局限性,可以在以后的工作中得以解决。首先,本研究在TCIA数据库中回顾性地收集MRI图像,其扫描参数变化较大。并且要保证研究人群同时具有lncRNA和影像组学数据,因此仅纳入了62例样本,部分患者的临床风险因素也不完整,如MGMT状态等。在未来我们将进行前瞻性的研究,收集更多患者,保证扫描参数的一致性以对GBM患者的生存率实现更精准的预测。其次,由于序列图像中存在大量冗余信息,这导致手动分割的巨大工作量和主观性的存在。一种较为成熟的方式是利用卷积神经网络(Convolutional Neural Networks, CNN)等深度学习模型直接从图像中学习特征,这样节省了工作量并减少了主观性的存在。最后,本研究仅在FLAIR序列上提取特征构建多因素Cox预后模型,并未将结构像及其他功能磁共振成像技术如动态磁敏感对比增强成像(Dynamic Susceptibility Contrast, DSC)、扩散峰度成像(Diffusion Kurtosis Imaging, DKI)等纳入模型。在未来,我们将增加新型成像技术并结合肿瘤免疫、影像组学、基因组学、转录组学等进行联合分析,以期更加精准客观的评估GBM患者预后。
总之,本研究基于TCGA和TCIA数据库,确定了由4个lncRNA组成的免疫相关lncRNA标签和2个影像特征组成的影像组学标签,两种标签与GBM的进展和预后相关,同时与免疫细胞浸润和潜在的ICB免疫治疗相关基因有关,此外开发并验证了基于两种标签和临床信息的GBM预后模型,在区分度、校准度及临床有效性方面显示了优秀的性能。因此,本研究为GBM个体化的预后评估和ICB免疫治疗反应的检测提供了一种可能的方法,在肿瘤免疫治疗中具有重要的临床应用价值。
培训班推荐
FAQ
部分免费视频课程推荐(请点击浏览)
软件推荐(请点击浏览)
科研服务
赛博尔医学算法和数据处理平台:免下载、免安装、免编程、自动化、高速海量存储,支持机器学习和人工智能,可支持上万种医学软件
(请点击上面文字查看详情。我们提供大量的服务器、存储等各种 IT 硬件资源和软件自动化服务。如果要试用,请实名提供个人信息和研究方向。)
灌注数据处理服务
EEG/ERP数据处理服务
近红外数据处理服务
PET数据处理服务
功能磁共振数据处理
结构磁共振数据处理
动物影像数据处理
详情联系: 13381109780(杨老师)
Email: bd@medicalai.top
招聘信息:脑影像数据处理工程师(上海、北京)
请点击关注下面的公众号图标,跟进国际医学科研行业最新进展