这篇文章的作者团队由多机构的研究人员组成,共同致力于提高非小细胞肺癌(NSCLC)复发预测的准确性。文章的共同第一作者包括Sheeba J. Sujit和Muhammad Aminu,他们与通讯作者Jia Wu一起构思和设计了这项研究。参与这项工作的其他作者还包括来自不同领域的专家,他们分别来自德克萨斯大学MD Anderson癌症中心、杜克大学、密歇根大学、莱斯大学、斯坦福医学院等机构。2024年在nature communications (JCR Q1, IF: 14.7) 杂志上发表了提高非小细胞肺癌(NSCLC)复发预测的PET/CT栖息地成像、ctDNA和整合放射基因组学-血液洞察
提高非小细胞肺癌(NSCLC)复发预测的PET/CT栖息地成像、ctDNA和整合放射基因组学-血液洞察
虽然认识到临床病理测量和循环肿瘤DNA(ctDNA)的预后重要性,但定量图像标记在非小细胞肺癌(NSCLC)预后中的独立贡献仍然未被充分探索。在对394名NSCLC患者的多机构研究中,使用预处理计算机断层扫描(CT)和18F-荧光脱氧葡萄糖正电子发射断层扫描(FDG-PET)建立了一个栖息地成像框架,用于评估单个肿瘤内的区域异质性。该框架识别出三个PET/CT亚型,在调整包括肿瘤体积在内的临床病理风险因素后,这些亚型保持了预后价值。此外,这些亚型与ctDNA互补,可以预测疾病复发。放射基因组学分析揭示了这些成像亚型的分子基础,突出了高风险亚型中干扰素α和γ途径的下调。总之,研究表明,这些栖息地成像亚型有效地根据疾病复发风险水平对NSCLC患者进行分层,为初始治愈性手术或放疗后的患者提供有价值的个性化治疗洞察。
尽管在外科方法、放射治疗和免疫检查点抑制剂的使用方面取得了进展,但非小细胞肺癌(NSCLC)的治疗结果仍然不佳。在早期或局部晚期NSCLC中,有30%到55%的患者会出现疾病复发并最终死亡。表皮生长因子酪氨酸激酶抑制剂和免疫疗法与化疗已分别获准用于辅助和新辅助设置。然而,迫切需要非侵入性标记物来预测疾病复发,以在围手术期设置中分层患者并指导治疗升级或降级。计算机断层扫描(CT)和18F-荧光脱氧葡萄糖正电子发射断层扫描(18F-FDG PET)是常规用于NSCLC患者的初始分期、放射治疗计划和反应评估的非侵入性工具。最近,放射组学特征已经显示出与NSCLC结果相关的预后能力。然而,考虑到CT和PET是不同的(解剖与代谢)并且是互补的,这些研究主要使用单一模式捕获肿瘤特征,代表了肿瘤的局部视图。另一个基本限制是缺乏对肿瘤内区域变化的分析。尽管纹理分析已应用于测量肿瘤内异质性,但它假设肿瘤内是均匀混合的,这在组织和细胞水平上已被证明是不正确的。根据团队和其他人进行的多区域分子分析,肿瘤是一个复杂的生态系统,具有区域变化。肿瘤内异质性是一个促进肿瘤生长和抵抗的动态因素,通常表示预后不良。尽管从癌症生物学的角度对肿瘤细胞的分子异质性进行了表征,但尚不清楚这种异质性在宏观放射线照相扫描上会如何表现。鉴于成像描绘了单个肿瘤的空间异质性,新兴的栖息地成像工具被建议用来捕获这些区域差异,并在不同癌症类型中具有临床意义。
栖息地成像是癌症成像中用于识别共享成像特征的肿瘤亚区域或“栖息地”的现代方法。目标是使用栖息地成像模式来定义在CT和FDG-PET上表现的内在放射学亚型,并进一步通过多机构、多模式(成像和基因组学)的切除NSCLC队列来测试它们的临床相关性,通过使用多区域空间相互作用(MSI)特征来分层患者在治愈性手术或放疗后的复发风险。还展示了循环肿瘤DNA(ctDNA),这是一种新兴的血液标记物,与我们提出的栖息地成像亚型的附加价值。最后,进行了放射基因组学分析,以确定这些栖息地成像亚型的生物学。
研究设计
研究设计显示了基于栖息地成像的放射组学分析的三个主要阶段:数据获取和预处理、栖息地成像分析以及成像亚型的临床和生物学价值。简而言之,收集并质量控制了多中心CT和PET扫描。栖息地成像用于定义肿瘤亚区域,随后对这些亚区域的架构和相互作用进行分析。然后,使用无监督聚类方法,将患者分层为栖息地成像亚型。最后,评估了成像亚型在预测RFS和OS方面相对于常规CT/PET标记物、临床病理因素和血液ctDNA的临床价值。此外,通过放射基因组学46研究了成像亚型的分子途径水平相关性。患者队列
第一队列从德克萨斯大学MD Anderson癌症中心的PROSPECT队列(胸部癌症评估中的抗性模式和致癌途径的分析)中选择。从这个群体中,包括了75名有术前CT和PET扫描可用的患者。第二队列从TCIA(癌症成像档案库)中选择。在斯坦福医学中心接受手术治疗的211名经组织学或细胞学证实的I至IIIB期NSCLC患者中,包括了124名有术前CT和PET扫描的患者。第三队列是ICON(非小细胞肺癌免疫基因组学项目)。在这个队列中,包括了133名有术前CT和PET扫描可用的临床分期IA-IIIA NSCLC患者。第四个队列来自多中心ACRIN 6668/RTOG 0235试验。在收集图像和临床数据后,62名患者被纳入研究,使用栖息地成像分析进行定量。PROSPECT和TCIA队列用于模型发现,ICON和ACRIN队列用于内部和外部验证。
图像获取
首先,PROSPECT图像是使用专用CT/PET系统(Discovery ST, STe, 或 RX; GE Medical Systems和GE Healthcare)获得的,层厚为2.5至10毫米(中位数:5毫米)。在至少禁食6小时并确认血糖水平低于200毫克/分升后,患者接受了259-740 MBq 18F-FDG的静脉注射。进行CT扫描以获取解剖对应和衰减校正;PET图像在18F-FDG注射后60-90分钟获得。其次,TCIA的图像、基因表达和临床信息可在公共领域获得。TCIA数据集包含使用不同扫描仪、扫描协议和参数回顾性收集的DICOM格式的CT图像:层厚为0.625-3毫米(中位数:1.5毫米)。空腹Fluorodeoxyglucose18F-FDG PET/CT数据是使用GE Discovery PET/CT扫描仪收集的。FDG剂量和摄取时间分别为138.90-572.25 MBq(平均309.26 MBq)和23.08-128.90分钟(平均66.58分钟)。第三,ICON CT扫描是在多探测器扫描仪上获得的,通常在IV对比剂给药后进行,除非有禁忌症。使用标准和高空间重建算法重建的多平面CT图像系列,层厚为2.5毫米。FDGPET/CT成像是使用Discovery STE PET/CT扫描仪(GE Healthcare, Waukesha, WI, USA)进行的。所有患者在FDG注射前禁食6小时,并确认正常的空腹血糖水平低于200毫克/分升。PET在三维模式下进行,每个床位站的时间为3-5分钟,取决于患者的BMI。获得的PET数据被校正为散射巧合、随机巧合、死时间和衰减,并使用OSEM在标准厂商提供的工作站上重建。
使用肺窗口设置对CT扫描进行标准化,以突出解剖结构。还通过体重(SUVbw)对PET扫描进行标准化,将其转换为标准化摄取值(SUV)图,以量化FDG摄取并消除变异性。然后使用Elastix软件(版本5.0.1)中的仿射注册对PET图像和CT进行空间对齐。此外,对注册质量进行了视觉检查,以确保跨肿瘤区域、同侧肺和其他组织的对齐。对于需要微调注册结果的案例,使用3D Slicer(版本4.11)进行手动对齐。然后计算了标准化CT和PET扫描的局部熵,并确保多模态图像被标准化为相同的像素分辨率1毫米²。由经验丰富的临床放射科医生进行目标肿瘤区域的识别和分割,他们利用自己的专业知识和可用的临床数据集。使用MIM软件执行精确的肿瘤区域注释,采用手动分割过程。为了确保准确性和一致性,分割结果经过三位独立和专业的放射科医生进行全面的交叉检查。采取这种严格的方法,以确保肿瘤区域注释的可靠性和精确性。
为了区分肿瘤区域内空间上不同的亚区域,提出了一个栖息地成像框架(图2b),通过扩展我们之前的计算栖息地框架。对于进一步分析,使用了来自CT和PET数据的空间对齐的肿瘤区域。此外,使用肿瘤的局部熵图计算了局部纹理的复杂性。熵是用于表征图像纹理的随机性或不确定性的统计度量。较高的熵值表示更深层次的特征,熵图显示为灰度图像。CT、CT熵、PET和PET熵图像被融合,整合了解剖、代谢、强度和纹理信息,以定义肿瘤异质性。通过图像融合,指的是将不同图像模态(CT、CT熵、PET和PET熵)的相应像素值相加,生成用于栖息地检测的纹理丰富的合成图像。使用k均值聚类算法将特征图在患者水平上过分割为超像素,以欧几里得距离作为相似性度量。基于直方图分析中的灰度频率分布,为每个超像素提取了一阶特征(n = 40),包括偏度、峰度、均值、中位数、第一四分位数、第二四分位数、四分位距、标准差、方差和能量,分别在4种不同的图上计算。其次,使用Seurat(版本4.0)中的Louvain算法分别对3个队列进行聚类。在确认不同队列的聚类结果一致性后,从整个人群水平聚合超像素,以识别统一的栖息地区域。为了量化栖息地图上的肿瘤内异质性,使用了多区域空间相互作用(MSI)矩阵,该矩阵总结了不同栖息地区域之间的空间共现统计信息(图2b)。具体来说,对于每个肿瘤体素,扫描其邻居的共现对,并将其添加到MSI矩阵中的相应单元格中。通过共现对,指的是检查每个像素并找到其在3D中的直接最近邻居。如果它们的边或角接触,则像素是连接的。在通过所有肿瘤体素迭代此过程后,肿瘤内栖息地的空间分布和相互作用被抽象在MSI矩阵中。为了量化肿瘤内空间异质性,然后从MSI矩阵中提取定量特征。这些特征包括1)绝对体积、每个亚区域的比例以及2个相互作用亚区域边界的第一阶统计特征;以及2)在标准化MSI矩阵上计算的对比度、均匀性、相关性和能量的第二阶统计特征。在基于像素连通性构建MSI矩阵后,将MSI矩阵作为输入提供给MATLAB中的graycoprops函数,以计算MSI矩阵的4个第二阶统计属性,包括对比度、均匀性、相关性和能量。鉴于MSI特征,应用了共识聚类算法来识别发现和验证队列中的最佳成像亚型数量。与传统算法的一次性聚类相比,共识聚类在子采样的患者和特征上重复聚类,对于检测内在聚类更为稳健。我们选择了具有Spearman距离度量的partition-around-medoids聚类算法。聚类数量从2到5不等,并选择了产生最佳共识的最优聚类数量。使用累积分布函数(CDF)曲线测试了k = 2至k = 5的共识矩阵。一个完美的共识矩阵将完全用0和1填充,从而显示CDF曲线的理想阶梯函数。评估了识别出的成像亚型的预后能力(图2c)。在单变量分析中,将成像亚型与已建立的临床病理风险因素(包括年龄、性别、临床T类别、吸烟状态、组织学和新辅助化疗)和常规CT/PET标记物(在CT扫描上描绘的肿瘤体积、代谢、肿瘤体积[MTV]、总病变糖酵解[TLG]和SUVmax)进行比较。然后,使用多变量分析测试了成像亚型相对于这些已知风险因素的额外临床价值。肿瘤体积作为肺癌预后中的关键预测因素,对疾病复发和总生存期有重大影响。认识到其关键作用,系统地解决了肿瘤体积对我们提出的栖息地成像亚型意义的潜在影响。术前和治疗后的标准治疗(SOC)治疗后存在的ctDNA表明存在残留的微转移性疾病,这与NSCLC治疗后的RFS较差相关,而其缺失则预测了低复发风险。治疗后的标准治疗(SOC)治疗定义为手术和新辅助或辅助化疗,以及/或如果进行的术后放疗(PORT)。根据ctDNA清除状态,定义了三个类别:在整个研究期间未检测到循环肿瘤(ctDNA)(从未检测到组),在治疗期间清除ctDNA的患者(清除组)和持续检测到ctDNA的患者(持续组)。鉴于ctDNA存在/清除状态,评估了ctDNA与提出的成像亚型结合的预后意义,并探索了它们是否可以相互补充。使用来自三个研究队列的患者配对的转录组数据进行分子途径分析,以探索栖息地成像分型的生物学机制。对每个队列应用基因集富集分析,并使用R包QuSAGE对组合队列进行元-基因集富集分析。专注于分子签名数据库(MSigDB)中的标志性基因集(版本2022.1)。使用<0.2的假发现率选择显著激活和抑制的途径。 结果患者特征的多中心数据
回顾性地收集了来自4个独立NSCLC队列的多模态数据(CT和PET,基因表达,临床特征),共有394名患者(图1)。发现队列(n = 199)和内部验证队列(n = 195)显示出类似的人口统计分布(表1)。在研究中包括的394名NSCLC患者中,有224名(57%)是男性,中位年龄为67岁。近42%的患者患有I期NSCLC。发现队列的中位复发时间为43个月,内部验证队列为35个月(P = 0.56)。ICON队列的平均治疗期为37天,PROSPECT队列为36.5天。图2展示了基于栖息地成像的放射组学分析的总体研究设计。
具有不同成像表型的栖息地亚区域的识别
在发现和验证队列中,出现了八个肿瘤亚区域(簇),确认了它们在不同队列中的一致性,如UMAP中所嵌入的(图3a,b)。通过对超像素级放射组学空间的映射来注释各个亚区域,揭示了它们在不同队列中一致的不同放射学模式(补充图1a)。每个这八个栖息地亚区域都有独特的成像表型,如图3c、补充图1b和补充数据7所示。对于簇3和4,CT Hounsfield单位(HU)数量高,而PET SUV和PET熵值低(L)。基于补充图1b中的小提琴图,观察到簇3和4中CT Hounsfield单位(HU)数量或CT HU数量分布远高于相同簇中的PET SUV值分布。这表明组织更密集。对于簇7和8,CT数量和PET SUV高,CT熵低,分别。图3d展示了来自发现队列的六例患者的栖息地图,它们揭示了高风险患者中簇7和8的显著流行,以及低风险患者中的簇3和4。
通过整合每个患者的肿瘤区域的CT和PET扫描识别出的八个簇,提取了92个多区域空间相互作用(MSI)特征,以测量肿瘤内空间异质性(表2,图2b)。在这些成像特征上进行共识聚类,确定了三个成像亚型(补充图3a),这是在最小化CDF曲线下面积的增量变化的同时最大化亚型内一致性的最优解。这通过k = 3的共识矩阵热图进一步确认,它最优地代表了发现和验证队列中患者数据的模式。当我们在发现队列(n = 199)中可视化矩阵热图和CDF曲线下面积比例的增加时,k = 3是考虑的最大的簇数量(补充图3b,补充数据9)。在发现队列中,基于MSI特征的亚型预后无复发生存期(RFS),P = 1e-05,同时将患者分层为低风险、高风险和中等风险亚型(图4a)。这些成像亚型在内部验证队列(n = 133)中仍然预后RFS,P = 0.024(图4b)。这些亚型在发现、内部(图4c,d)和外部验证队列(图4e)中也预后总生存期(OS)。与经典放射组学方法相比,成像亚型在预测RFS和OS方面没有实现稳健的患者分层,在验证期间,以显著的净重新分类改进超过了经典放射组学方法(补充表1,补充数据1)。通过将栖息地成像亚型映射到原始MSI特征和传统CT和PET特征的空间,观察到高风险人群倾向于在肿瘤边界上有更多簇7的体积增加和丰富的簇4和7。不同风险组之间关键栖息地特征的成对比较在补充图6(补充数据12)中展示。栖息地成像亚型在传统风险预测因素之外的独立预后价值与已知的临床病理风险因素相比,成像亚型是RFS的顶级预测因素(表3)。在多变量分析中,成像亚型在调整包括年龄、性别、吸烟和传统成像指标(CT:肿瘤体积;PET:SUVmax、代谢肿瘤体积、总病变糖酵解)在内的临床病理因素后,仍然是RFS的预后因素。成像亚型同样预后OS(表4)。在调整肿瘤体积后进行的单变量和多变量分析,揭示了栖息地成像亚型在发现和验证队列中的独立影响(补充表2,补充表3,补充数据2)。我们观察到三个栖息地亚型与MTV、TLG或肿瘤体积分层之间的相关性分别为58%、59%和64%(补充表4,补充数据3),表明栖息地分析学习了超出这些传统CT和PET指标的放射学模式。肿瘤体积与基线ctDNA状态相关,而肿瘤体积和连续ctDNA清除状态之间的边际统计差异(补充图2,补充数据8)。当分析原发肿瘤位置时,我们观察到只有右上叶在独立于栖息地成像的队列中是预后的。在多变量分析中调整肿瘤和叶位置信息后,高风险和中等风险成像亚型仍然是RFS和OS的预后因素(补充表5和6,补充数据4)。在单变量和多变量分析中调整放疗相关参数(术后放疗和放疗剂量)与生存期无相关性(补充表7和8,补充数据5)。肿瘤的致癌基因突变状态(即EGFR突变和ALK融合)与患者生存无相关性,如表中所示(补充表9和10,补充数据6),这可能是由于携带这些基因组改变的肿瘤患者样本量有限。然后我们进行了详细的亚组分析,按临床病理特征(包括阶段、性别、吸烟状态、年龄、组织学和治疗)和肿瘤体积(补充数据13)分层,发现栖息地成像亚型可以在各个亚组中进一步分层RFS(补充图7)和OS预测(补充图8)。此外,3名II期腺癌患者可以根据术前PET/CT被分层为不同的成像亚型,具有不同的癌症复发风险水平,如图5所示。由于相当比例的早期NSCLC在手术后复发,这种风险分层可能有助于选择高风险患者进行围手术期治疗。观察到基于栖息地成像的高风险和中等风险亚型的患者中,术前血液中检测到ctDNA的比例高于低风险亚型(图6a)。在高风险患者中观察到67%有持续的ctDNA存在,相比之下,62%的低风险患者没有检测到ctDNA(图6b)。有趣的是,45%的中等风险患者在治愈性手术后清除了ctDNA(图6b)。图6c展示了使用不同组合的临床特征、肿瘤体积、成像亚型、术前ctDNA检测和SOC治疗后ctDNA清除状态的三种不同的RFS预测模型的C指数比较。观察到使用ctDNA状态与临床特征、肿瘤体积和成像亚型相结合的Cox模型实现了最佳的预测,C指数=0.82。利用RNA测序的可用转录组数据,使用元-GSEA对所有3个队列的组合数据集进行了分析,以探索与放射组学亚型相关的分子特征。图6d提供了在高风险和低风险栖息地亚型之间差异富集的前10个Hallmark途径。在高风险但不在低风险组中下调的顶级途径包括干扰素α和干扰素γ反应,而血管生成和上皮-间充质转化在研究队列的高风险肿瘤中始终上调(补充图9a,b)。 讨论在这项多队列研究中,开发了一个栖息地成像框架,通过整合CT和18F-FDG PET,识别出表型不同的肿瘤内亚区域(栖息地)。从这些肿瘤内亚区域提取的成像特征在将肺癌患者分层为具有不同预后的3个临床意义亚型方面表现出稳健的性能。这些成像亚型提供了超出既定临床病理风险因素和血液ctDNA的独立预后信息。此外,通过放射基因组学分析确定了这些成像亚型背后的分子特征。总的来说,在多个独立队列中临床和生物学上验证了栖息地成像亚型,包括前瞻性试验和回顾性队列。然而,研究是一个概念验证研究,为未来的研究奠定了基础,以建立这些识别出的亚型的稳健性和临床适用性。虽然临床、病理和生活方式因素可以通知复发的风险,但它们无法解释患者水平的动态演变和个体间变异。已经证明,栖息地放射组学模型可以作为比标准临床检查或随访扫描更早的复发指标。因此,可以识别出复发风险较高的患者,以便潜在的治疗强化、更密切的术后监测和潜在的更积极的系统管理的实验方案的入选。这是一个多中心PET/CT栖息地放射组学研究,强调通过将肿瘤分割为亚区域并分析它们的空间相互作用来评估肿瘤内异质性,对早期疾病NSCLC患者进行了这项研究。先前的研究捕获了整个肿瘤体积的图像特征,但没有考虑肿瘤内异质性。我们的研究有几个优点。我们研究的一个关键方面是我们之前的流程基础上的CT和18F-FDG PET的整合分析,而大多数先前的研究集中在单一模式上。与传统放射组学研究不同,后者提取了数百个放射组学特征并进行特征选择以构建简洁模型,我们应用了无监督聚类来定义基于肿瘤亚区域特征的成像亚型。从技术上讲,捕捉内在数据结构的聚类方法不太可能过拟合,对小规模和异质性癌症人群更为稳健,类似于以前的研究。CT和PET扫描是从不同的中心收集的,使用了不同的扫描仪、成像协议和重建平台。我们执行了图像标准化和放射组学特征协调,以确保更普遍的建模。在多中心试验的外部验证队列中,一致的临床表现证实了提出的栖息地成像流程的稳健性。可用的内部基因表达数据、血液衍生的ctDNA和高质量的元数据使我们能够识别出高风险成像亚型背后的生物学,强化了为什么这个亚型与更高的复发率相关。有趣的是,观察到ctDNA和栖息地成像亚型之间存在协同效应,支持成像提供与之前的研究类似的正交信息。如果前瞻性验证,这些预测因子可以结合起来非侵入性地分层NSCLC患者,潜在地识别可能从更强化的治疗和监测中受益的高风险患者,同时允许对低风险患者减少治疗。EMT,高风险亚型中调节的顶级途径之一,已知与肺癌进展、转移、药物抗性和免疫逃逸相关。EMT的激活涉及一组与肿瘤异质性相关的分子过程。这些过程包括细胞外基质的重塑、肿瘤细胞对细胞外基质和彼此的粘附丧失、它们的流动性,以及干性表型的分化和激活。在高风险肿瘤组中,EMT和IFN-γ信号之间的显著负相关在肺癌中得到了实验证实,并与肺癌细胞的受损免疫监视相关联。已经表明,IFN-γ和SHP2抑制剂的联合治疗在细胞系衍生的异种移植模型中诱导了增强的抗癌活性。根据目前的研究,通过提出的栖息地成像分类为高风险的肺肿瘤将具有最活跃的EMT表型和显著下调的IFN-γ信号,使它们最适合联合治疗IFN-γ和SHP2抑制剂。研究有几个局限性。首先,尽管栖息地成像在回顾性数据集中展示了临床和生物学价值,但这些发现需要在大型数据集中前瞻性验证,然后才能转化为通知早期NSCLC的风险分层。更重要的是,未来的机制研究需要验证这些放射基因组相关性。此外,栖息地成像需要PET和CT扫描,这可能限制了其在筛查设置中的临床应用。此外,只关注了原发肿瘤,未来的放射组学研究也可以考虑涉及淋巴结的临床价值。第二,我们通过混合不同的组织学亚型(腺癌和鳞状细胞癌)进行栖息地分析,以增加统计能力。未来的研究需要优化每个亚型的分析。第三,尽管我们的栖息地分析与生物学相关,但它依赖于手工制作的流程,特别是用于量化肿瘤内异质性的特征。将来,将在大型队列中实施深度学习方法,以自动化肿瘤分析并整合多模态数据。总之,开发并验证了一种术前CT和18F-FDG PET基础的签名,作为NSCLC患者的预后生物标志物。如果前瞻性验证,所提出的成像签名可以用来改进肺癌的个体化治疗选择。