小编为大家带来这篇今年1月发表在Nature Medicine(IF= 82.90)上的文章,英格兰基因组研究公司与英格兰国家医疗服务系统(NHS)一起分析了来自 33 种癌症类型的 13880 个实体瘤的 WGS 数据,在安全的研究环境中将基因组数据与真实世界的治疗和结果数据进行了整合。研究结果表明,发现展示了将基因组和现实世界临床数据相联系的实用性,以实现生存分析,以识别影响预后的癌症基因,并深化对癌症基因组学如何影响患者结果的理解。
整合10万癌症基因组计划中 13,880 例肿瘤的基因组和临床数据,为肿瘤精准治疗提供启示
一、研究背景:
100,000 基因组计划是英国政府在英格兰国家医疗服务系统(NHS)内开展的一项计划,旨在通过国际标准化组织认可的自动化生物信息学渠道,为癌症和罕见病患者建立标准化的高通量全基因组测序(WGS)。在 10 万基因组计划的癌症项目中评估了 WGS 在大规模治疗 NHS 癌症患者中的作用(图 1a)。参与者在知情的情况下书面同意将其基因组数据与匿名的纵向健康记录相链接,并在安全的研究环境中与研究人员共享,以推动对不同癌症的了解。所生成的数据随后被用于建立国家分子数据平台,并与研究环境中的纵向真实世界数据安全链接(图 1b)。国家临床数据集包括国家癌症登记和分析服务(NCRAS)数据集以及后续的癌症病例(包括医院病例统计(HES)和国家统计局(ONS)的死亡率数据)。这种方法可将基因组研究和发现反馈到基因组健康中心(图 1c)。
图1 “10万基因组癌症计划”概述
国际癌症基因组联盟(ICGC)和TCGA等大规模测序研究从 2658 份原发性肿瘤样本的回顾性队列中广泛收录了不同癌症类型的体细胞突变谱。最近,哈特维格医学基金会等机构报告了 4784 份转移性成人实体瘤样本的临床相关研究结果,并支持药物再发现协议(DRUP)试验的招募工作。在本研究中,介绍了对 13880 例实体瘤的 WGS 数据进行的分析,重点关注临床上可操作的基因和泛基因组标记物,并将其与真实世界的纵向、临床生命过程、治疗和长期生存数据联系起来,以强调从癌症计划中学到的知识以及对当前临床治疗的影响。
二、主要结果
1. 队列特征
全基因组分析(WGA)覆盖了33种肿瘤类型(图2a)的13880个肿瘤样本,包括13311个新鲜冷冻肿瘤样本(95.9%)和569个福尔马林固定石蜡包埋肿瘤样本(4.1%)。匹配的正常(种系)样本包括 13493 份(99.1%)血液样本、100 份(0.7%)正常组织样本和 23 份(0.2%)唾液样本。肿瘤样本的测序覆盖率为 100 倍,正常样本的测序覆盖率为 30 倍,以确保临床环境中变异调用的高灵敏度。血液肿瘤基因组、儿童癌症基因组、未知原发性癌症基因组以及未与外部数据集链接的肿瘤基因组未纳入本分析。通过将基因组学数据与 NCRAS 和 HES 数据集链接,确认了样本采集时提交的诊断。测序肿瘤基因组超过 1000 个的肿瘤类型包括浸润性乳腺癌(n = 2925)、结肠腺癌(n = 1948)、肉瘤(n = 1617)和肾透明细胞癌(n = 1163)。图 2b 展示了英格兰 13 个国家医疗服务系统 GMC的招募情况,图 2c 显示了不同肿瘤类型的生物学性别和年龄分布。
图2 “10万基因组癌症计划”队列概览
NCRAS 数据集中有 12040 例(86.7%)肿瘤的分期信息。图 3 显示了已测序肿瘤的不同分期,11.9% 的患者为 4 期癌症,样本取自肝脏、淋巴结、肺部和脑部等转移部位。卵巢高级别浆液性癌和皮肤黑色素瘤的晚期发病率较高,而浸润性乳腺癌的早期发病率较高,这是由于组织的取样偏差造成的。肿瘤样本主要来自手术切除,包括93.6%的未接受治疗病例和6.4%的接受新辅助治疗病例。只有5.5%来自转移性或诊断性活检,10.9%来自治疗后活检。图 3 中描述的肿瘤纯度凸显了在特定癌症中获取肿瘤含量足够高(超过 30%)的样本所面临的挑战,这与之前的出版物一致。
图3 “10万基因组癌症计划”样本特征概述
2. 通过 WGS 实现临床可操作性
WGS 等单项检测包括肿瘤与正常人的配对测序,有助于同时检测体细胞小变异,包括单核苷酸变异(SNV)、插入和缺失(indels)、拷贝数畸变(CNAs)和结构变异(SVs),以及基因融合。此外,癌症易感基因变异等种系研究结果和药物基因组学研究结果使临床相关研究结果的产出率得以提高。研究结果显示了 WGS 的实用性,只需一次检验就能捕捉到与临床相关的各种基因组改变。
研究检测到了与NGTDC指定靶点相关的几类突变,包括小变异、CNAs和融合,以及与遗传性癌症风险和药物基因组学相关的种系变异。在NGTDC 中显示的基因中存在一种或多种体细胞突变的病例比例很高,但也不尽相同。例如,在多形性胶质母细胞瘤、低级别胶质瘤、皮肤黑色素瘤、头颈部鳞状细胞癌、结直肠腺癌以及肺腺癌中,50% 以上的肿瘤在 NGTDC 所指明的检测基因中发现了一种或多种突变。在20-49%的浸润性乳腺癌、卵巢高级别浆液性癌、子宫内膜癌、肉瘤、间皮瘤、膀胱尿路上皮癌和肺鳞癌病例中发现了与临床相关的基因突变,而在胰腺癌、前列腺癌、食管癌和胃腺癌等其他癌症类型中,只有不到20%的病例存在NGTDC中的基因突变(图4)。这些突变的临床可操作性取决于个别病例和临床情况,如肿瘤的分期和参与者的相关合并症。这凸显了临床解释的必要性,以及在 GTAB 中进行适当临床讨论的必要性。
研究进一步评估了 NGTDC 中列出的其他类型癌症的基因突变,这些癌症的基因或基因突变目前尚无检测指征。这些变异在图 4 中用蓝色表示,表示潜在的可操作发现,这些发现可能有助于临床试验招募或促使 GTAB 进一步审查。例如,在不同癌症类型的PIK3CA和KRAS中发现了SNVs,同样也发现了同源重组缺陷(HRD)和肿瘤突变负荷(TMB)等泛基因组标记物,这些标记物可用于临床试验。随着生物标记物驱动的试验证据的增加,NGTDC 适应症有望扩大,纳入多种癌症类型的新基因和生物标记物。
3.体细胞小变异的概况
最常发生突变的基因是 TP53(图 4)。在各类型癌症中,TP53 基因突变频率各不相同,但在子宫内膜浆液性癌、卵巢高级别浆液性癌、肺鳞癌、直肠腺癌、食管腺癌和食管鳞癌中频率最高(超过 70% 的病例)。在至少有一个 TP53 基因突变的个体中,36.2%携带一个或多个预测为蛋白质截断或剪接改变,65.5%携带一个或多个预测为错义变异,其中最常见的5种蛋白质变化是R175H(5.3%)、R273C(3.2%)、R248Q(3.2%)、R273H(3.2%)和R282W(2.7%)。PIK3CA是第二最常发生变异的基因,19.8%的患者发现了突变,最常发生在子宫内膜癌(53.5%)、卵巢子宫内膜样腺癌(49.0%)、乳腺浸润癌(42.2%)、子宫内膜浆液性癌(38.1%)和结肠腺癌(26.5%)。其最常见的突变密码子是 E545 和 H1047,在该基因的所有突变中,超过 69.9% 的突变发生在五个特征明确的热点区域。其他基因,如 APC、KRAS、VHL 和 IDH1,仅在一种或两种肿瘤类型中高度富集突变。通过对大量卵巢肿瘤样本进行测序,可以进一步进行亚型分类,在高级别浆液性癌(89.8%)中发现了TP53突变体,在卵巢子宫内膜样腺癌(49.0%)中发现了PIK3CA突变体,在低级别卵巢浆液性癌(33.3%)中发现了KRAS突变体。
图4 常见肿瘤类型的体细胞和种系突变
4. 融合与 CNAs
在所有癌症类型中,TP53、CDKN2A、MYC、CDKN2B 和 PTEN 的扩增或缺失发生率都很高(图 4)。多形性胶质母细胞瘤、低级别胶质瘤、头颈部鳞状细胞癌、间皮瘤和肉瘤的临床相关 CNAs 数量最多。随着靶向治疗的增加,对不同突变类型(包括融合)的分子检测已成为治疗标准。例如,NTRK 融合以及其他激酶融合(如肺癌中的 ALK、ROS 和 RET)现已纳入 NGTDC。虽然只有一小部分患者的特定融合检测呈阳性,但突变的存在对于疾病分类至关重要。间质软骨肉瘤就是一个很好的例子,HEY1-NCOA2 融合是该亚型所独有的。事实上,肉瘤是临床相关 SV 发现率最高的肿瘤(13%)。
5. Germline 发现
与通常只对肿瘤样本进行的靶向面板检测不同,配对肿瘤和正常 WGS 可以同时检测体细胞和种系变异。变异来源的确定性会对患者管理产生影响,如家族基因检测或治疗资格。卵巢高级别浆液性癌患者中,SNVs 和indels的可操作种系发现率最高,13% 的患者携带 BRCA1 和 BRCA2 基因变异(图 4 )。图 2c 显示了肿瘤诊断时的中位年龄,发现易感基因的患者肿瘤诊断时的中位年龄较小。值得注意的是,错配修复(MMR)基因种系变异患者的结肠腺癌发病年龄明显提前,而同源重组修复基因种系变异患者的卵巢高级别浆液性癌和浸润性乳腺癌发病年龄明显提前。在肾透明细胞癌中也观察到了这种情况,其种系变异主要存在于 VHL 基因中。5%-10%的参与者存在与氟嘧啶毒性有关的DPYD变异,这为治疗浸润性乳腺癌、结肠癌、直肠癌、胰腺腺癌和头颈部鳞状细胞癌时省略或调整剂量提供了指导,这也是 NGTDC 的建议。
6. 泛基因组标记和突变特征
研究发现皮肤黑色素瘤和肺腺癌的平均 TMB 最高(图 5a)。结肠腺癌和子宫内膜癌在是否存在微卫星不稳定性或由 POLE 突变引起的高突变方面表现出差异。在研究具有明确病因的突变特征(COSMIC v.3)时,在某些类型癌症中观察到预期频率。APOBEC特征2和13与浸润性乳腺癌、头颈部鳞状细胞癌、膀胱尿道癌和肺腺癌有关;吸烟特征4和92与肺癌有关;紫外线特征(7a-d)与皮肤黑色素瘤有关。DNA MMR特征6、15、20、21、26和44富集于微卫星不稳定性高的结肠腺癌和子宫内膜癌(图5a)。
HRD状态由两种基于全基因组突变瘢痕的胰腺癌分类器CHORD和HRDetect来定义。本研究中,卵巢高级别浆液性癌的 HRD 发生率最高(40%)。虽然PARP抑制剂目前仅适用于有HRD的卵巢肿瘤,但在HRD检出率低的其他癌症中,有可能通过临床试验或慈善途径获得PARP抑制剂。
图5 WGS 数据中的泛基因组标记的预测价值
7. WGS 的临床实用性
这些发现表明 WGS 数据有能力全面描述肿瘤的临床基因组特征。一次检测就能报告体细胞 SNV、基因融合和 CNAs,以及潜在的致病性种系突变和泛基因组标记物,如突变特征和 TMB(图 4)。例如,在一名卵巢高级别浆液性癌患者中,发现了一个体细胞 TP53 SNV,与诊断结果一致,同时还发现了一个种系 BRCA1 变异和体细胞 BRCA1 拷贝数缺失驱动 HRD,随后 HRD 分析证实了这一点。同样,在另一个病例中,一位子宫内膜癌患者的MMR缺乏特征与高TMB相关,同时还发现了PMS2致病性种系变异、体细胞PMS2起始丢失突变和DPYD基因的药物基因组(种系)变异。这些例子说明了,鉴定不同类型的突变和泛基因组标记物具有临床相关性。
8. 真实世界数据的泛基因靶点和结局
通过将 WGS 数据与纵向生命过程临床数据联系起来,评估了根据泛基因组标记物对患者进行分层的治疗结果(图 5b)。在浸润性乳腺癌和卵巢高级别浆液性癌患者中,HRD预示着接受铂类疗法的患者有更好的治疗结果。然后将TMB作为预后标志物进行评估,结果发现,皮肤黑色素瘤患者中TMB最低四分位数与最高四分位数的生存率存在显著差异(图5c)。有趣的是,在肺腺癌中没有观察到明显差异。这可能表明 TMB 的水平与预后有关,并支持了进一步完善泛基因组生物标志物作为预后和免疫疗法反应预测指标的必要性。
9. 小变异和 CNAs 共存
通过 WGS,能够探索影响 NGTDC 癌症基因的 CNA s和体细胞小变异的共存情况。研究将病例分为每个基因都有小变异和没有小变异的两组,然后比较了这两组中每个基因的 CNAs 频率(图 6a )。发现有 12 个基因的拷贝改变频率存在显著差异,证实了之前的发现,即在特定癌症类型中,当存在推定激活 SNV 时,EGFR 和 KIT往往会被扩增。拷贝增殖对某些致癌基因的作用一直存在争议,研究分析发现,在出现影响 BRAF、KRAS、NRAS、CTNNB1 和 FGFR2 的小变异时,会同时出现显著的增殖。研究还发现,在存在体细胞小变异的情况下,五个肿瘤抑制基因或双重作用基因的拷贝丢失频率明显较高,其中包括 TP53、RB1、CDKN2A和 APC 等,这进一步强调了同时解读不同类型变异的价值。
图6 WGS 数据的小变异和CNAs的预后价值
10. 真实世界数据的生存分析
研究根据 40 个 NGTDC 指示基因中是否存在突变,对 33 个癌症亚型的总体生存率进行了分层评估。对胰腺癌队列进行了 Kaplan-Meier 和 Cox 比例危险度分析,15 个基因影响了总生存率(图 6b)。对患者预后影响最大的基因是 CDKN2A,这与它在某些癌症亚型(如胶质瘤和软组织肉瘤)中与高级别疾病和不良预后有关。研究结果与之前报道的特定肿瘤类型的预后相关性一致,例如结直肠癌和非小细胞肺癌中的 KRAS 突变或非小细胞肺癌中的 TP53 突变预后较差。PIK3CA 突变与良好的预后相关。
三、讨论与总结
在这项研究中,展示了链接的真实世界数据在评估结果和反映临床试验中不良分子标记物方面的价值。基因组数据与癌症登记中的电子健康数据一起,丰富了数据集,并可进一步完善生物标记物的选择。同一基因中变异的共存或不同基因中变异的共存可能会提高生物标志物选择的预后和预测价值,并可能检测出长期潜在的获益或受损信号,有助于临床和监管决策。研究提出的是基因水平上的广泛生存分析,随着数据集的扩大,将有可能进一步研究这些数据,以确定特定变异的预后和预测意义。
研究结果强调,这些数据有可能根据特定突变的存在与否提供更多的预后见解。随着研究环境中的数据不断积累,基因组、临床和预后数据相互关联,在更全面的肿瘤图谱分析的帮助下,可以利用真实世界的数据进行更精细的分析。这将有助于进一步完善预后和预测分子标志物,不仅包括不同基因组改变的组合,还包括基因组学以外的新兴技术,以扩大精准肿瘤学的范围,改善癌症预后。
Sosinsky A, Ambrose J, Cross W, Turnbull C, Henderson S, Jones L et al. Insights for precision oncology from the integration of genomic and clinical data of 13,880 tumors from the 100,000 Genomes Cancer Programme. Nature Medicine 2024;30:279-89.
往期热点 (点击标题跳转)
01
肿瘤免疫逃逸新机制
02
孟德尔随机化
03
生信+实验结合
04
单细胞空间转录组
05
肿瘤相关巨噬细胞(TAM)
06
细胞死亡
07
耐药
更多精彩生信知识和技术分享
欢迎添加微信
文章转载请联系 | 15510012760(微信)