这篇推文他写了5年:NGS早筛第一证的“探索游戏”

文摘   2024-08-05 17:06   上海  

写在前面

Guardant health Shield 近日官宣获批,从我2021年入行关注至今终于等来了这一天。作为熊言熊语邮件通讯产品系列的早就定下的选题之一,趁热打铁,把零散记录了很久的draft详细整理成文与你分享。

在本次通讯中,你将会:
    • 从 Shield 按部就班的获批之路中看到立场如何决定性能、嘴硬如何与谨慎并行;
    • 在 Shield 稳定产出的产品进化过程中看到 Guardant health 清晰的学术发声节奏;
    • 在 Shield 跌跌撞撞的性能提升之路中看到研发和产品的反复横跳和究极取舍;
    • 也别忘了一起了解 Shield 在多癌早筛上的布局和野望。


按部就班的获批之路

7 月 29 日,Guardant Health 在官网宣布 FDA 批准 Shield 作为结直肠癌 (CRC) 的筛查方案。
Shield 因此成为 FDA 批准的第一款用于 CRC 筛查、满足美国医保要求的血液检测产品。其使用范围是 45 岁及以上具有平均患病风险的成年人。
Shield 的获批并不令人意外,似乎这一切都在按照 Guardant Health(下文简称 GH)计划的路线稳步推进。
在 2024 JP Morgan 上 GH 给出了如下清晰的时间线。
今年 5 月,FDA 分子和临床遗传学专家小组经过一番「热烈」讨论[1],对 Shield 的安全性、有效性和风险收益比都给出了整体积极的评价。
这次讨论通过也已经预示着 Shield「有望」成为第一个获 FDA 批准的肠癌血液筛查产品。


立场决定性能

如果再往前追溯,是什么促成了这次专家小组的通过呢?
一是基于 Guardant Shield 之前已经获得的上市前批准 (PMA) 申请,二是评估平均风险人群使用 Shield 检测性能关键结果的 ECLIPSE 研究于今年 3 月在《新英格兰医学杂志》(NEJM) 上发表。
ECLIPSE 是一项非随机、前瞻性、多中心研究,纳入了年龄在 45 岁至 84 岁之间计划接受肠镜筛查的患者。
如下图所示,虽然研究招募的患者人数达到 2 万多例,但其中 1.2 万例并没有纳入实际的临床验证队列。研究团队通过下采样方法随机抽样了 1 万人,删删减减之后有 7000 多人进入了最后的临床评估阶段。
ECLIPSE 的主要终点是相对于肠镜检查 CRC 的敏感性和对晚期肿瘤(结直肠癌或晚期癌前病变)的特异性,次要终点是检测晚期癌前病变的敏感性。在 clinicaltrials 注册的临床试验中,次要终点还包括 CRC 检测的阳性预测值 (PPV) 和阴性预测值 (NPV)。
对于 Shield 的性能,GH 在发布的 PROVIDER BROCHURE 中已经给出了一个非常清晰的总结。
在 NEJM 的论文中,更详细的主要结果总结如下:
    • 检测 CRC 的总体敏感性为 83.1%

    • 对具有筛查价值、病理确诊的 I-III 期 CRC 的敏感性为 87.5%

    • 对不同分期 CRC 的敏感性:

      • I 期 (病理确诊):65%; I 期 (临床诊断):55%

      • II 期、III 期和 IV 期: 均为 100%

    • 在非进展期腺瘤、未发现肿瘤和肠镜阴性人群中的特异性为 89.6%

    • 在未发现肿瘤和肠镜阴性人群中的特异性为 89.9%

如果以上这些数据都还算说得过去,但晚期癌前病变 (AA) 的敏感性仅为 13.2%。emmm,因为不是计划中的研究终点,只能算是软肋谈不上硬伤。 关于 AA 的问题,会在后文有一个详细展开。

在同期 NEJM 上,Exact Sciences Cologuard 和 GH 背靠背发表了自家产品最新一代产品的实验结果。
我们得以给出一个相对清晰(但并不严谨)的对比。

虽然各项指标相比对方都不占优,但是 GH 说:不是比不过,而是不会比,不考虑依从性的敏感性,在真实世界里就是耍流氓
在 2023 年的 JP Morgan 大会上,GH 提出了一个并不算新的新概念:有效敏感性 "(Effective Sensitivity)。
Shield 的依从性为 90%,敏感性为 83%,两者相乘得出有效敏感性为 75%;而 Cologuard 的依从性为 65%,敏感性虽然略高(87%),但两者相乘后的有效敏感性仅为 60%。


论秀,还是 GH 秀。然而,仔细思考后会发现,这两种检测方法之间的差异其实并不令人意外。
无论是微小残留病灶(MRD)还是肿瘤筛查,对于血液检测,我们有一个基本共识:只有脱落的 DNA 进入血液循环系统才有可能被检测到,而且通常来说,越接近病变部位的样本越敏感。这也同样可以解释为什么在泌尿系统相关肿瘤的检测中,尿液样本的早期筛查性能要比血液检测好得多。
Shield 自身具有的便利性和高依从性,在满足同样筛查条件下可以提高筛查率,这一点没有问题。
但我们也需要清楚地认识到,Shield 并不能算是真正意义上预防结直肠癌(CRC)的「筛查」方法(其对进展期腺瘤 AA 的检出率仅为 13%),它更像是一种非侵入性的「诊断 」方法,即便如此,它仍可能会漏诊接近一半的 1 期患者。


嘴硬和谨慎并不冲突

虽然面对投资人描绘着美好的概念,但 GH 比任何人都清楚自己产品的局限性。
这一点从 GH Shield 产品手册中随处可见的防御性极强的限制性说明就能看出。一起来感受一下。
Precaution:基于临床研究数据,Shield 对 I 期结直肠癌的检测灵敏度有限(55%-65%),并且无法检测到 87% 的癌前病变。每 10 名 Shield 结果为阴性的患者中,可能有 1 名患有癌前病变,而这种病变本可以通过结肠镜筛查检测到。Shield 对 II、III 和 IV 期结直肠癌的检测显示出较高的检测率。
限制性因素众多,就不一一翻译了,我们列举几个主要的:
    • Shield 无法检出小于 10 毫米的结直肠癌病灶。

    • Shield 对高级别腺瘤(可能发展为结直肠癌的癌前病变)的检测能力有限,可能影响预防结直肠癌发展的效果。临床研究数据显示,Shield 仅正确识别了 13.2% 的高级别腺瘤患者,意味着 86.8% 的高级别腺瘤患者被误判为阴性。

    • Shield 的假阳性率为 10%,即每 10 名没有晚期肿瘤(结直肠癌或高级别腺瘤)的人中就有 1 人会得到假阳性结果。

有趣的是,这些 label 的预防性声明甚至成为了今天投资者电话说明会的提问重点,我听了一下现场录音,多个问题都围绕这些预防性声明可能产生的潜在影响展开。
另外,Shield 检测尚未被美国预防服务工作组(USPSTF)或美国癌症协会(ACS)的指南收录,许多非公立保险公司可能要求产品被纳入指南才会提供覆盖,这意味着 Shield 还有一段路要走。
在 NCT04136002 临床实验记录中,项目入组人数从最初预估的 2 万人,在 2023 年 4 月修改为 4 万人,到今年 4 月又修改为实际入组人数 44467 人。
在电话会议上,GH 高管一再强调他们与 Medicare 保持着顺畅的沟通。入组人数增加,也许还有 NEJM 中没有充分回答的问题需要继续回答。


稳定更新的产品进化史

聊完获批的 part,我们再回过头来聊聊 Shield 产品本身。
2019
时间回到 2019 年,GH 通过 2019年AACR[2] 首次公开介绍了他们针对结直肠癌(CRC)的检测产品。这个产品的独特之处在于同时分析 ctDNA 的基因组和表观基因组特征。
基因组变异包括:SNV,Indel,fusion 和 CNV;表观遗传变异包括 DNA 甲基化信号和核小体站位/片段组学。
产品设计上,GH 利用晚期癌症患者的 cfDNA 大型数据库,开发了一个 500Kb 大小的靶向测序 panel。这个 panel 可以检测与 CRC 相关转录因子结合位点的体细胞突变、异常甲基化和其他表观基因组差异。技术上能同时检测甲基化和非甲基化的 cfDNA。
初步分析结果显示,相比单独的体细胞突变分析,加入表观基因组分析显著提高了 ctDNA 的检测能力。
2020
2020 年 AACR 会议上,GH 继续发布了 相关研究进展[3]。这时,他们的检测产品被命名为 LUNAR-2 assay(即现在的 Shield),其靶向区域针对常见的致癌突变以及在癌症中可能经历表观基因组修饰变化的区域(差异甲基化和核小体定位变化导致差异的 DNA 片段化模式)。
分析过程包括
    • 检测体细胞基因组突变和变异过滤;

    • 评估观察到的 cDNA 分子在不同甲基化分区中的分布;

    • 评估 panel 上基因组区域中 cDNA 片段化模式。

这次 poster 还明确指出了 panel 设计数据来源于超过 10 万例 Guardant360 数据以及健康人/晚期 CRC 患者的全基因组测序 (WGS) 数据。
研究发现,在 CRC 肿瘤组织中,根据差异甲基化选择的区域显示出明显的甲基化信号。通过比较结肠镜检查阴性的受试者和晚期 CRC 患者的 cfDNA 全基因组测序数据,研究者观察到一致且强烈的甲基化信号差异,提高了区分能力。
2021
随着算法和技术的逐渐成熟,2021年 ASCO 上[4],GH 公布了一项涉及 434 名患者和 271 名对照样本的更大规模 LUNAR-2 性能评估。研究结果显示,该检测方法在多个临床特征中都表现出具有临床意义的敏感性。这项 poster 的最后提到:
A prospective registrational study is ongoing to evaluate the test in an average risk CRC screening cohort.
同年,在美国胃肠病学会(American College of Gastroenterology)年会上,GH 发表了一个更详细的口头报告,重点强调了该产品在早期 CRC 筛查中的潜力,以及在一般风险人群中的应用前景。
进而引出了该产品应用于早期 CRC 进行 screening 的潜力,也提到了把它应用在一般风险人群中的应用场景。
2022
一年之后,2022 年 ASCO 会议[5] 中 GH 进一步发声。这次他们带来了在西班牙四家医院开展的前瞻性研究分析结果。
值得注意的是,这次 Shield 代替 LUNAR-2 成为了产品名,而整个检测方案里增加了一个看起来「不怎么和谐」的蛋白质组学结果。这一变化也不难理解,既然 GH 选择了结合突变信息和表观遗传学的多组学策略,那么在产品迭代过程中自然会考虑蛋白质组学。
不过,事后证明,蛋白质检测结果整合到最终的 YES or No 判断中,这一策略似乎对也不对,并没有真实提高检测性能(后面我们会具体提到)。
在这项研究中,GH 对超过 6000 个样本进行训练,其中包括 2685 个 ACN 阴性样本和 1698 个 ACN 阳性样本。通过 1072 个 ACN 阴性样本和 551 个 ACN 阳性样本确定阈值,在验证之前,以 91.5% 的特异性为目标锁定模型阈值。
随后在六个中心验证中得到了如下结果。两个小细节,I 期癌症的敏感性高达 90%,AA 的敏感性还在 20%。
2023
一年之后,在著名的消化系统疾病年会(Digestive Disease Week)上,GH 首次正式对外公布了 ECLIPSE 研究的初步结果。
这次公布的分期敏感性和我们在 NEJM 看到的已经基本一致。
AA 的敏感性掉到了 13%,当时还公布了 HGD 的性能(23%),但在最终的 NEJM 文章中并未提及。
同时,GH 也提到了如何在真实世界中考虑依从性的问题:评估筛查项目时需要考虑真实世界的条件和患者因素倡导从理想化条件下的有效性评估向更实际、更贴近临床实践的效果评估转变。
2024
回到文章开头👆,NEJM 论文发表。
从Shield的发展历程来看,从19年开始,基本每年都会有非常稳定的产出,整体的产品技术路径和临床应用场景也越来越清晰。点赞GH Shield的研发和科学团队。
多说一句,在这次展示内容的最后,GH 提到 Further assay development to expand detection capabilities
这件事, Shield 一直在尝试。


跌跌撞撞的性能提升之路

来来去去的蛋白

如果说 Shield 的 FDA 获批之路看起来顺风顺水按部就班,那它的性能提升之路似乎就只能摸着石头过河。
在上文,我留了一个扣子,2022年6月ASCO的Poster里,GH提到在既往的分析方法基础上新整合了蛋白质检测的结果。
可到了2023年5月DDW大会的结果展示中,蛋白质组学又默默地消失了。
发生了什么?这其中的缘由,我们可以从 2023 年 10 月 GH 在 Annals of Oncology 发表的结果和 2024 年 NEJM ECLIPSE 主文章中窥见一二。
2023 年 10 月的 Annals of Oncology 论文中,GH 提到:
The aim of this study was to determine the performance of a novel multimodal ctDNA-based blood assay (that includes detection of genomic mutations, methylations, fragmentomics and proteomics) to detect CRC at different Tumor-node-metastasis (TNM) stages (primary endpoint) and advanced precancerous lesions (secondary endpoint), in a pilot study of FIT-positive individuals from a population-based screening program and individuals with known CRC.
emm,看来最初并未打算放弃晚期癌前病变的检测。
在这项涉及 623 例样本的研究中,首先使用不包含蛋白的算法进行分析,晚期癌前病变的敏感性为 14%
GH对这个结果还想挣扎一下。于是他们说道:
In order to improve the accuracy to detect precancerous lesions, an exploratory analysis that used a refined version of the blood multimodal ctDNA-based test was carried out in a subgroup of 86 individuals from cohort 1.
他们的做法便是加入蛋白质组学数据。
首先在癌症样本和健康样本之间对表达水平存在差异的多种蛋白质标记物进行分析,然后开发统计模型整合这些蛋白质标记物的水平,生成蛋白质分类结果,最终与之前的结果整合,生成一个二分类判断。(合理怀疑是Olink的销售手段高超,说服了他们😂)
一顿操作猛如虎,性能显著提升5%。
在这 86 个样本的小队列中,AA 的敏感性被提升到了 23%(小队列不加蛋白的原始版本 AA 敏感性是 18%)。
可随之而来的小问题是特异性也从之前的 90% 掉到了 86%。
虽然文章发在 Annals of Oncology,但是如果通过蛋白质组学加成让 AA 提升 5% 敏感性的代价是牺牲 4% 的特异性。
我想,这是除AA 性能党之外所有人都不能接受的。别忘了,Shield 的底线是坚守 90% 特异性,满足 Medicare 的要求。
于是,在 2024 年 3 月 NEJM 主文章的附件材料中,有这样一段话。
虽然只是一句轻描淡写的「添加蛋白质反而不如只用cfDNA效果好」。懂得都懂:两全相害取其轻,特异性上不放松

默默翻倍的 panel

从 2019 年开始到 NEJM 文章发表前,公开的学术资料中凡是涉及到产品设计路线图的,GH 一直宣称 LUNAR2 的 panel 大小为 500Kb,甚至 2024 ASCO 一篇摘要中,方法学部分仍然标注了500Kb。
但到了 MEJM 的文章中 panel 大小默默变成了 1Mb,无奖竞猜,多出来的 500Kb 是干什么的?

Shield V2 新版本性能几何

Cologuard 有 V2,Shield 同样也并非不思进取。早在2023年的几次公开会议中,GH就已经透露了Shield V2版本的消息。
在放弃AA性能的挣扎之后,V2版本的Shield保证特异性不降的前提下,将整体敏感性从V1版本的84%提升到了91%。
这一结果最终正式发表在 2024 年 ASCO-GI 会议[6] 中。
GH 通过 1M panel 和 10X 覆盖度的测序量数据,通过提高噪声过滤和模型调参,更好地检测了 ctDNA 低脱落的肿瘤样本。相比 ECLIPSE 实验中的模型,LoD95 下降到十万分之四,I/II 期敏感性从 76% 提高到 88%。


多癌筛查的布局和野望

在 Guardant 用 Shield 对标 Cologuard 的这几年里,他们面对 Grail 左手右手的几个大动作,想必也无法视而不见。
早在2022年AACR年会上,GH的口头报告就介绍了其多癌筛查规划[7]
依旧基于Shield的甲基化信号富集技术,完成多模态信号输出。
这种技术能在降低测序成本的同时提高信噪比。当时披露的 SHIELD 面板大小为 1M,测序量接近 40M。而新一代 Shield 在 15Mb panel(据报道包括约 20000 个表观基因组生物标志物)的基础上只需不到 20M 的测序量。
在这次研究结果中,他们也公布了结直肠癌、肺癌、胰腺癌和膀胱癌四种癌症的初步分析结果。
一年后 2023 ASCO 年会,GH 再次详细介绍了他们计划开展的一项针对多癌种的前瞻性、观察性、多中心篮子研究[8] SHIELD (Screening for High Frequency Malignant Disease)
该研究的主要目标是评估基于血液的多癌筛查测试(Guardant LUNAR-2)与标准筛查方式相比的检测性能。每个研究队列代表一种(或多种)癌症类型。
符合条件的个人在相应癌症类型的标准护理筛查的 90 天内进行全血采集,临床诊断按照标准护理进行。
主要目标:基于血液多癌筛查测试的敏感性、特异性、PPV 和 NPV。
次要目标:每 1000 名筛查者中检测到的癌症数量、早期和晚期数量。同时随访收集一年和两年的临床结果。
目前正在开展的队列 A 是一个肺癌筛查队列,入组条件与 USPSTF 筛查推荐一致。该队列将在 24 个月内招募 9000 名受试者。2022 年 1 月启动后一年入组了 4866 人,预计在 2023 年底达到招募目标,2024 年 12 月完成主要结果数据收集。
正在进行的队列A为肺癌筛查队列,入组条件与USPSTF筛查推荐一致。当时的公布内容显示,该队列将在24个月内招募9000名受试者。启动一年后入组4866人并预计在2023年底达到目标,2024年12月完成主要结果数据收集。
如果查看实际的 临床实验注册信息[9],A 队列又增加了 3000 名受试者入组配额,2024 年 7 月状态修改为停止招募。随访计划也从原来的 1 年和 2 年各随访一次调整为仅 1 年随访一次,预计今年底得到主要结果的节点没有修改。
以及,从 GH 的对外发言中,我们可以大致了解他们的癌症筛查产品线规划:
肠癌目前已经完成 FDA 获批,随后启动 IVD 和 ADLT,针对一般风险人群每1年进行1次检测,预计 2026 年搞定 USPSTF。
肺癌在路上,目标是针对一般风险人群 3 年检测1次,针对高风险人群推荐1年检测1次。
更有趣的是,他们要如何做到:用相同的检测和费用,只需简单的软件升级就完成新癌种的检测呢? 
以上,就是我们对Shield这款产品的多维度梳理。Guardant Shield 获批之前这五年,那些你该了解的按部就班、跌跌撞撞 、布局和野望。



有趣的胖子万里挑一
写写肿瘤NGS行内人、行内事,主要还是瞎比比
 最新文章