尽管目前已有大量临床预测模型问世——如胰腺癌风险预测模型有38种,而Covid-19预后模型高达353 种,但这些模型往往止步于论文发表,临床应用价值有限。
今年10月,《NEJM循证》发表德国慕尼黑大学Jonel Trebicka博士等人开发的监测慢性终末期肝病患者发生肝细胞癌的算法模型,该刊同期发表的社论深入分析了开发个性化监测算法时需要考虑的各个因素。
我们在此发表该社论及相关研究摘要中文翻译。
Statistical Considerations in Developing an Individualized Surveillance Algorithm
Hyungjin Myra Kim
随着包括医疗设备、实验室检测和基于人工智能算法在内的先进检测工具迅速普及,与这些工具诊断特性相关的统计学问题也逐渐显现,值得我们深入探讨。在开发筛查和诊断工具时,重新审视常用术语至关重要,以便明确区分并充分考虑各统计指标的实际意义。
在本期NEJM Evidence中,Gu等人提出了一种用于监测晚期慢性肝病患者新发原发性肝细胞癌(HCC)的预测算法。他们开发了一种简便的“个性化”监测策略,根据患者的特定临床特征赋予评分,总分最高为7分,每满足一项标准得1分。这些标准包括:血小板计数<150×109/L、肝硬度测量值≥15 kPa、年龄≥50岁、男性、病毒性肝炎(分为有或无,或是否得到控制)以及存在肝脏脂肪变性。该算法利用一项队列数据开发,其中5.4%的患者在2年内发生了HCC。根据算法评分,患者被分为高风险组(≥4分)和低风险组(<4分)。研究显示,在高风险组中,15.6%的患者在2年内确诊为肝癌,而低风险组仅为1.7%。该算法的受试者工作特征曲线(ROC)下面积(AUC)为0.847,并通过内部及外部验证证实了其稳健性。研究建议,高风险患者应每三个月接受一次筛查,而低风险患者可适当延长筛查间隔,这可能为患者和医疗系统带来显著收益。
在讨论监测工具的统计特性时,明确区分监测和筛查十分重要。筛查的主要目标是从大规模人群中识别可能有潜在问题的患者,因而需要灵敏性高(假阴性率低),即便假阳性率稍高也是可以接受的。相比之下,监测针对的是特定高危人群(例如晚期慢性肝病患者),其目标是诊断疾病(如HCC)。因此,监测工具需要具备高特异性,以避免较小的假阳性率导致患者不必要的恐慌,并给医疗系统带来过高成本。同时,较高的阴性预测值(NPV)也是理想的,因为这表明大多数阴性结果是真阴性,从而降低漏诊风险并确保早期干预。
理解贝叶斯定理对于解释监测工具的性能至关重要。根据该定理,在相同敏感性和特异性条件下,低患病率背景下的检测工具通常表现出较高NPV。这一特点在疾病筛查和监测工具开发及评估中具有重要指导意义,有助于优化其实际应用效果。
在Gu等人的研究中,该算法基于一项2年新发肝癌发生率为5.4%的队列开发,但所有验证队列的2年新发肝癌发生率均低于这一水平。尽管研究未报告综合诊断性能指标,但结果显示肝硬化患者的灵敏度为82.4%,特异性为60.2%,NPV高达98%。然而,如果将该算法应用于肝癌发病率高于5.4%的人群,NPV将不可避免地下降。例如,当应用于发病率为10%的人群时,算法的NPV将降至95%,这意味着每20名被算法识别为阴性的患者中,可能有1名在2年内发展为肝癌。这一NPV可能不足以满足理想个性化监测工具的要求。因此,在将该算法应用于更高发病率的目标人群时,需对其临床应用进行更为谨慎的评估。
此外,该算法的另一个局限性在于其并非用于诊断,而是一种监测策略。算法首先将患者分为高风险和低风险组,然后分配不同的监测间隔。需要注意的是,该算法的诊断性能可能因监测随访间隔时间的选择而有所不同,而不同人群的肝癌流行率也可能对监测效果产生影响。
Hepatocellular Cancer Surveillance in Patients with Advanced Chronic Liver Disease
晚期慢性肝病患者(ACLD)罹患肝细胞癌(HCC)的风险很高。因此,建议每半年进行一次检查。这项大规模多中心研究旨在对ACLD患者罹患HCC的风险进行分层。
在欧洲和中国17个中心接受筛查的3016名ACLD患者,其中2340名接受肝硬度测量(LSM),并使用不同的技术(二维剪切波弹性成像[2D-SWE]、瞬时弹性成像和点剪切波弹性成像)且疾病严重程度不同的患者被纳入本项研究。Cox回归法用于探索肝癌的危险因素。我们利用这些数据创建了一个名为PLEASE的算法,在本文中称为“算法”;该算法在内部和两个外部队列(弹性成像技术不同)进行了验证。
在随访期间,127名(5.4%)患者新发HCC。2D-SWE法测得的LSM(危险比2.28)与年龄、性别、病因和血小板计数(C指数:0.8428)均与肝癌发生有关。我们据此建立了具有应用阈值的算法,总分最高为6分:血小板计数低于150×109/L、LSM≥15 kPa、年龄≥50岁、男性、病毒性肝炎得到/未得到控制或存在肝脏脂肪变性。在2年内,中位随访13.7个月时,高危组(≥4分)患者HCC发病率为15.6%(95%置信区间[CI],12.1%~18.7%),而低危组患者为1.7%(95% CI,0.9%~2.5%)。
我们的算法将患者分为肝癌高风险和低风险两组。该算法在筛查ACLD患者是否罹患肝癌的临床决策方面的具有均衡的效用。(由德国研究基金会等资助;在ClinicalTrials.gov注册号为NCT03389152。)
版权信息
本文由《NEJM医学前沿》编辑部负责翻译、编写或约稿。对于源自NEJM集团旗下英文产品的翻译和编写文章,内容请以英文原版为准。中译全文以及所含图表等,由马萨诸塞州医学会NEJM集团独家授权。如需转载,请联系nejmqianyan@nejmqianyan.cn。未经授权的翻译是侵权行为,版权方保留追究法律责任的权利。
点击下方名片,关注《NEJM医学前沿》