柳叶刀临床研究基本概念 | 第8章 筛查试验的应用与滥用

文摘   2024-10-19 10:04   上海  
重温经典,今天继续分享本人阅读《柳叶刀临床研究基本概念》第2版的读书笔记,今天分享第八章读书笔记,请大家指正。
本章思维导图如下:

本文深入探讨了筛查试验在现代医学实践中的应用与潜在危害。
1. 筛查试验概述
筛查试验是在外表健康的人群中识别疾病高风险个体的过程。其目的是通过早期诊断和治疗,降低疾病的发病率和死亡率,改善人群的健康状况。然而,并非所有筛查试验都值得推广,其有效性、安全性、成本效益以及伦理学问题都需要谨慎评估。
2. 筛查试验的有效性指标
筛查试验的有效性主要基于以下四个指标:
  • 灵敏度 (Sensitivity): 指试验正确识别患病人群的能力。公式为:灵敏度 = 真阳性人数 / (真阳性人数 + 假阴性人数)。例如,一项检测100名患者,其中95名被正确诊断为阳性,则灵敏度为95%。灵敏度越高,漏诊的可能性越小,但假阳性的可能性也越大。
  • 特异度 (Specificity): 指试验正确识别健康人群的能力。公式为:特异度 = 真阴性人数 / (真阴性人数 + 假阳性人数)。例如,一项检测100名健康人群,其中95名被正确诊断为阴性,则特异度为95%。特异度越高,误诊的可能性越小,但漏诊的可能性也越大。
  • 阳性预测值 (Positive Predictive Value): 指检测结果为阳性的人群中,实际患病人群的比例。公式为:阳性预测值 = 真阳性人数 / (真阳性人数 + 假阳性人数)。例如,一项检测100名人群,其中10名检测结果为阳性,经确诊后8名为真阳性,则阳性预测值为80%。阳性预测值受患病率和灵敏度的共同影响。
  • 阴性预测值 (Negative Predictive Value): 指检测结果为阴性的人群中,实际健康人群的比例。公式为:阴性预测值 = 真阴性人数 / (真阴性人数 + 假阴性人数)。例如,一项检测100名人群,其中90名检测结果为阴性,经确诊后88名为真阴性,则阴性预测值为97.8%。阴性预测值受患病率和特异度的共同影响。
3. 患病率对预测值的影响
疾病患病率对筛查试验的预测值有显著影响。即使在低患病率人群中,即使灵敏度和特异度都很高的试验,其阳性预测值也可能很低。这意味着大量假阳性结果,导致不必要的焦虑和进一步检查,甚至可能引发医源性伤害。
4. 灵敏度和特异度的权衡
对于连续性变量的试验,如血糖、血压等,灵敏度和特异度之间存在权衡关系。较低的临界值可以提高灵敏度,但会降低特异度,导致假阳性率增加;相反,较高的临界值可以提高特异度,但会降低灵敏度,导致假阴性率增加。选择合适的临界值需要权衡漏诊和误诊的风险,并考虑疾病的严重程度、治疗的有效性等因素。
5. 筛查试验的应用标准
并非所有试验都适合作为筛查工具。理想的筛查试验应满足以下标准:
  • 疾病有明确定义,且患病率已知: 筛查的目标疾病应有明确的诊断标准和可靠的流行病学数据。例如,乳腺癌和宫颈癌的筛查。
  • 疾病的自然病程已知,且存在有效的干预措施: 筛查发现的疾病应有明确的治疗方案,并能有效改善患者的预后。例如,高血压和糖尿病的筛查。
  • 筛查项目经济有效,便于诊断: 筛查试验的成本应合理,且易于实施,以便于大规模人群筛查。例如,血压和血糖的筛查。
  • 必须存在有效治疗: 筛查发现的疾病应有有效的治疗方法,才能发挥筛查的价值。例如,乳腺癌和宫颈癌的筛查。
  • 阳性结果的后续措施已形成共识,并被筛查者接受: 筛查试验的阳性结果应有明确的处理流程,并被筛查者接受。例如,乳腺癌筛查的阳性结果需要进行活检。
  • 筛查试验安全,有合理且明确定义的临界值,具有有效性 (validity) 和可靠性 (reliability): 筛查试验应安全可靠,且其结果具有准确性。例如,乳腺X光筛查的辐射剂量应控制在安全范围内。
6. 筛查试验的潜在危害
筛查试验可能带来以下潜在危害:
  • 过度诊断和过度治疗: 筛查可能发现一些早期病变,其自然病程可能不会导致临床症状,但患者仍可能接受不必要的治疗,甚至产生副作用。例如,乳腺导管原位癌的过度诊断和治疗。
  • 假阳性和假阴性结果: 筛查试验并非完美,存在假阳性和假阴性结果,可能导致不必要的焦虑、治疗或延误诊断。例如,宫颈癌筛查可能导致一些假阳性结果,导致患者接受不必要的治疗。
  • 心理负担: 筛查结果可能引发患者的焦虑、恐惧和压力,影响生活质量。例如,乳腺癌筛查可能导致一些假阳性结果,导致患者产生不必要的焦虑。
  • 资源浪费: 筛查试验需要消耗大量的人力、物力和财力,可能导致医疗资源分配不均。例如,过度筛查可能导致医疗资源的浪费。
7. 筛查试验的评估指南
为了提高筛查试验研究的质量和透明度,STARD (Standards for Reporting of Diagnostic Accuracy Studies) 声明提出了30个评价要素,旨在规范诊断准确性研究的报告。这些要素涵盖了研究设计、参与者、指标试验、参照标准、结果评估、统计分析、结果报告等方面。QUADAS (Quality Assessment of Diagnostic Accuracy Studies) 工具则提供了14个条目清单,用于评估诊断准确性研究的质量,包括研究的内部和外部真实性、结果的准确性和可靠性等。
8. 常见的偏倚
筛查试验研究中存在一些常见的偏倚,可能影响结果的准确性,例如:
  • 领先时间偏倚 (Lead-time Bias): 筛查导致疾病诊断时间提前,但并不延长寿命。例如,乳腺癌筛查可能导致乳腺癌的早期诊断,但并不延长患者的生存时间。
  • 病程长短偏倚 (Length-time Bias): 筛查发现的无症状患者可能比有症状患者寿命更长,但这并非筛查的功劳。例如,一些生长缓慢的肿瘤可能因筛查而早期发现,导致患者寿命延长,但这并非筛查的功劳。
  • 合并偏倚 (Incorporation Bias): 指标试验对标准参照试验的执行产生影响。例如,如果指标试验结果阳性的人群更倾向于接受参照试验的检测,则会导致指标试验的灵敏度被高估。
  • 差异核实偏倚 (Differential Verification Bias): 指标试验结果阳性的人群更倾向于接受参照试验的检测。例如,如果一个体征或症状作为指标试验,其阳性结果导致患者接受进一步的检查,则会导致指标试验的灵敏度被高估。
  • 不完美“金标准”偏倚 (Imperfect Gold Standard Bias): 参照试验存在错误,导致指标试验的灵敏度或特异度被夸大或低估。例如,如果参照试验的假阴性率较高,则会导致指标试验的灵敏度被低估。
  • 频谱偏倚 (Spectrum Bias): 指标试验的灵敏度或特异度受到研究人群疾病谱的影响。例如,如果研究人群的疾病谱较严重,则会导致指标试验的灵敏度被高估。
9. 筛查试验的应用实例
本文列举了宫颈癌、卵巢癌、乳腺癌、高血压、糖尿病、性传播疾病、胎儿染色体异常等筛查试验的应用实例,分析了其利弊和潜在危害。
  • 宫颈癌筛查: 宫颈癌筛查可以有效降低宫颈癌的死亡率,但可能导致过度诊断和治疗,以及心理负担。例如,宫颈细胞学筛查可能导致一些良性病变被过度诊断和治疗。
  • 卵巢癌筛查: 目前尚无有效的卵巢癌筛查方法,且筛查试验的假阳性率较高,可能导致不必要的手术和并发症。例如,卵巢癌筛查可能导致一些假阳性结果,导致患者接受不必要的手术。
  • 乳腺癌筛查: 乳腺X光筛查可以有效降低乳腺癌的死亡率,但可能导致过度诊断和治疗,以及心理负担。例如,乳腺X光筛查可能导致一些良性病变被过度诊断和治疗。
  • 高血压筛查: 高血压筛查可以有效控制血压,降低心血管疾病的风险,但可能导致过度治疗。例如,高血压筛查可能导致一些血压正常的人群被过度诊断为高血压,并接受不必要的治疗。
  • 糖尿病筛查: 糖尿病筛查可以有效控制血糖,降低糖尿病并发症的风险,但可能导致过度治疗。例如,糖尿病筛查可能导致一些血糖正常的人群被过度诊断为糖尿病,并接受不必要的治疗。
  • 性传播疾病筛查: 性传播疾病筛查可以有效控制性传播疾病的传播,但可能导致过度治疗和歧视。例如,性传播疾病筛查可能导致一些假阳性结果,导致患者被过度治疗和歧视。
  • 胎儿染色体异常筛查: 胎儿染色体异常筛查可以有效降低染色体异常胎儿的出生率,但可能导致不必要的流产和焦虑。例如,胎儿染色体异常筛查可能导致一些假阳性结果,导致孕妇选择不必要的流产。
10. 结论
筛查试验是一把双刃剑,正确应用可以改善健康,但不当应用也可能造成伤害。临床医生和公众需要了解筛查试验的原理和局限性,谨慎评估其利弊,并根据具体情况选择合适的筛查方案。
11. 参考文献
临床研究基本概念(第2版)/ (美)肯尼思. F. 舒尔茨 (Kennel:h F. Schulz) 原著; 王吉耀 主译. 北京:人民卫生出版社,2020

临床研究与医学统计
传播和普及临床试验与医学统计方法学知识
 最新文章