在医学研究中,公共数据库的二次数据挖掘为研究人员提供了宝贵的资源,在节省时间和成本的同时,仍能获得有一定意义的结论。然而,如何确保从这些数据库中挖掘出的数据是可靠的,并支持科学的结论,是每个研究者面临的挑战。
2024年8月,《NEJM循证》发表美国加州大学旧金山分校Schwarz博士等人利用“全国家庭增长调查”(NSFG)数据库资料开展的输卵管绝育后妊娠率的研究结果。同期发表的社论深入分析了该项研究在解决公共数据库挖掘过程中面临的数据回忆偏倚、数据确实以及不同随访时间差异处理等问题上采取的精妙措施,从而确保了研究结果的可靠性。这对于广大读者利用公共数据库资料开展类似研究具有重要的参考价值。
我们在此发表该社论及相关研究摘要中文翻译。
AnalysisChallenges and Opportunities in Utilizing National Survey Data for Research
Hyungjin Myra Kim
许多全国性调查旨在满足不同的需求,从分析社会趋势到为政策制定提供依据。精心设计和执行的调查能够通过收集全面且具有代表性的人群数据,提供重要的见解。此外,研究人员通过利用现有数据进行二次分析,可以在节约成本的同时避免繁重的原始数据收集,从而得出与研究目标相关的可靠结论。
尽管使用现有调查数据具有显著优势,但设计基于此类数据的研究仍然面临诸多挑战。其中最主要的挑战之一是确保数据与当前研究问题的相关性和可靠性。研究人员需要仔细评估调查的设计和抽样方法,确保其符合研究目标和假设。此外,许多调查是分多次进行的,尽管将多次调查的数据整合可以帮助分析趋势变化,但这一过程也可能带来潜在问题。
在本期NEJM Evidence中,Schwarz等人利用“全国家庭增长调查”(NSFG)四个时间段的数据(2002年、2006至2010年、2011至2013年以及2013至2015年),评估了美国15至44岁女性在输卵管结扎术后的典型失败率。NSFG由美国疾病控制和预防中心下属的国家健康统计中心负责开展,提供了关于怀孕、生育、婚姻与同居、不孕、避孕、家庭生活以及生殖健康的全国性数据。Schwarz等人通过精心设计研究,充分利用了这一现有数据资源,使其与研究目标和分析策略相一致。
在研究输卵管结扎术的失败率时,仅通过报告结扎后怀孕的妇女人数和比例是不够的,除非所有妇女均有从结扎术开始到研究结束的统一随访时间。事实上,不同妇女的随访时间差异较大,从仅几个月到数年不等,因此她们暴露于怀孕风险的时间长度也不同。为了准确评估输卵管结扎术后的怀孕风险,研究团队采用了生存分析方法,该方法能够考虑随访时间长短的差异。然而,生存分析的准确性依赖于精确记录从输卵管结扎到发生失败事件(怀孕)或随访结束(访谈时间)之间的时间间隔。这些数据通常依赖妇女对绝育时间及随后怀孕时间的回忆,这可能导致一定程度的回忆偏差。
通过采用科学严谨的研究设计和分析策略,Schwarz等人克服了上述挑战,为准确评估输卵管结扎术的失败风险提供了新的视角。
尽管回忆偏差和数据缺失是基于回顾性数据研究的常见挑战,Schwarz等人采取了一系列具体措施以应对这些问题。首先,研究排除了在输卵管结扎后怀孕日期被估算或结扎日期缺失的女性,这一策略有效避免了将输卵管结扎前的怀孕误计入分析队列。这导致2002年调查中有1.5%的女性被排除,在随后的调查中,这一比例逐渐降低。其次,研究仅在女性处于怀孕风险期内追踪从绝育到怀孕的时间。一旦女性接受了其他绝育手术或发生避孕失败,研究人员会仔细审查数据,确保分析的准确性。这些策略尽管复杂,却在数据回顾时结合月份和日期加以精确处理。
第三,对于在绝育手术当月或更早受孕但在手术结束后的妊娠,这些案例未被视为失败事件(即怀孕),因为它们可能在绝育手术之前已经发生。第四,绝育类型是一个关键的预测因素,需要准确区分产后绝育和间隔绝育(非产后绝育)。这一区分依赖于女性正确回忆妊娠时间与输卵管结扎时间的关系。最后,数据缺失或不应答可能导致偏差,因此研究团队将任何缺失的怀孕或流产记录视为未怀孕加以处理,以尽量减少对分析结果的影响。
Pregnancy after Tubal Sterilization in the United States, 2002 to 2015
输卵管绝育是美国最常用的避孕方法。由于避孕效果会影响避孕方法的选择,我们研究了美国输卵管绝育后的典型失败率。
我们利用2002年、2006~2010年、2011~2013年以及2013~2015年收集的四次全国家庭成长调查(NSFG)数据估算了输卵管绝育后的怀孕率。在生存分析中我们使用了调查加权以研究输卵管绝育后首次怀孕的时间。这些参与者的数据在输卵管复通术、不孕症治疗、子宫切除术或双侧输卵管切除术后被删除。输卵管绝育术后报告的怀孕率通过Kaplan-Meier曲线进行检验,然后使用多变量Cox比例风险模型检验输卵管绝育术时的年龄、种族/民族、教育程度、医疗补助资金以及产后手术与间隔手术的影响。
2.9%~5.2%的参与者报告在接受输卵管绝育术后怀孕。在最近一次调查(2013~2015 年)中,估计在输卵管绝育术后前12个月内怀孕的参与者比例为 2.9%;在输卵管绝育术后120个月内怀孕的参与者比例为8.4%。在所有检查的时间点上,产后输卵管绝育术后怀孕的几率都低于间隔手术后怀孕的几率;但在多变量模型中,这种差异并不明显。在多变量模型中,怀孕几率随着输卵管绝育时年龄的增长而降低。种族/民族、教育程度和医疗补助资金与输卵管绝育后怀孕的关系并不一致。
这些数据表明,输卵管绝育后的怀孕率可能并不低。
版权信息
本文由《NEJM医学前沿》编辑部负责翻译、编写或约稿。对于源自NEJM集团旗下英文产品的翻译和编写文章,内容请以英文原版为准。中译全文以及所含图表等,由马萨诸塞州医学会NEJM集团独家授权。如需转载,请联系nejmqianyan@nejmqianyan.cn。未经授权的翻译是侵权行为,版权方保留追究法律责任的权利。
点击下方名片,关注《NEJM医学前沿》