随机对照试验(RCTs)是评估医疗干预相对安全性和疗效的标准方法。尽管来自流行病学研究和医疗数据库(包括电子健康记录(EHRs)和医疗保险数据)的观察性数据分析具有大样本量、数据及时可用性以及评估“真实世界”效果等优点,但它们容易受到偏倚的影响,这些偏倚削弱了它们所产生证据的可靠性。根据RCT的原则设计观察性研究一直被提议作为提高这些研究结果有效性的一种方法。尽管许多方法学方法试图从观察性数据中得出因果推断,研究人员正越来越多地将观察性研究的设计模拟为假设性RCT的设计,这一方法被称为“目标试验模拟”。
目标试验模拟框架包括设计和分析一个观察性研究,该研究与一个假设性的随机对照试验(RCT)对齐,目的是回答相同的研究问题。尽管这种方法有潜力通过提供结构化的设计、分析和报告方法来提高观察性研究的质量,但以这种方式进行的研究仍然容易受到许多偏倚源的影响,包括未观察到的混杂因素的混杂。这类研究需要谨慎地指定设计元素、处理混杂因素的分析方法,并报告敏感性分析结果。
在使用目标试验模拟方法的研究中,研究人员首先指定一个假设的RCT,该RCT理想情况下应当进行,以回答给定的研究问题,然后指定与该“目标”RCT的元素对齐的观察性研究设计元素。必要的设计元素包括资格标准、参与者选择、治疗策略、治疗分配、随访的开始和结束、结果测量、疗效评估和统计分析计划(SAP)。例如,Dickerman等人使用目标试验模拟框架,评估了BNT162b2和mRNA-1273疫苗在预防SARS-CoV-2感染、住院和死亡方面的比较效力,使用了来自退伍军人事务部(VA)的电子健康记录(EHR)数据。
目标试验模拟的一个关键方面是“零时点”的定义,即评估参与者资格、进行治疗分配和开始随访的时间点。在VA Covid-19疫苗研究中,零时点被定义为第一次疫苗接种的日期。资格确定、治疗分配和随访开始在零时点的对齐可以减少重要的偏倚来源——特别是不朽时间偏倚(immortal time bias),它发生在治疗策略定义在随访开始之后,以及选择偏倚(selection bias),它发生在随访在治疗分配后开始。在VA Covid-19疫苗研究中,如果基于接种第二剂疫苗来将参与者分配到治疗组,但随访从第一次接种开始,则会导致不朽时间偏倚;如果在第一次接种时分配治疗组,但随访从第二剂接种时开始,则会导致选择偏倚,因为只有接种了两剂的人会被纳入分析。
目标试验模拟还可以帮助避免治疗效应定义不明确,这是观察性研究中的一个常见挑战。在VA Covid-19疫苗研究中,参与者根据基线特征进行匹配,治疗效果根据24周时的结果风险差异进行评估。这种方法明确地将效果估计定义为在基线特征上平衡的接种人群之间的Covid-19结果差异——类似于RCT中针对相同问题的疗效估计。正如该研究的作者所指出的,比较两种相似疫苗比比较接种疫苗和未接种疫苗人群的结果,更不容易受到混杂的影响。
即使成功对齐,使用目标试验模拟框架的研究的有效性仍然依赖于各种假设、设计和分析的选择,以及基础数据的质量。尽管RCT结果的有效性也依赖于设计和分析的质量,但观察性研究的结果还受到混杂偏倚的威胁。作为非随机化研究,它们缺乏RCT对混杂因素的保护,而且缺乏对参与者和临床医生的盲法处理,可能会影响结果评估和研究结果。在VA Covid-19疫苗研究中,使用匹配方法平衡了基线参与者特征的分布,包括年龄、性别、种族和居住地区的城市化程度。如果额外特征(如职业)也与Covid-19感染风险相关,且这些特征的分布有所不同,将导致残留混杂偏倚。
许多使用目标试验模拟方法的研究使用了“真实世界数据”(RWD),例如来自电子健康记录(EHR)的数据。RWD的优势包括及时性、广泛适用性以及捕捉治疗模式在日常实践中的发生,但也必须平衡数据质量的问题,包括缺失数据、参与者特征和结果的确认与定义不准确、不一致、治疗应用或实施的差异、随访评估的频率差异、以及由于参与者在不同健康系统之间转移导致的缺失数据和失访。在VA研究中,使用单一EHR数据来源减少了数据不一致的担忧。然而,变量的确认和记录不完整,包括共存疾病和结果,仍然是一个风险。
参与者选择进入分析样本通常基于回顾性数据,这可能导致选择偏倚,原因是排除了那些缺失基线信息的个体。虽然这些问题并非观察性研究所特有,但它们构成了目标试验模拟框架无法直接解决的残留偏倚来源。此外,观察性研究通常没有预先注册,这加剧了设计敏感性和发表偏倚的问题。由于结果可能在数据来源、设计和分析方法之间存在显著差异,因此对研究设计、分析以及数据来源选择的预先规范化是至关重要的。
为了增强使用目标试验模拟框架进行研究的质量,并确保它们以足够的细节报告以支持读者的严格评估,应该采取一些最佳实践。首先,协议和统计分析计划(SAP)应在数据分析之前预先规范化。SAP应包括将用于处理因混杂因素而产生的偏倚的统计方法的详细信息,并进行敏感性分析,以评估结果对关键偏倚来源(包括混杂和缺失数据)的稳健性。
标题、摘要和方法部分应明确标识研究设计为观察性研究,以避免与RCT的混淆,并区分已进行的观察性研究与它所模拟的假设试验。研究人员应提供关于数据来源的详细描述、数据元素的可靠性和有效性等质量指标,并尽可能引用使用该数据来源的其他已发表研究。他们还应包括一张表格,概述目标试验及其观察性模拟的设计元素,并明确指定确定参与者资格、开始随访和确定治疗分配的时间点。
使用目标试验模拟的研究应当采用方法来处理不朽时间偏倚,特别是在治疗策略无法在基线时定义的情况下(例如治疗持续时间或组合治疗的研究)。研究人员应报告有意义的敏感性分析,评估结果对关键偏倚来源的稳健性,包括量化未观察到的混杂偏倚的潜在影响,并通过对关键设计元素的不同规范进行分析,探讨结果的变异性。使用负对照结果——即那些被认为与感兴趣暴露无关联的结果——也可能对量化残留偏倚有帮助。
尽管观察性研究允许调查RCT不可行的研究问题,并利用真实世界数据的优势,但它们也存在许多潜在的偏倚来源。目标试验模拟框架试图解决其中的一些偏倚,但模拟研究必须谨慎进行并报告。由于混杂因素带来的偏倚风险,评估结果对未观察到的混杂因素的稳健性至关重要,且在解释结果时,必须考虑混杂因素的不同假设对结果的变异性影响。当严格实施时,目标试验模拟框架为系统地规范观察性研究设计提供了一种有用的方法,但它并非万能。
参考文献:Hubbard RA, Gatsonis CA, Hogan JW, Hunter DJ, Normand ST, Troxel AB. "Target Trial Emulation" for Observational Studies - Potential and Pitfalls. N Engl J Med. 2024 Nov 28;391(21):1975-1977. doi: 10.1056/NEJMp2407586. Epub 2024 Nov 23. PMID: 39588897.