RCT通过严格纳入排除标准、随机化分组和设盲来降低混杂因素和偏倚,验证干预措施与结果的关系。观察性数据分析虽具有样本量大、数据获取及时及反映真实世界数据等优点,但易受偏倚因素影响。
所以如何改进对于提高研究质量具有重要意义。现如今,越来越多的研究人员通过“目标试验模拟”的方法开展观察性研究,将观察性研究的设计模拟成假定RCT。那也就是说,弥补观察性研究自身设计缺陷,减少偏倚,文章质量自然得到提高。
近日,来自《新英格兰医学杂志》(NEJM)全体6位统计学编辑在观点栏目联合撰文题为”Target Trial Emulation for Observational Studies—Potential and Pitfalls”的研究论文,探讨在某些情况下RCT不可行时,如何通过目标试验模拟方法提高观察性研究的质量和效度。阐述了开展模拟RCT的优势和局限性,并给出了在实施时以下四个维度需要注意的问题要素:
1.目标试验模拟框架建立
1) 尽管有结构化方法,但仍易受多种偏倚因素影响,特别是未观察协变量导致的混杂效应。所以框架要求:观察性研究设计与假定RCT一致,以提升研究质量。
2)研究者需详细制定设计要素,如纳入排除标准、参与者选择等,并设计解决混杂因素的分析方法及敏感性分析报告。[举例:Dickerman等人利用此框架,结合美国退伍军人事务部EHR(电子健康记录)数据,比较了两种疫苗预防SARS-CoV-2感染等的效力。此框架不仅有助于提升研究质量,而且凸显了设计要素和分析方法的严谨性。]
2.目标试验模拟研究的关键因素
1)设定“时间零点”,统一评估资格、分配治疗和随访时间,以减少偏倚。(举例:在VACovid-19疫苗研究中,时间零点为注射第一剂疫苗日期,避免了非死亡时间偏倚和选择偏倚。此框架还明确治疗效应定义,避免观察性研究中的常见问题。)
2)研究者还需注意:假设、设计、分析方法及数据质量。因为观察性研究不像RCT那样免受混杂因素影响,且参与者和临床医师未设盲,会影响结局评估和研究结果。(举例:VACovid-19疫苗研究采用了配对方法平衡基线特征,但其他特征差异可能成为残留混杂因素。)
3. 真实世界数据(RWD)
根据美国食品药品监督管理局(FDA)的定义,医疗和保健领域的RWD是从各种来源定期收集的与患者健康状况和/或医疗保健服务相关的数据。
1)RWD如EHR(电子健康档案),其优势在于及时性和可推广性,能反映常规医疗实践数据。但是研究者需注意:数据的质量问题(包括数据缺失、确认和定义不准确、治疗施用不统一等)。
2)使用RWD进行目标试验模拟时,必须先做好研究设计、分析方法及数据源选择依据,以减少偏倚,确保结果的可靠性。
4.目标试验模拟研究的规范要求
1)遵循统一规范,提升研究质量和报告详尽度,事先制定研究方案和统计分析计划(SAP)。注意:SAP应涵盖混杂因素调整、敏感性分析等,以评估结果的稳健性。
2)研究设计需明确为观察性,与RCT区分开(指出模拟的假定试验);数据源的质量指标(如可靠性和效度)需详细说明,并列出使用该数据源的其他研究。
3)设计要素表格应概述目标试验及其观察性模拟,明确资格确定、随访开始和治疗分配时间点。若基线时治疗策略不确定,应解决非死亡时间偏倚。
4)敏感性分析需报告、量化未观察混杂因素和关键设计要素变化对结果的影响;评估结果对未观察混杂因素的稳健性,并考虑其他假设下的结果变化。
5)利用阴性对照有助于量化残留偏倚,确保研究的准确性和可靠性。
总的来说,因为利用RWD优势,观察性研究能分析RCT难以开展的问题,但存在多种潜在偏倚因素。所以研究者们必须进行敏感性分析,严格执行目标试验模拟框架,谨慎解读结果,综合考虑各种偏倚来源。
参考文献:
Hubbard RA, Gatsonis CA, Hogan JW, Hunter DJ, Normand ST, Troxel AB. "Target Trial Emulation" for Observational Studies - Potential and Pitfalls. N Engl J Med. 2024 Nov 28;391(21):1975-1977. doi: 10.1056/NEJMp2407586. Epub 2024 Nov 23. PMID: 39588897.