IF96.2新英格兰解读--观察性研究中的目标试验模拟——潜力与陷阱

文摘 2024-12-05 23:18 北京

随机对照试验（RCTs）是评估医疗干预相对安全性和疗效的标准方法。尽管来自流行病学研究和医疗数据库（包括电子健康记录（EHRs）和医疗保险数据）的观察性数据分析具有大样本量、数据及时可用性以及评估“真实世界”效果等优点，但它们容易受到偏倚的影响，这些偏倚削弱了它们所产生证据的可靠性。根据RCT的原则设计观察性研究一直被提议作为提高这些研究结果有效性的一种方法。尽管许多方法学方法试图从观察性数据中得出因果推断，研究人员正越来越多地将观察性研究的设计模拟为假设性RCT的设计，这一方法被称为“目标试验模拟”。

目标试验模拟框架包括设计和分析一个观察性研究，该研究与一个假设性的随机对照试验（RCT）对齐，目的是回答相同的研究问题。尽管这种方法有潜力通过提供结构化的设计、分析和报告方法来提高观察性研究的质量，但以这种方式进行的研究仍然容易受到许多偏倚源的影响，包括未观察到的混杂因素的混杂。这类研究需要谨慎地指定设计元素、处理混杂因素的分析方法，并报告敏感性分析结果。

在使用目标试验模拟方法的研究中，研究人员首先指定一个假设的RCT，该RCT理想情况下应当进行，以回答给定的研究问题，然后指定与该“目标”RCT的元素对齐的观察性研究设计元素。必要的设计元素包括资格标准、参与者选择、治疗策略、治疗分配、随访的开始和结束、结果测量、疗效评估和统计分析计划（SAP）。例如，Dickerman等人使用目标试验模拟框架，评估了BNT162b2和mRNA-1273疫苗在预防SARS-CoV-2感染、住院和死亡方面的比较效力，使用了来自退伍军人事务部（VA）的电子健康记录（EHR）数据。

目标试验模拟的一个关键方面是“零时点”的定义，即评估参与者资格、进行治疗分配和开始随访的时间点。在VA Covid-19疫苗研究中，零时点被定义为第一次疫苗接种的日期。资格确定、治疗分配和随访开始在零时点的对齐可以减少重要的偏倚来源——特别是不朽时间偏倚（immortal time bias），它发生在治疗策略定义在随访开始之后，以及选择偏倚（selection bias），它发生在随访在治疗分配后开始。在VA Covid-19疫苗研究中，如果基于接种第二剂疫苗来将参与者分配到治疗组，但随访从第一次接种开始，则会导致不朽时间偏倚；如果在第一次接种时分配治疗组，但随访从第二剂接种时开始，则会导致选择偏倚，因为只有接种了两剂的人会被纳入分析。

目标试验模拟还可以帮助避免治疗效应定义不明确，这是观察性研究中的一个常见挑战。在VA Covid-19疫苗研究中，参与者根据基线特征进行匹配，治疗效果根据24周时的结果风险差异进行评估。这种方法明确地将效果估计定义为在基线特征上平衡的接种人群之间的Covid-19结果差异——类似于RCT中针对相同问题的疗效估计。正如该研究的作者所指出的，比较两种相似疫苗比比较接种疫苗和未接种疫苗人群的结果，更不容易受到混杂的影响。

即使成功对齐，使用目标试验模拟框架的研究的有效性仍然依赖于各种假设、设计和分析的选择，以及基础数据的质量。尽管RCT结果的有效性也依赖于设计和分析的质量，但观察性研究的结果还受到混杂偏倚的威胁。作为非随机化研究，它们缺乏RCT对混杂因素的保护，而且缺乏对参与者和临床医生的盲法处理，可能会影响结果评估和研究结果。在VA Covid-19疫苗研究中，使用匹配方法平衡了基线参与者特征的分布，包括年龄、性别、种族和居住地区的城市化程度。如果额外特征（如职业）也与Covid-19感染风险相关，且这些特征的分布有所不同，将导致残留混杂偏倚。

许多使用目标试验模拟方法的研究使用了“真实世界数据”（RWD），例如来自电子健康记录（EHR）的数据。RWD的优势包括及时性、广泛适用性以及捕捉治疗模式在日常实践中的发生，但也必须平衡数据质量的问题，包括缺失数据、参与者特征和结果的确认与定义不准确、不一致、治疗应用或实施的差异、随访评估的频率差异、以及由于参与者在不同健康系统之间转移导致的缺失数据和失访。在VA研究中，使用单一EHR数据来源减少了数据不一致的担忧。然而，变量的确认和记录不完整，包括共存疾病和结果，仍然是一个风险。

参与者选择进入分析样本通常基于回顾性数据，这可能导致选择偏倚，原因是排除了那些缺失基线信息的个体。虽然这些问题并非观察性研究所特有，但它们构成了目标试验模拟框架无法直接解决的残留偏倚来源。此外，观察性研究通常没有预先注册，这加剧了设计敏感性和发表偏倚的问题。由于结果可能在数据来源、设计和分析方法之间存在显著差异，因此对研究设计、分析以及数据来源选择的预先规范化是至关重要的。

为了增强使用目标试验模拟框架进行研究的质量，并确保它们以足够的细节报告以支持读者的严格评估，应该采取一些最佳实践。首先，协议和统计分析计划（SAP）应在数据分析之前预先规范化。SAP应包括将用于处理因混杂因素而产生的偏倚的统计方法的详细信息，并进行敏感性分析，以评估结果对关键偏倚来源（包括混杂和缺失数据）的稳健性。

标题、摘要和方法部分应明确标识研究设计为观察性研究，以避免与RCT的混淆，并区分已进行的观察性研究与它所模拟的假设试验。研究人员应提供关于数据来源的详细描述、数据元素的可靠性和有效性等质量指标，并尽可能引用使用该数据来源的其他已发表研究。他们还应包括一张表格，概述目标试验及其观察性模拟的设计元素，并明确指定确定参与者资格、开始随访和确定治疗分配的时间点。

使用目标试验模拟的研究应当采用方法来处理不朽时间偏倚，特别是在治疗策略无法在基线时定义的情况下（例如治疗持续时间或组合治疗的研究）。研究人员应报告有意义的敏感性分析，评估结果对关键偏倚来源的稳健性，包括量化未观察到的混杂偏倚的潜在影响，并通过对关键设计元素的不同规范进行分析，探讨结果的变异性。使用负对照结果——即那些被认为与感兴趣暴露无关联的结果——也可能对量化残留偏倚有帮助。

尽管观察性研究允许调查RCT不可行的研究问题，并利用真实世界数据的优势，但它们也存在许多潜在的偏倚来源。目标试验模拟框架试图解决其中的一些偏倚，但模拟研究必须谨慎进行并报告。由于混杂因素带来的偏倚风险，评估结果对未观察到的混杂因素的稳健性至关重要，且在解释结果时，必须考虑混杂因素的不同假设对结果的变异性影响。当严格实施时，目标试验模拟框架为系统地规范观察性研究设计提供了一种有用的方法，但它并非万能。

参考文献：Hubbard RA, Gatsonis CA, Hogan JW, Hunter DJ, Normand ST, Troxel AB. "Target Trial Emulation" for Observational Studies - Potential and Pitfalls. N Engl J Med. 2024 Nov 28;391(21):1975-1977. doi: 10.1056/NEJMp2407586. Epub 2024 Nov 23. PMID: 39588897.

小猪的科研生活

分享日常科研生活和统计以及机器学习知识

最新文章

再发一篇SCI！附带更新重症教学小程序！

高分综述解读--机器学习在心力衰竭诊断、预测和预后中的应用

IF8.5一区解读：机器学习+老年心力衰竭合并高血压+院内死亡+多中心

IF96.2新英格兰解读--观察性研究中的目标试验模拟——潜力与陷阱

IF13高分解读--代谢功能障碍预测阿尔茨海默病的发展：对电子病历数据的统计和机器学习分析

IF18.8nature子刊--基于树的 Explainable AI：从局部解释到全局理解

高分综述解读--机器学习在心力衰竭诊断、预测和预后中的应用

IF8.5一区解读：机器学习+老年心力衰竭合并高血压+院内死亡+多中心

IF96.2新英格兰解读--观察性研究中的目标试验模拟——潜力与陷阱

IF13高分解读--代谢功能障碍预测阿尔茨海默病的发展：对电子病历数据的统计和机器学习分析

IF18.8nature子刊--基于树的 Explainable AI：从局部解释到全局理解

IF8.5一区解读：机器学习+老年心力衰竭合并高血压+院内死亡+多中心

IF96.2新英格兰解读--观察性研究中的目标试验模拟——潜力与陷阱

IF13高分解读--代谢功能障碍预测阿尔茨海默病的发展：对电子病历数据的统计和机器学习分析

IF18.8nature子刊--基于树的 Explainable AI：从局部解释到全局理解

IF30.8柳叶刀子刊--出生后第一年严重呼吸道合胞病毒感染的危险因素：模型的建立与验证

IF96.2新英格兰解读--观察性研究中的目标试验模拟——潜力与陷阱

IF13高分解读--代谢功能障碍预测阿尔茨海默病的发展：对电子病历数据的统计和机器学习分析

IF18.8nature子刊--基于树的 Explainable AI：从局部解释到全局理解

BMJ解读--开发临床预测模型：分步指南

IF13高分解读--代谢功能障碍预测阿尔茨海默病的发展：对电子病历数据的统计和机器学习分析

IF18.8nature子刊--基于树的 Explainable AI：从局部解释到全局理解

IF30.8柳叶刀子刊--出生后第一年严重呼吸道合胞病毒感染的危险因素：模型的建立与验证

BMJ解读--开发临床预测模型：分步指南

一区解读-风险预测模型中类别不平衡校正的危害

IF18.8nature子刊--基于树的 Explainable AI：从局部解释到全局理解

IF30.8柳叶刀子刊--出生后第一年严重呼吸道合胞病毒感染的危险因素：模型的建立与验证

BMJ解读--开发临床预测模型：分步指南

一区解读-风险预测模型中类别不平衡校正的危害

一区解读-电子健康数据模型的偏见检测和缓解策略

IF30.8柳叶刀子刊--出生后第一年严重呼吸道合胞病毒感染的危险因素：模型的建立与验证

(IF15.7)JAMA子刊：解决手术风险预测中类别不平衡的风险特异性训练队列

BMJ解读--开发临床预测模型：分步指南

一区解读-风险预测模型中类别不平衡校正的危害

一区解读-电子健康数据模型的偏见检测和缓解策略

IF14.3解读---基于多模态机器学习的标记物可实现高尿酸血症的早期检测和预后预测

IF11.1柳叶刀子刊--胰腺癌风险预测模型在美国大规模临床数据上开发和验证

(IF15.7)JAMA子刊：解决手术风险预测中类别不平衡的风险特异性训练队列

lancet子刊解读--脓毒性休克患者+血压反应指数+多中心队列研究（IF:9.7）

BMJ解读--开发临床预测模型：分步指南

一区解读-风险预测模型中类别不平衡校正的危害

一区解读-电子健康数据模型的偏见检测和缓解策略

IF11.1柳叶刀子刊--胰腺癌风险预测模型在美国大规模临床数据上开发和验证

(IF15.7)JAMA子刊：解决手术风险预测中类别不平衡的风险特异性训练队列

lancet子刊解读--脓毒性休克患者+血压反应指数+多中心队列研究（IF:9.7）

BMJ解读--开发临床预测模型：分步指南

一区解读-风险预测模型中类别不平衡校正的危害

一区解读-电子健康数据模型的偏见检测和缓解策略

新时代医疗预测模型：TRIPOD+AI声明深度解读

(IF30.8)柳叶刀子刊：机器学习+可解释+预测减肥手术后 5 年的体重轨迹+多国回顾性

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉