目标仿真试验的基本原理、设计要素及其优缺点

文摘   2024-11-05 00:06   北京  

前言

版权归属作者及编辑部,仅供学术交流使用,如有侵权请联系后马上删除。部分内容由AI生成

ETT的提出

ETT(目标仿真试验)最早是由Hernán MA和Robins JM在2016年提出的。他们在《American Journal of Epidemiology》杂志上发表了题为“Using big data to emulate a target trial when a randomized trial is not available”的文章,首次提出了ETT的概念和方法。这篇文章详细讨论了如何利用大数据来模拟一个目标试验,当随机对照试验(RCT)不可行时。

现使用者偏倚

现使用者偏倚(current user bias)是指在观察性研究中,由于研究设计或数据收集方式的原因,导致正在使用某种干预措施(如药物、治疗或暴露)的人群与未使用该干预措施的人群在基线特征上存在系统性差异,这种差异可能会影响研究结果的准确性。

举例说明现使用者偏倚:

假设我们想要研究阿仑膦酸钠(一种治疗骨质疏松症的药物)对骨密度的影响。如果我们在研究中简单地将人群分为“使用阿仑膦酸钠”和“未使用阿仑膦酸钠”两组,并比较两组的骨密度变化,可能会遇到现使用者偏倚的问题。因为能够耐受并持续使用阿仑膦酸钠的患者可能本身骨密度就较好,或者对药物反应较好,而那些没有使用阿仑膦酸钠的患者可能是因为不能耐受药物的副作用或者病情较轻而没有使用。这样,两组患者在基线时就存在差异,导致研究结果可能会高估阿仑膦酸钠的疗效。

为了避免现使用者偏倚,研究者可以采用目标仿真试验(ETT)等方法,通过统计学手段模拟随机分配的过程,尽量平衡两组间的基线特征差异,从而减少偏倚对研究结果的影响。

永恒时间偏倚

永恒时间偏倚(Immortal Time Bias)是一种在观察性研究中可能出现的偏倚,特别是在涉及时间相关暴露(如药物使用)的研究中。这种偏倚发生在研究开始时,一些个体由于尚未开始暴露(例如,尚未开始服用药物),因此在研究初期不会被计入暴露组,但这些个体在研究期间的任何时间点开始暴露后,就会被纳入暴露组进行分析。这导致了一个现象:暴露组中的个体似乎“永恒”地存在于研究中,而实际上他们只是在开始暴露后才开始被纳入分析。

举例说明:

假设我们研究一种抗高血压药物对于降低心脏病发作风险的效果。我们有一个队列,包括了所有高血压患者,但我们只记录了那些已经开始服用抗高血压药物的患者的数据。在这个队列中,我们注意到,那些在研究开始时还没有开始服用药物的患者,在他们开始服用药物之前,他们的心脏病发作风险并没有被计入药物组的风险评估中。这意味着,药物组的心脏病发作风险被低估了,因为那些在研究开始时还没有开始服用药物的患者,他们的高风险期(即他们还没有开始治疗的时期)并没有被包括在内。

具体来说,如果一个患者在研究开始后的第6个月开始服用抗高血压药物,那么在他开始服药之前的6个月里,他虽然有心脏病发作的风险,但这些风险并没有被计入药物组的风险评估中。只有当他开始服药后,他的风险才被计入药物组。这就导致了药物组的心脏病发作风险被低估,因为那些在开始服药之前的时间并没有被考虑在内,从而产生了永恒时间偏倚。

为了避免这种偏倚,研究者通常会采用目标仿真试验(ETT)等方法,通过模拟随机化的过程来创建一个类似于随机对照试验(RCT)的环境,从而减少这种偏倚的影响。

在目标仿真试验(ETT)研究中,研究对象的入选和排除标准应当基于研究对象在基线时的情况来确定,这意味着这些标准应该只考虑研究对象在进入研究时的信息,而不包括基线之后发生的任何信息,比如治疗依从性等。

举例来说,假设我们正在进行一项研究,旨在评估某种降压药物对于降低高血压患者心脏病发作风险的效果。在ETT研究设计中,我们会设定入选标准,比如“年龄在40至70岁之间,且确诊为高血压的患者”。同时,我们也会设定排除标准,比如“有严重肝肾功能障碍的患者”。这些标准都是在患者进入研究时,即基线时,根据他们的健康状况来确定的。

然而,如果我们在入选和排除标准中包含了基线后的信息,比如“患者在治疗期间能够严格遵循医嘱服用降压药物”,这就不符合ETT的原则。因为在随机对照试验(RCT)中,研究者在患者入选时并不知道他们未来是否会依从治疗,这些信息是在研究过程中收集的,而不是在基线时确定的。如果在ETT分析中包括了这些基线后的信息,就可能引入选择偏倚,导致研究结果的不准确。因此,在ETT研究中,我们必须确保入选和排除标准仅基于基线时的信息,以模拟RCT的研究环境,确保研究结果的可靠性。

所谓的“事后随机化过程”是指在实际研究中,由于各种原因(如伦理、成本、时间等),无法进行真正的随机对照试验(Randomized Controlled Trial, RCT),因此研究者会采用一些统计学方法来模拟随机化的效果,以减少偏差和混杂因素的影响,使得观察性研究的结果更接近于RCT的结果。

提到的几种统计学方法分别是:

  1. 倾向性得分匹配(Propensity Score Matching):这是一种利用倾向性得分(即个体接受某种干预的概率)来匹配接受干预和未接受干预的个体,以平衡两组间的基线特征,减少选择偏倚。

  2. 逆概率加权(Inverse Probability of Treatment Weighting):这种方法通过对每个个体的干预概率进行加权,来调整不同干预组之间的基线差异,使得加权后的样本在基线特征上更加均衡。

  3. G方法(G-methods):这是一种用于处理时间依赖性协变量的统计方法,可以用于调整随访过程中出现的混杂因素,适用于生存数据和纵向数据的分析。

  4. 双重稳健估计法(Double Robust Estimation):这种方法结合了倾向性得分和逆概率加权的优点,即使在模型不完全正确的情况下,也能提供一致的估计结果,因此被称为“双重稳健”。

这些方法在目标仿真试验中被广泛使用,以模拟随机化过程,减少非随机化研究设计中的偏差,提高研究结果的可靠性。

关于三个时间点必须一致在此保留意见,和国外参考文献及实现ETT方法学的R包不一致

霍桑效应(Hawthorne Effect)是指在实验或研究中,当参与者知道自己正在被观察或研究时,他们的行为或表现可能会受到影响,从而产生一种改变效应。这种效应最早是在20世纪20年代至30年代的霍桑工厂实验中被发现的,因此得名。

举例说明霍桑效应:假设有一个工厂,管理层想要研究提高照明亮度是否能够提高工人的生产效率。他们选择了一个车间进行实验,将照明亮度提高,并观察工人的生产效率。实验结果显示,照明亮度提高后,工人的生产效率确实有所提高。然而,这种提高并不仅仅是因为照明亮度的增加,还可能是因为工人们知道自己被观察,所以他们更加努力工作,以期得到管理层的认可或避免受到惩罚。这就是霍桑效应的一个典型例子。

在医学研究中,霍桑效应也很常见。比如在一项药物试验中,如果患者知道自己正在接受新药治疗,他们可能会因为期望药物有效而报告更多的正面效果,即使这些效果可能部分是由于他们的心理预期而非药物的实际效果。因此,在设计实验和研究时,研究者会尽量控制霍桑效应,比如通过盲法(使参与者不知道自己接受的是实验组还是对照组)来减少这种效应对结果的影响。


灵活胖子的科研进步之路
医学博士,R语言及Python爱好者,科研方向为真实世界研究,生信分析与人工智能研究。
 最新文章