Time to event的多重填补

2024-09-21 08:15   上海  

多重插补 (MI) 是一种有效且越来越流行的解决方案,用于处理临床研究中缺失的协变量数据以及缺失的连续和分类结果。然而,在许多治疗领域,人们对删失事件发生时间数据的多重插补的兴趣也有所上升,因为在许多情况下,随机删失 (CAR) 假设在临床上并非对所有受试者都合理,而 MI 允许非随机删失 (CNAR) 假设。在 SAS® 中,可以通过 MI 程序、实施贝叶斯分析的程序(例如 MCMCPHREG)或用户实施的近似贝叶斯引导来实现 MI。在 MI 中,填充缺失值并创建多个插补数据集,并将不同的值交换为缺失的值。使用计算感兴趣统计数据的方法(Kaplan-Meier 生存估计、风险比等)单独分析每个插补数据集。为每个插补数据集计算这些估计值后,将使用 Rubin 规则将它们合并或合并。这些规则假定要合并的估计值是渐近正态分布的。在许多情况下,例如生存概率,此假设不成立,必须事先应用归一化转换。在本文中,我们介绍了这些归一化方法,并提出了 SAS 代码,这些代码实现了必要的数据转换和操作,以组合各种生存分析估计,例如Kaplan-Meier 生存曲线(包括百分位数)、对数秩、Wilcoxon 和其他生存曲线相等性的测试,以及多重插补后风险比的 Cox 回归估计删失时间事件数据。使用示例插补数据集提供演示。代码在http://www.missingdata.org.uk 上可以访问和下载。如果大家对于非信息和非管理删失有进一步疑问,请参考之前文章。

管理性删失

公众号:流行病学与卫生统计学生存分析中的管理性删失和非管理性删失

多重插补 (MI) (Rubin 1987) 是一种有效且越来越流行的解决方案,用于处理临床研究中缺失的协变量数据以及缺失的连续和分类结果。然而,人们对删失事件发生时间数据的多重插补的兴趣也有所上升,因为在许多情况下,标准生存分析方法采用的随机删失 (CAR) 假设(Heitjan 等人,1991 年)在临床上并非适用于所有删失试验对象,并且 MI 允许删失非随机 (CNAR) 假设。如果删失时间分布独立于事件过程,且以观察到的协变量为条件,则认为数据是随机删失的。监管机构已经注意到,在事件结束时间分析中需要探索对 CAR 假设的敏感性,正如美国食品药品监督管理局 (FDA) 委托国家研究委员会小组(国家研究委员会,2010 年)和欧洲药品管理局关于确证性试验中缺失数据的指南(欧洲药品管理局, 2010年)。与连续和分类结果类似,Lipkovich 等人 (2016) 提出了基于多重插补的方法,这些方法对在 CAR 假设下进行的时间事件研究的主要分析结论的稳健性进行了压力测试,其中受试者在经历感兴趣的事件之前退出治疗和随访。多重插补为此类敏感性分析提供了一种灵活的工具,因为用于生成插补值的插补模型可能与应用于已完成数据的分析模型不同。这允许分析师通过采用各种插补模型来改变关于缺失值(删失受试者)的假设,并在一系列临床上合理的假设(可能包括 CNAR 假设)下探索结果的稳健性。

与其他类型的结果的多重插补类似,由于事件发生时间数据的 MI,会创建多个数据集,这些数据集共享观测值(观测事件时间),但对于删失的受试者,它们具有不同的插补事件时间。必须使用最初打算的 time--to-event 分析方法单独和单独分析这些数据集。然后将每个单独分析的结果进行组合或合并,从而产生总体结果。MIANALYZE 过程使用 Rubin 规则执行最后一个组合步骤 (Rubin 1987)。MI 和结果组合的工作流程如图 1 所示。

可以从单个插补数据集中获得是治疗组与对照组对感兴趣事件的风险比的估计,随后组合的生存分析估计值。实施 Cox 回归的 PHREG 程序可用于为每个插补数据集生成风险比估计值,然后需要将其组合以获得总体风险比,以及其标准误差、置信区间和无治疗效果的总体检验。

用于组合来自多个插补数据集的结果的 Rubin 规则要求估计的统计量是渐近正态分布的。在许多典型估计值的情况下,例如比值比、风险比、相对风险或生存概率,正态性并不成立。因此,在合并结果之前,需要进行规范化转换。Van Buuren 2012) 建议对几种类型的估计统计数据进行转换(见表 1),以便将它们标准化。

本文不讨论如何为删失对象估算事件时间的问题。有关此主题的更多详细信息,请参见(Lipkovich et al. 2016;Taylor et al.2002;Van Buuren S.2012 ;Zhao et al. 2014)及其参考文献。相反,本文侧重于合并估计的解决方案,这些估计可以在多重插补后常规地在时间-事件数据分析报告中生成,例如生存曲线和生存百分位数的 Kaplan Meier 估计、生存分布的比较检验(例如,对数秩、Wilcoxon Tarone-Ware 检验统计)和 Cox 回归风险比估计。结果的分析和组合对于执行多重插补的删失受试者的假设是不变的,并且不依赖于用于填充缺失值的多重插补模型。因此,对于您选择的任何 MI 模型,组合过程都是相同的。

本文涵盖了最常见的生存分析统计数据,并包括说明关键步骤的 SAS 代码片段。这些代码片段属于在 http://www.missingdata.org.uk 上提供的更大的宏,查阅这些宏以更好地了解整个过程。在本文中包含的代码片段中,我们保留了与完整代码中相同的数据集名称和(宏)变量,以方便读者查看这两个来源。

MIANALYZE 过程实现Rubin 的组合规则,需要将数据集作为输入,其中每条记录都包含一个插补数据集的结果。此数据集必须包含一个表示分析统计量的点估计值的变量(列)和另一个表示点估计的标准误差的变量。前一个变量名称在 MODELEFFECTS 语句中指定,后者在 STDERR 语句中指定。Rubin 规则需要这两个量才能生成组合点估计、标准误差、置信限和组合估计的假设检验。因此,在本文中,在介绍准备非正态分布统计量以进行组合的必要步骤时,我们描述了获得归一化点估计值所需的计算以及归一化值的标准误差。本文首先介绍了示例数据集,然后介绍了 Kaplan-Meier 生存曲线、生存百分位数、一些用于生存曲线相等性测试的卡方分布统计的结果的组合和 Cox 回归。

本文中使用的示例数据集来自随机、双盲“在 CD4 细胞计数为每立方毫米 200 500 HIV 感染成人中比较核苷单药治疗与联合治疗的试验(Hammer 等人,1996 年),也称为 ACTG 175 研究1。出于我们的目的,我们分析了研究的次要终点 (获得性免疫缺陷综合症 (AIDS) 或死亡的时间),并比较了两个治疗组 (齐多夫定单药治疗和齐多夫定加去羟肌苷联合治疗)。表 2 描述了总体删失频率,特别是受试者在计划的两年评估期之前失访的频率。在此分析中,我们将发生事件或在计划的两年随访期后被删失的受试者视为研究完成者。我们不填补这些。我们将这些视为管理删失,并且仅填补于那些没有经历过艾滋病事件并且在随机分组后不到两年内失访的受试者。

如前所述,事件发生时间数据的 MI 对于调查偏离 CAR 假设的情况最有用,因为标准方法(如 Kaplan-Meier Cox 回归)很容易在 CAR 假设下进行生存分析,而无需对删失数据进行任何插补。然而,在本文中,我们提出了在 CAR 假设下对此示例数据集进行多重插补的分析结果。由于本文的重点是实施程序,因此检查基于 CAR 的多重插补的结果并确保它们与不涉及插补的标准基于 CAR 的分析的结果相似是有帮助的,因为计算不同但依赖于相同假设的方法预计会高度相似。

COMBINING KAPLAN-MEIER SURVIVAL CURVES AFTER MULTIPLE IMPUTATION

事件发生时间数据的典型分析通常包括使用 Kaplan-Meier 方法估计生存曲线。换句话说,我们感兴趣的是计算这些数据在随访期间特定时间的生存概率。生存概率函数的 Kaplan-Meier 估计值不是正态分布的,因此在它们与 Rubin 规则相结合之前需要进行归一化变换。如参考(Morisot et al. 2015),为了满足 Rubin 规则的假设,建议使用互补的对数-对数归一化转换。

SAS 代码片段 1 演示了此过程,首先对数据集 _spc_pl中包含的生存概率执行归一化互补对数变换,然后获得方程 1 中描述的相关标准误差,不包括生存概率为 0 1 的情况。转换后的结果将传递给 PROC MIANALYZE:在 MODELEFFECTS 语句中指定包含转换点估计值的变量的名称,在 STDERR 语句中指定包含转换后的标准误差的变量的名称。此后,组合结果将在最后一个DATA 步骤中进行反向转换。

上面的讨论假设了一组时间点 { } =1,其中生存概率估计是从每个插补数据集的 Kaplan-Meier 分析中获得的。我们通常对获得整个 Kaplan-Meier 生存曲线的组合估计感兴趣,该曲线是一个在观察到的事件时间具有恒定步长边界的阶跃函数。在多个插补数据集中,最初观察到的事件时间是相同的,但插补的事件时间当然可以不同。因此,默认情况下,PROC LIFETEST 会为每个插补数据集生成不同时间点的生存估计值。因此,为了获得总体综合生存曲线,我们需要选择一组共同的时间点,并从每个插补数据集的 Kaplan-Meier 分析中估计这组共同的生存概率。为此,可以使用 PROC LIFETEST 语句的 TIMELIST 选项来请求特定时间点的生存估计,这可能与最初观察到的事件时间不同。

更具体地说,为了获得 Kaplan-Meier 生存曲线的综合估计,我们使用一组时间点,该时间点是最初观察到的事件时间(未估算)与选择的补充时间点的结合,以跨越所有估算的最小和最大估算事件时间之间的时间段。请注意,我们没有添加任何额外的插补事件,而只是在整个随访期间的额外时间点获得生存估计值。添加这些额外的时间点是为了更好地表示包含多个插补数据集中的插补事件时间的时间段。选择这些补充时间点的方式可能不同。在这里,我们选择与所有插补中的唯一插补事件时间的数量一样多的时间点,并均匀分布它们。换句话说,如果在所有插补中都有 r 个唯一的插补事件时间,最小的是 S1,最大的是Sr ,那么除了观察到的事件时间集之外,这里还估计了以下一组时间点的生存概率。

使用所得的跨观察到的事件时间和补充时间点的组合生存概率估计值,我们可以生成组合生存曲线。图 2 显示了按治疗组划分的原始(非插补)数据的生存率曲线和插补数据的组合生存曲线。因为插补是使用假设 CAR 的多重插补模型完成的,这与原始数据的 Kaplan-Meier 分析背后的假设相同,所以获得和没有插补的生存曲线非常相似,正如预期的那样。

OBTAINING SURVIVAL PERCENTILES FROM THE COMBINEDPROBABILITIES

百分位数 qp的标准误差可以用泰勒级数近似于随机变量函数的方差

导数实际上是qp时生存 p.d.f.(概率密度函数)的估计值,可以由下式估计

ε 是一个小数,例如 ε = 0.05。在某些情况下,例如当 + 最终相等时,可能需要更大的ε。然后,可以使用正态近似值计算 95% 的置信限:

SAS 代码片段 3 演示了标准误差计算。项 t+ t 的标识及其对应的导数方程的生存估计值较长,可以在完整代码中找到,但一般思路是在包含时间点及其组合生存估计值的数据集中查找满足定义 t+ t 的条件的记录。

例如,图 3 说明了在临时数据集中_q2,使用surv_quar_comb 宏定位第 10 个百分位数的 +找到的记录。在这种情况下,黄色区域包含时间点 680684 692:满足上述关联条件的记录。这些值和相关值在 SAS 代码片段 3 中用于计算标准误差。变量 t_minus 包含时间点的滞后值(timelist 变量),指标变量 done1=1 标记首次满足qp条件的记录(我们从中开始使用 qp=timelist =t_minus)。下一条记录满足 + 的条件,由 done2=1 标记。在遍历数据集以验证这些条件后,可以根据变量 done1 done2 提取所需的记录和值 - 使用从 0 变为 1 的记录。

COMBINING CHI-SQUARE–DISTRIBUTED STATISTICS AFTER MULTIPLE IMPUTATION

经过多次插补后,可以在 PROC LIFETEST 中组合所有可用测试的测试结果:对数秩、修正的 Peto-PetoPeto-PetoWilcoxon Tarone-Ware SAS Institute Inc.2008)。这些测试中的每一个都基于卡方分布统计量,该统计量可以使用 Wilson-Hilferty 变换进行归一化(Wilson 等人,1931 年)。如果卡方分布是具有 d 个自由度,则

当使用带有 TEST 选项的STRATA 语句时,可以在 PROC LIFETEST 生成的 ODS 输出数据集 HomTests 中找到测试统计量及其相应的自由度。从每个插补数据集获得的这些检验统计量可以使用上述公式进行标准化,并且可以为 PROC MIANALYZE 输入标准化值,以获得这些基于卡方的检验的组合结果,如SAS 代码片段 4.

3 显示了与多个检验结果相关的 p 值,包括多重插补后的组合案例和原始观测数据集。MI 结果稍微保守一些,但在此示例中基本相似,这在基于 CAR 的多重插补模型下是可以预期的。

COMBINING RESULTS OF COX REGRESSION

PROC PHREG 中实施的Cox 回归通常用于估计风险比,例如,比较治疗组之间的事件危害。来自 PROC PHREG Cox 回归模型参数估计值表示对数风险比。它们是正态分布的,不需要任何进一步的转换即可使用 PROC MIANALYZE Rubin 规则相结合。但是,需要对最终结果进行取幂运算,以获得风险比和关联的置信区间的数值。SAS 代码片段 5 说明了在最后一个DATA 步骤中使用 PROC PHREG 对插数据进行Cox 回归分析、结果组合以及组合对数风险比的幂运算

Table 4 包含从观察到和乘以插补数据中获得的 Cox 回归风险比估计值和关联的置信区间。正如本例中使用的基于 CAR 的多重插补模型所预期的那样,风险比和置信区间宽度非常相似。

Sas code

宏有助于在“不可忽略”删失假设下进行插补,其中因“不可忽略”原因过早停药的受试者与留在研究/接受治疗的类似受试者相比,从停药时间开始具有更高/更低的事件风险。这由敏感性参数 delta0 delta1 量化(分别用于对照组和治疗组),它们表示停药后任何给定时间点t的受试者特异性风险与同一受试者在同一时间的风险的比率,如果他或她继续研究或因其他(可忽略)原因停止。或者,可以使用宏参数 deltav 指定敏感性参数的受试者特异性值,例如,当关于停药后危险的假设可能因停药原因而异时。宏还可用于实施 “Copy Reference” CR) 插补策略,其中插补模型是从特定的处理组(例如,对照处理组)估计的。使用分段指数生存插补模型实现 MI 的宏也可用于使用以其他方式定义的参考组实现基于参考的插补,例如,作为一组具有retrieved缺失数据的受试者。

在应用Marco时请参考下面Road map


参考文献:

[1] Lipkovich I, Ratitch B, O’Kelly M (2016) Sensitivity to censored-at-random assumption in the analysis of time-to-event endpoints. Pharmaceutical Statistics 15(3):216-229

[2] Moscovici JL, Ratitch B (2017) Combining Survival Analysis Results after Multiple Imputation of Censored Event Times. PharmaSUG-2017 (available on-line https://www.pharmasug.org/proceedings/2017/SP/PharmaSUG-2017-SP05.pdf)

流行病学与卫生统计学
Pivot数据交流平台,每周分享临床试验研究设计、实施、统计等相关信息。
 最新文章