揭开发病率的神秘面纱:面向新手程序员的不良事件分析分步指南

2024-11-16 07:24   上海  

本文深入探讨了临床试验领域内不良事件 (AE) 报告的复杂性,重点介绍了治疗中出现的 AE 发生率计算的三种不同方法:发病率 (IR)、按人年调整的事件发生率 (EIR) 和暴露调整后的发病率 (EAIR)。虽然发病率 (IR) 和事件发生率 (EIR) 传统上在临床试验评估中受到青睐,但这项研究是由 FDA 最近在提交补充生物制品许可申请 (sBLA) 期间提出的信息请求推动的,倡导采用暴露调整后的发病率 (EAIR) 来总结 AE 数据。本文旨在通过描述它们的定义、比较它们的细微差别和对比它们的应用来提供对每种方法的全面理解。此外,本文阐明分析数据模型 (ADaM) 数据集的结构并提供使用模拟数据的相应 SAS® 代码,为研究人员解决 AE 报告的复杂性提供了实用的见解。通过这种探索,本文旨在提高理解力,指导方法选择,并为不断发展的临床试验数据分析和监管合规性做出贡献。     

 

发病率是评估特定人群或接受干预(包括研究产品)的个体不良事件频率的关键指标。美国食品药品监督管理局 (FDA) 作为关键的监管机构,非常重视对发病率的细致报告。这种强调源于 FDA 在评估药物安全性方面的核心作用,超越了程序要求,无缝整合到一个整体框架中。该框架涵盖安全评估、风险收益分析、标签注意事项、风险沟通和监管决策。在这种情况下,发病率的精确计算不仅成为程序上的必要性,而且是影响数据质量和随后监管决定的首要因素,这些因素深刻地影响了药物审批和患者安全。本文全面探讨了三种不同的发病率计算方法——发病率 (IR)、按人年调整的事件发生率 (EIR) 和暴露调整后的发病率 (EAIR),阐明了它们对临床试验中有效安全报告的影响。        

 

这些测量在理解、监测和解决临床试验中疾病和健康事件的发生方面发挥着至关重要的作用,原因如下:            

 

疾病发生的衡量标准:       

 

发病率量化了在指定时期内特定人群中特定疾病或健康事件的新病例的发生率。这项措施对于了解社区疾病负担至关重要。      

 

临床试验中的风险评估:     

 

在临床研究中,发生率用于评估干预措施的安全性和有效性。它们提供有关治疗组内不良事件频率或特定结果发生率的信息。       

 

暴露调整:       

 

暴露调整后的发病率考虑了暴露于风险因素、治疗或病症的持续时间的变化。此调整对于提供更准确的真实风险估计非常重要。      

 

健康风险的传达:        

 

发病率提供了一种清晰且可量化的方式,将健康风险传达给公众、医疗保健专业人员和政策制定者。这有助于做出明智的决策和进行风险沟通。      

本文包含一个依赖于模拟数据的案例研究。研究中的所有实例都基于相同的数据假设,假设 ADSL 和 ADAE 等 ADaM 数据集可用,这些数据集预计将准备并存储在名为“ADAM”的 SAS库中。            

 

本文特别关注安全性分析集中的治疗中出现的不良事件。其他与不良事件相关的总结,例如关于特别关注的不良事件的总结,可以采用类似的方法。在本合成数据案例研究中,治疗中出现的不良事件定义为发病日期发生在研究药物第一次给药当天或之后以及研究药物最后一次给药后 30 天内的不良事件。虽然治疗中出现的不良事件的定义可能因研究而异,但这是我们分析中应用的标准。现在,让我们逐步深入研究各个概念:

INCIDENCE RATE (%)

CONCEPT AND FORMULA

发病率 (IR),有时也称为粗略百分比,是总结安全数据的广泛使用的指标。IR 的计算方法是将经历特定事件的受试者数量除以暴露于该药物的受试者总数,而不管随访持续时间如何(Piacentino 等人,2024 年)。它适用于均匀的治疗持续时间、短期暴露或给药后紧紧发生的急性事件。然而,对于不同的暴露持续时间或长期随访,IR 是不够的,因为它忽略了对药物使用持续时间的考虑(He et al, 2015)。IR 计算的数学公式自然源于其定义:

SAS EXAMPLE

我们可以使用安全人群标志 (SAFFL) 和治疗种出现的不良事件标志 (TRTEMFL) 作为关键过滤器来提取目标分析记录。NODUPKEY 选项在按实际治疗组 (TRT01AN) 和系统器官类别 (AEBODSYS) 分类的每个首选术语 (AEDECOD) 下的每个唯一受试者的计数中起着关键作用。在过滤相关记录之后,我们使用 PROC FREQ 来获取受试者计数,提供的代码成功完成了这项任务:    

为了确定计算发病率的分母,这涉及计算 ADSL 数据集的安全性分析集中每个治疗组中的受试者总数,我们再次使用 PROC FREQ。下面提供了相关的代码片段:

在获取分子和分母的计数后,将合并数据集。然后使用规定的公式计算发病率。为了增强数据布局的清晰度和组织性,采用了 PROC TRANSPOSE 步骤:

         

 

EVENT INCIDENCE RATE ADJUSTDED BY PATIENT-YEARS

CONCEPT AND FORMULA

按人年(EIR)调整的事件发生率代表了特定不良事件在定义的时间范围内发生的频率,相对于参与者暴露于潜在风险的持续时间(Scosyrev & Pethe)。它是通过将事件总数除以累积人年来计算的,其中 patient-years 反映个人提供数据的持续时间。人年是一个有价值的指标,因为它们考虑了不同组的不同随访持续时间,从而确保更准确地评估风险(Andrade,2019 年)。当预期整个研究过程中会反复出现不良事件时,EIR 特别有洞察力。在这种情况下,与仅依赖 Incidence Rate(发病率)相比,EIR提供了更全面的不良事件概况。           

 

为了计算 EIR,我们首先定义患者年(暴露时间)。对于受试者级别的人年计算,可以使用以下公式:

然后,要得出按人年调整的事件发生率,请遵循以下公式:

在这里,总人年数只是每个受试者的 patient-years 之和。         

 

SAS EXAMPLE

由于受试者水平的人年只需要研究药物的最后一次给药日期 (TRTEDT) 和研究药物的首次给药日期 (TRTSDT),因此可以计算并存储在 ADSL 数据集中。以下代码说明了如何执行此操作:

在上面的代码中,TRTDURY 是新创建的 patient year 变量。对于正在进行的受试者,一个实用的建议是暂时考虑使用最新的数据快照日期,该日期可以存储在全局宏变量(如 & SNAPDT)中,作为他们的研究结束日期,用于编程目的。        

 

    

要计算按人年调整的事件发生率 (EIR) 的分子,首先过滤掉与安全人群 (SAFFL) 中的受试者相关的治疗中发生不良事件 (TRTEMFL)。接下来,根据系统器官类别 (AEBODSYS) 和首选术语 (AEDECOD) 对 ADAE 数据集进行排序。然后,利用 PROC FREQ 统计每个治疗组 (TRT01AN) 中的事件计数。提供的代码用作指定任务的说明性示例:

要得到分母,只需使用以下代码对之前在 ADSL 中创建的受试者级别人年数求和:

现在,事件数和总人年数都已计算出来,我们将合并两个数据集 PY 和 EVENT,并使用上面的公式使用以下代码获得 EIR:

PROC TRANSPOSE 也可用于更好地展示结果数据    

EXPOSURE-ADJUSTED INCIDENCE RATE

CONCEPT AND FORMULA

为了考虑药物暴露持续时间的潜在变化,应考虑暴露调整后的发生率 (EAIR)。它是通过将经历事件的受试者数量除以所有处于风险中的受试者的总暴露时间来计算的。对于没有事件的个体,暴露时间是从第一次药物摄入到最后一次随访,而对于至少发生一次事件的个体,是从第一次药物暴露到事件。EAIR 表示假设事件风险恒定,每单位暴露或随访时间的平均事件数。它适用于在风险率恒定的假设下估计发生率。但是,如果事件延迟或事件风险随时间变化,EAIR 可能不是一个合适的衡量标准(He et al, 2015)。EAIR 的公式为:

与之前在 EIR 计算中使用的受试者级别人年相比,人年(暴露时间)现在根据正在考虑的特定首选术语进行调整。每个受试者的人年是根据他们第一次不良事件的日期(如果有)或他们的研究日期结束计算的。从本质上讲,每个受试者的人年的确定取决于受试者是否经历过与指定首选术语相关的不良事件。      

 

对于至少有一个感兴趣的不良事件的受试者,公式为:

         

 

    

对于那些没有的人,公式是:

与 EIR 计算类似,然后通过将所有受试者的人年相加来确定总人年。       

 

SAS EXAMPLE

为了解决首选术语的可变性,一种策略涉及生成占位符数据集 DUMMY。在此数据集中,来自 ADAE 的系统器官类别 (AEBODSYS) 和首选术语 (AEDECOD) 的每个独特组合都是根据治疗中不良事件 (TRTEMFL) 和源自安全性分析集 (SAFFL) 内受试者的标准选择的。然后将这种独特的组合分配给安全人群中的每个受试者,类似于笛卡尔连接,无论他们是否经历过特定的不良事件。以下代码演示了如何有效地执行此任务:

对于经历不良事件的受试者,在计算患者年时只会考虑发生的第一个事件。因此,我们可以使用下面的代码过滤掉每个唯一首选术语下每个受试者的第一个事件:

为了确保 ADAE (ASTDT) 中事件开始日期的非 null 值,我们假设如果未提供完整的日期,则至少事件开始的年份可用于原始数据中的所有不良事件。然后,之前创建的 FIRST_AE 数据集将与 DUMMY 数据集合并,并与 ADSL 合并。进行此合并是为了计算每个唯一首选术语下每个受试者的人年。方法如下:如果受试者经历了特定首选术语的不良事件,则不会丢失 ASTDT,并且该记录的患者年将使用 ASTDT 和 TRTSDT 计算。相反,如果受试者没有经历不良事件,则 ASTDT 将缺失,人年将使用 EOSDT 和 TRTSDT 计算。同样,对于尚未确定最后一次给药日期的持续受试者,我们可以使用最新的数据快照日期作为他们最后一次研究日期的临时替代:    

为了获得暴露调整后发病率 (EAIR) 的分子,我们将使用 PROC FREQ 来计算按治疗组分类的每个首选术语内的发生次数。使用从上一步获得的 ADAE 数据集时,确保仅将具有非缺失 ASTDT 的记录输入到 PROC FREQ 中,因为这些记录代表实际的不良事件发生。ADAE 中的其他记录只是占位符。代码如下:

为了确定 EAIR 的分母,需要按治疗组、系统器官类别 (SOC) 和首选术语 (PT) 汇总 ADAE 数据集中计算的人年。以下代码完成此任务:

以下代码合并了两个数据集,并使用本节开头介绍的公式获取暴露调整后的发病率 (EAIR),您可以添加一个额外的步骤来转置数据集以获得更有序的布局。    

CONCLUSION

      

 

共同点:    

 

    

EAIR 和 EIR 都强调了根据研究人群中个体之间的暴露或随访时间差异调整发病率的重要性。  

 

在临床研究中的应用:      

 

这些调整后的比率在临床试验中特别相关,在这些临床试验中,参与者接受治疗或干预的时间长短可能不同。        

 

比较分析:      

 

调整后的比率,如 EAIR 或 EIR,有助于在不同治疗组或人群之间进行公平比较,尤其是当暴露持续时间不同时。当预测在整个研究过程中多次发生某些事件时,可能更合适。EAIR 在预测事件风险的变化或潜在延迟时特别有价值。      

 

风险评估的精确性:        

 

调整后的率通过考虑每个人处于风险中的时间,可以更准确地估计与特定事件相关的真实风险。        

 

总之,虽然发病率提供了事件发生的基本衡量标准,但 EAIR 或 EIR 等暴露调整率通过考虑研究人群中个体之间暴露持续时间的变化来增强这一指标。值得注意的是,EAIR 将时间直接纳入费率计算,提供了一种细致入微的方法。当将此视角应用于表 4 中首选术语 Fatigue 的数字时,与治疗组 1 相比,治疗组 2 表现出更高的发病率。然而,在考虑事件发生的时间后,治疗组 2 的 EAIR 实际上较低。因此,尽管发病率可能表明第 2 组的风险更高,但 EAIR 显示第 1 组实际上面临更大的风险。这些调整对于更精确地表示数据至关重要,在临床和流行病学研究中获得准确和有意义的风险评估方面发挥着至关重要的作用。          

 

与EIR相比,虽然FDA 没有强制要求 EAIR ,但鉴于 FDA 对 EAIR 的趋势,在研究提交中仅显示 EIR 或两者可能是必需的。EAIR 和 EIR 之间的选择也可能取决于特定的研究终点和申办方的偏好。    

 

Take home message:       

 

1.实际研究中,很难做到研究人群的稳定。如研究对象进入队列的时间前后不一;研究期间各种原因的失访,使得每个研究对象观察时间不同。此时用观察人时作为分母计算发病率更为合理。人时常用的单位是人年(person year),因此发病密度有时也被称为人年发病率。对于发病率较低样本量很大的研究,二项分布近似Poisson分布。发病密度的置信区间计算,分为精确法和近似法。     

 

2.发病密度的置信区间计算,精确法需要用quantile函数或者CINV函数,近似法需要用quantile函数。    

 

3.每项研究仅是研究总体中的一次抽样,存在一定的抽样误差。在报告发病率时,建议报告发病率的置信区间;每个置信区间的计算方法没有优劣之分。可根据实际研究情况,如研究稳定性、时间长短、样本大小、事件发生率等情况,选择适合的置信区间计算方法。也可考虑进行数据模拟,评估置信区间的覆盖率(coverage probability)和区间期望宽度(expected width of the interval)。      

 

4.罹患率、累积发病率的计算公式与发病率相同,因此发病率置信区间的计算方法同样也适用于罹患率和累积发病率的置信区间计算。而且发病率置信区间计算本质也是率的置信区间计算,因此发病率置信区间的计算方法同样也适用于其他率的置信区间计算,如临床试验中不良事件发生率等。置信区间计算主要分为精确法Clopper-Pearson方法和近似法Wald方法。  

 

5.单组的率CI,尤其注意样本量等于0的情况,需要weight zeros调整实现。


REFERENCES

Andrade C. Need for and Practical Interpretations of the Person-Year Construct in Neuropsychiatric Research. Indian J Psychol Med. 2019 Nov 11;41(6):600-601. doi: 10.4103/IJPSYM.IJPSYM_389_19. 

 

He, X., Chen, L., Lei, L., Xia, H. A., & Lee, M. L. T. 2015. “A Simple Method for Estimating Confidence Intervals for Exposure Adjusted Incidence Rate and Its Applications to Clinical Trials.” J Biom Biostat, 6:238. doi:10.4172/2155-6180.1000238.    

 

Piacentino, D., Ogirala, A., Lew, R. et al. A Novel Method for Deriving Adverse Event Prevalence in Randomized Controlled Trials: Potential for Improved Understanding of Benefit-Risk Ratio and Application to Drug Labels. Adv Ther 41, 152–169 (2024). doi:10.1007/s12325-023-02695-8.   

 

Scosyrev E, Pethe A. Confidence intervals for exposure-adjusted rate differences in randomized trials.Pharm Stat. 2022 Jan;21(1):103-121. doi:10.1002/pst.2155.       

流行病学与卫生统计学
Pivot数据交流平台,每周分享临床试验研究设计、实施、统计等相关信息。
 最新文章