多重填补的学习途径介绍

2024-10-26 07:30   上海  

书籍


首先读 little and rubin 的缺失值的统计分析,了解一下多重填补发展的历史,了解现在运用的三部法 MI 和 MIANLYSIS 和 POOLING,熟悉各种缺失机制。然后读 stef van buuren 的 FCS 法和 R 中 MICE 和统计量非正态转化的应用,最后读 Carpenter and Keward 的多重填补,主要是分类变量中准分离状态的处理和实际应用。也可以了解 Dempster 的 期望值最大化方法(expectation and maximization,EM)。EM算法是一种在不完全数据情况下对极大似然估计或者后验分布的迭代算法。先求数据集的期望,通过期望最大化化解似然函数,避免了边缘值的影响。EM法填补缺失值适用于大样本,即有效样本的数量足够以保证极大似然估计值是渐近无偏的并服从正态分布的情况下。little and rubin 的第八章对于各种 EM 的变形,ECM/ECME/AECM/PX-EM 也有详细介绍,E 和 M 部类似于多重填补的 I 和 P 部。


MI 在运用联合分布和链式方程和单调序列回归和 EM 法的异同点,在联合分布中如何填补分类变量,seed 和 burn in 和迭代次数和 thin 和先验的设置。填补范围如何设置。


分析的步骤,如果 MNAR 分布,基于对照和基于 delta 的填补在 MI 步是实现不了的。各种不同数据类型用不同模型,自变量如何选取,小样本如何校正自由度,是否拟合和方差协方差的设置,随机效应随和考量,对于多层是否考虑嵌套,是重复测量资料还是最后时间点的主要终点分析。对于定性指标,元数据是直接的收集还是需要定量的转化。从哪些指标看 MI 的次数是否合理。


对于 Time to event,在不同伴发事件处理策略上如何填补,如何区分非随机删失,对于整个曲线,单个点生存率的多重填补有啥不同。


尤其注意伴发事件选择在治策略时,会用复发事件的 model。 


在竞争风险存在的情况下运用累积风险模型估计兴趣事件的累积发生率(Cumulative Incidences Function,CIF),Aalen-Johansen(A-J)方法(Aalen&Johansen,1978)提供了CIF的非参数估计量。


累积发生率函数 CIF 方差估计的公式,是根据Aalen (1978a)的公式计算的。


CIF对应曲线为Nelson-Aalen累积风险曲线,差异性检验主要对应Gray’s检验,多因素分析时用 SD 部分分布(Sub Distribution)比较风险回归模型和 CS 原因别(Cause-Specific)风险回归模型分别探讨各协变量对兴趣事件累积发生率的影响。


此外,还有获胜比率分析和WCE 加权复合终点分析,possion 和 负二项(gamma possion) 回归。  Anderson Gill and PWP (prentice and william s and perterson)and shared frailty model 。Lin wei yang ying model,Multi state modeljoint frailty model。


存在竞争风险时候,关心结局发生率CIF < KM。竞争事件率>10%,推荐CIF、SD模型直接反应出绝对率的改变;竞争事件率<10%,最佳策略是把SD当做sensitivity analysis与经典cox同时展示结果的稳定可靠。  CS、SD也都需要ph假设,不满足ph需要分层 Cox等其他方法。


获胜比率分析和WCE 加权复合终点分析的优点在于,它们通过为复合终点的各组成部分分配权重,考虑了事件的严重性。这些权重应预先指定,因为它们对治疗效果估计有很大影响。possion 和 负二项(gamma possion) 回归和Andersen-Gill分析则考虑了每位患者的所有事件,而不仅仅是首次事件,并且通常比首次事件时间分析具有更大的统计效力。预先指定的创新统计方法可能有助于我们更好地理解当各组成部分在严重性和时间上有显著差异时的新疗法。这些方法考虑了特定类型的患者、药物、器械、事件以及随访时间的因素。


合并的步骤,考虑 bootstrap 和 jackknife 的 SE 没有 MI 合并好的原因,对于非正态分布的统计量合并之前需要转换。对于单组率极端率的填补,如何处理置信区间。


tipping point 和基于 delta 的异同点。基于对照填补各个方法的异同点。


定性资料 tipping point 的不同多重填补方法的选择。


基于 delta 填补方法的各种变体。


PMM 在 MNAR 中如何应用,和选择模型和共享参数的异同点。


不同的策略对应的目的不同,疗法策略看的是effectiveness,而假想策略想得到的是efficacy。FDA推荐疗法策略,因为很多创新药是以安慰剂为对照来显示优效性。而我国非劣效或者等效性试验很多,这样的前提下疗法策略是不合适的,因为伴发事件越多,试验质量越差,越容易等效,所以要结合我国国情。疗法策略适合优效性研究,而对非劣效性和等效性研究,推荐假想策略。非劣和等效和优效,不同伴发事件处理策略不同,不同的填补方法的敏感度不同。


国际多中心试验如何考虑不同监管机构的对于不同处理策略的选择,IND 和二期阶段后和三期前需要提前沟通。


创新性试验和适应性设计,case by case。


Online学习资源


http://www.missingdata.org.uk 


不同伴发事件的处理策略的统计方法。 


基于似然的方法,加权的 GEE 到双重稳健,MI。


SAP text 的撰写模版需仔细阅读。


GSK five Marco 的试用场景。


各种 Marco 的 roadmap 请细读。


DIA 蓝皮书


E9R1 框架下的不同治疗领域的模板撰写。先模仿,再小改,最后写自己的风格。

流行病学与卫生统计学
Pivot数据交流平台,每周分享临床试验研究设计、实施、统计等相关信息。
 最新文章