两样本比例差异的非劣效性检验的条件功效和样本量重估的实例模拟

2024-04-12 15:53 上海

在序贯设计中，对新出现的数据进行一次或多次期中分析，以评估是否应继续实验。这样做可能是为了节省资源，或者允许数据监测委员会在长时间内对交错方式进入受试者时评估安全性和有效性。条件功效（一个频率概念）是给定在临时观察之前获得的数据，最终结果将是显着的概率。预测功效（贝叶斯概念）是将条件功效平均于效应大小后验分布的结果。这两种方法都属于随机缩减技术。关于这些方法的理论可以在Jennison和Turnbull（2000），Chow和Chang（2007），Chang（2008），Proschan et.al（2006）和Dmitrienko et.al（2005）中找到。

此文章介绍计算使用双样本 z 检验来检验两个比例之间的非劣效性时的情况的条件和预测功效。它还提供指定的条件功效值前提下，样本量的重新估计。

实验的功效表明的是在给定样本量的情况下，研究是否有可能产生有用的结果。低功效意味着该研究是无效的：即使替代假设是正确的，也几乎没有统计学意义的机会。无效的研究不应开始。然而，只有在研究开始后才能确定无效。当这种情况发生时，研究就会停止。

正在进行的研究的无效可以通过计算其条件功效来确定：根据迄今为止获得的数据，计算研究完成时具有统计显着性的概率。

需要注意的是，在收集任何数据之前，研究开始时的条件功效等于无条件功效。因此，即使早期结果是负面的，条件功效也会很高。因此，条件功效很少会在研究的早期导致研究停止。

从 Jennison 和Turnbull （2000）第 205 页到 208 页，给定观察到的检验统计量 Zk，在研究结束时拒绝关于参数 θ 的零假设的阶段 k的上单侧条件功效计算为

阶段 k 的下单侧条件功率计算为

其中

θ = 假设检验的参数

k = 计算条件功效的期中阶段（k = 1， ...， K – 1）

K = 研究终止的阶段，并计算出最终检验

Zk = 根据收集到阶段 k 的观测数据计算出的检验统计量

Ik = 阶段 k 的信息水平

IK = 结束时的信息水平研究

Z1−α= I 类错误率为 α 的检验的标准正态值。

设 P1 和 P2 分别为组 1 和组 2 中的人群比例。如果我们定义 δ= P2 − P1，使得 δ0 =P2.0 − P1 是非劣效性差界值，δ1 = P2.1 − P1 是备择假设下的真实总体差，δ^hatk = p2k− p1k 是与阶段 k 观测数据的估计比例差，则参数 θ 检验 H1 的单侧非劣效性备择假设：H1:δ >δ0（比例越高越好）或 H1：δ<δ0（比例越高越差）和 Chang （2008）第 70 页和第 71 页中概述的其他条件功率计算部分是

计算条件功效需要设置 P1、P2.0 或 δ0 和 P2.1 或 δ1。它们的值可以来自研究计划期间使用的值、类似研究或根据出现的数据做出的估计。

无效指数为 1 − Pk（θ）|H1。如果该指数高于 0.8 或 0.9（即，如果条件功率低于 0.2 或 0.1），则研究可能会停止。

预测功效（贝叶斯概念）是将条件功效平均于效应大小后验分布的结果。从 Jennison 和 Turnbull （2000）第210 页到 213 页，阶段 k 的上单侧预测功效由下式给出

阶段 k 的低单侧预测功效由下式给出

所有项都定义为条件功效方程中。

正如Chang（2014）所指出的，在中期分析之后，通常希望使用各种干扰参数（如方差）的更新值来重新计算目标样本量。此过程称为样本数量重新估计。

计算调整后的样本数量估计值的一种方法是搜索导致条件功效预定值的样本数量。PASS以条件功效为标准进行二进制搜索。结果称为目标样本数量。

条件功效实例：

假设已经计划了一项研究，并且将使用单侧非劣效性 z 检验对 δ0 = -0.05 进行分析，而 alpha 为 0.025。参照组比例（P1）为0.6，因此 δ0 = -0.05 对应于 P2.0 = P1 + δ0 = 0.6 + （-0.05） =0.55的非劣效性比例。目标样本量为每组 60 人。

计划在收集一半数据后进行中期分析。数据监察委员会希望计算 δ1 = 0 和 z 值 1、1.5、2、2.5、3 和 3.5的条件功效。

第一步：参数录入

第二部：结果输出

下图显示了条件功效与Zk之间的关系。

我们将手动验证示例 1 的第三种情况（Zk = 2）的计算。

样本量重估实例：

假设一项研究已经开始，并且将使用单侧非劣效性 z 检验对 δ0 = -0.05 进行分析，α 为0.025。参照组比例（P1）为 0.6，因此 δ0 = -0.05 的对应于 P2.0 = P1 + δ0 = 0.6 + （-0.05） =0.55 的非劣效性比例。最初的目标样本量为每组 60 人。

在收集到一半的数据后进行中期分析。该分析得出的 z 检验值为 2.12.

发现 P1 的值（参考组的比例）为0.643。

数据监测委员会希望重新估计样本数量，以实际差值 δ1 = 0 （P2.1 = P1 + δ1 = 0.6 + 0.6）和条件功效为 0.8。

第一步：参数录入

第二部：结果输出

请注意，目标样本数量已从每组 60 个（N = 120）增加到每组 1162 个（N = 2324）。

Take home message：

1.以下两句话很重要，不明白可以重新看一下文中的公式：

Conditional Power The probability of rejecting a false null hypothesis at the end of the study given the data that have emerged so far.

Predictive Power The result of averaging the conditional power over the posterior distribution of the effect size.

2.自己做项目的时候，除了用不同软件验证外，公式法手动验证是最推荐的方式。

3.参考文献都是PASS公司提供的，通过help-more help topics-reference-search“author”，可以找到文章全名，然后去SCI-Hub和必应搜索，大部分文章都可以查到。

4.定量和time to event的条件功效计算和定性类似，无非是noise的来源，定量是直给，定性来自于率本身，time to event来自于入组和随访时间或者事件发生率。

参考文献:

Jennison, C., and Turnbull, B.W. 2000. Group Sequential Methods with Applications to Clinical Trials. Chapman &Hall/CRC. New York.

Proschan, M., Lan, K.K.G., Wittes, J.T. 2006. Statistical Monitoring of Clinical Trials. Springer. New York.

Chang, Mark. 2008. Classical and Adaptive Clinical Trial Designs. John Wiley & Sons. Hoboken, New Jersey.

Chang, Mark. 2014. Adaptive Design Theory and Implementation Using SAS and R. CRC Press. New York.

Dmitrienko,A., Molenberghs,G., Churang-Stein, C., Offen, W. 2005. Analysis of Clinical Trials Using SAS: A Practical Guide. SAS Institute Inc. Cary, NC.

Chow, S.C. and Chang, M. 2007. Adaptive Design Methods in Clinical Trials. Chapman & Hall/CRC. Boca Raton, Florida.

http://mp.weixin.qq.com/s?__biz=MzU3NzY1MzgxOQ==&mid=2247490834&idx=1&sn=7cbb578cc3832d749f4e0654ab52a653

流行病学与卫生统计学

Pivot数据交流平台，每周分享临床试验研究设计、实施、统计等相关信息。

最新文章

基于风险和基于暴露的调整后安全发生率

揭开发病率的神秘面纱：面向新手程序员的不良事件分析分步指南

使用 NCI - 不良事件通用术语标准（CTCAE）对实验室毒性进行分级

肿瘤试验中的相对剂量强度的计算

多重填补的学习途径介绍

选择模型和共享参数模型

重复测量资料的Sas code和SAP撰写

MMRM-PMM的delta法实现

MAR下多重填补的 Sas code和SAP撰写

分类数据多重填补后的结果合并的非正态考量点

内卷时代！Nature重磅，新技术掀起临床医学新篇章，助力发顶刊！

Time to event的多重填补

Delta 为基础的多重填补的 Sas code 和 SAP撰写

对照组为基础的多重填补的 Sas code和SAP撰写

模式混合模型（PMM)的Sas code和SAP撰写

Tipping point的Sas code和SAP撰写

Predicted interval plots在East中的实例模拟解读

盲和非盲Enrolment and event prediction 的模拟解读

Subject level的Enrolment and event prediction的模拟解读

Muller and Schafer method在East中的模拟解读

Extension CDL method在East中的模拟解读

CHW and CDL method在East中的模拟解读

数据分布模拟在PASS的应用

Multi-Arm Multi-stage trials的East软件模拟解读

两组率中可能你不知道的事

Multiple comparisions procedures的East软件模拟解读

考虑竞争风险Logrank tests的样本量估计

两组率优效无效分析的实例模拟

什么是Miettinen & Nurminen Likelihood Score Test

Statistical team lead（STL）的日常工作

统计角度解读抗真菌药物Cresemba的统计审评报告

统计角度解读梗阻性肥厚型心肌病创新药mavacamten（玛伐凯泰）

IVD定量检测产品相关系数的样本量估计

低优指标率差的统计学检验

两样本比例差异的非劣效性检验的条件功效和样本量重估的实例模拟

JHU教授统计学专题科研项目招生啦 | 发论文，拿推荐信的机会来啦

浅谈统计师应如何自学

Efficacy Monitoring with Time-to-event Endpoint

Backfilling BOIN (BF-BOIN) Guideline

期中分析和最终分析以外的统计support

布朗大学生物学终身教授科研项目招生啦 | 发论文，拿推荐信的机会来啦

两组均数检验理论基础和样本量估计的PASS实现

重温Mixed model和Repeated measure的理论基础

建立剂量反应关系时如何估计样本量?

假设方差相等的方差对比的单因素分析和协方差分析

Williams Test样本量的PASS实现

分层Wilcoxon-Mann-Whitney检验样本量的PASS实现

比例趋势的 Cochran-Armitage 检验和PASS样本量计算

统计角度解读抗真菌药物研发

统计角度解读礼来偏头痛新药

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉