刘博:在设计样本入排标准的时候,需要考虑哪些统计问题?

文摘   2024-11-23 08:00   广东  

Hello,大家好,又到了周末统计课的时间了。

在设计临床试验的时候,最重要的部分之一,就设定入排标准,在这个过程当中,还需要确定的一点,就是要确定不同特征的样本,在整个临床组别当中的比例,这是为了实现在这个临床组别当中,样本特征的平衡

举个简单的例子,假设我们现在要做一个居家自测类产品,那么,阳性样本组的总例数为100例,考虑到不同年龄在操作上面的问题,那么我就需要入组儿童33例、成年人34例、老人33例,这样,才能保证我的阳性组有足够的代表性。

这种做法,在统计学上就被成为分层抽样(stratification)

要注意一点,分层抽样,实际上并不根据疾病或者治疗的特性来划分亚组,而是选择那些认为有可能会对结果造成的影响的特性。

通过在样本组当中包括这些可能会对结果产生影响的“层”,就可以在临床试验当中验证它们是否会真的造成影响,而且,这样也会让临床试验的结果更加趋近于真实世界的情况

用来分层的特征可以是年龄、种族、社会背景、医疗历史,或者其他人口统计因素,还可以是研究地点,是的,在IVD临床实验当中,为什么要分三个不同的研究地点,也是处于分层抽样的考虑。

每个层代表着患者人群中的一个特定的部分,有的时候,我们也把它成为混杂原始变量(Confounding Raw Variables)

对于分层抽样来说,最困难的一点,我们需要先了解到底哪些特征需要分层

就像前面年龄的例子一样,因为是一个居家自测类产品,所以年龄这个“层”才是会对实验结果进行影响的。

比如,你的产品做了一些专门针对老年用户的设计,而对比试剂没有这么做,在样本入组的时候,我们没有考虑年龄的分层问题,那么一般情况下,入组人群当中,成年人是占大多数的,如果我们用这个样本组去进行评估,那么,你的产品和对比试剂的检测性能是一样的。

这样的评估,一方面完全忽视了你在产品设计和开发上面的努力,另外一方面,也和现实世界大为不同,对于居家自测产品来说,老年用户是一个庞大的数量。

但也要注意,层不是分的越细越好,太多的层,会导致后勤问题——需要找的特殊样本越多,实施就越困难;以及统计问题,如果一个层里面只有一两例样本,它也没法做探索性研究了。

那么,分层的优点是什么呢?

它可以允许你实现考虑已知会影响结果的变量问题,让你的临床结果更具有说服力,如果层的数量不太多,而每个层中样本数量又呈均匀分布的状态,这个时候就能更好的反应产品在临床当中的整体情况。

很多人就是因为没有考虑纳入一些分层的样本,比如,某个类似疾病样本,从而导致了临床发补。

当然,分层抽样也是有缺点的,比如,你的层数太多了,每个层的数量过少,这样随机带来的影响就会增大很多,而且,也会增加很多分析上的难度,毕竟引入的参数越多,分析的复杂性就越高。

那么,层和亚组之间有什么区别呢?

就像我在前面谈到的那样,层是被用来考虑样本当中不同的特征。我们认为这些特征是会对临床结果产生影响的,所以,需要在入排标准当中做好安排,让这些特征设计的样本量经可能平衡。

而亚组,则是为了评估两种方法之间检测结果的差异,是不是由于这些特征的不同水平产生的,因此,对于亚组分析来说,是可以在不考虑任何层的情况下进行的,不过通常也建议可以在亚组分析中考虑层的问题。

比如,如果我们的产品可以同时用于血清和血浆样本当中,那么,在临床实验当中,就需要做一个亚组分析,也就是对200例同源血清和200例同源血浆分别用我们的产品进行检测,比较两者之间结果。

因为地点这个特征对血液样本的影响还是蛮大的,所以我们就选择在两个地点开展临床实验,每个地点做100例,这就是在亚组分析当中,做进一步的分层。

关注我,降低产品上市认知门槛。

*个人观点,仅供参考。



品牌推广 培训合作 | 商业咨询 | 资料商店 | 转载开白

请在公众号后台回复  合作 

诊断科学
诊断科学,产品和合规咨询顾问,打造了《IVD上市课》等系列课程,曾为多家国内外诊断公司提供战略咨询服务,提倡“从概念到市场”的理念,为诊断厂家提供产品和合规规划的参考方向,一起更早看到未来。使命:降低产品上市认知门槛。
 最新文章