刘博:发生频率,描述性统计最重要的工具

文摘   2024-10-26 08:00   广东  

Hello,大家好,又到了周末统计课的时间了。

当临床试验结束,进入统计分析阶段之后,第一步,就是要对你所收集到的临床数据进行良好的概述,这个时候,就需要使用描述性统计这个工具了,关于这一点,我在上周的文章《刘博:描述性统计,快速评估临床数据是否可靠的方法》当中进行了讨论。

而在进行描述性统计的时候,需要让信息容易被别人获得,以及,理解,这个时候,就需要使用发生频率(Frequency of Occurrence)了,这也是我们今天的话题。

一般来说,发生频率有三种不同的类型,绝对频率(Absolute Frequency)相对频率(Relative Frequency)累积频率(Cumulative Frequency)

绝对频率,就是指一个数值出现的次数,或者,你记录下来的次数,需要用整数来进行表示。

我们可以把绝对频率用来显示序数,或者区间数据,而且,通常可以用直方图来进行图形化展示。

我给你举个例子,假设我们现在有10位患者,对于现在开发的这款药物呢,都具备耐受性。

在这种情况下,我们设计了四个类别,非常好、好、一般和差,然后,统计表现出不同耐受性类别的患者数量,然后再用直方图进行展示,就像下面这样,


在这张图当中,每一条,代表了前面定义的类别,而每一条的高度,代表了在该类别当中,具有耐受性的患者数量。

要注意啊,在统计绝对频率的时候,就只能使用离散数据(Discrete Data),也就是像人数、车辆数、产品数量,这样具有明显间隔的数据,而不能是像长度、重量、时间、温度这样无限可分,无限多值的连续数据(Continuous Data)。

下一个,就是相对频率。

相对频率,也被称为经验频率,它是将绝对频率除以临床试验当中所包含的受试者总数得出的,所以,有的时候也被称为百分比、比例、比率、或者分数。

正因为如此,如果我们将所有分类的相对频率加在一起,它们的结果一定是100%。

和绝对频率相比,相对频率包含的信息量要大很多,应为它将绝对频率和所观察样本的大小联系在了一起。

我也给你举个例子。

比如,如果你正在进行一个只包括25名患者的临床试验,但在其中就观察到了20起不良事件,那这是一个很严重的问题。

但如果你在进行一个包括25,000名患者的临床试验,其中观察到了250起不良事件,从绝对频率的角度来看,这个临床结果可比上一个试验糟糕多了,但如果从相对频率的角度来看,不良事件的发生率只有1%,所以,这可能是一个非常好的临床结果。

所以,和绝对频率相比,相对频率带来了一个全新的视角

最后一个,就是累积频率。

累积频率是指等于或小于考虑值的绝对或相对频率之和,因此,累积频率可以帮助你找到临界点的绝对或相对总数。

结合前面的耐受性例子,我给你进一步的阐述这个问题。

在“非常好”这个类别当中,我们有四名患者,而在“好”这个类别当中,我们有三名患者,因此,在本次临床试验当中,至少有七名患者的耐受性到达了良好的水平。

看,这就是绝对累积频率


而相对累积频率,就是用绝对累积频率除以患者总数,有或者,可以把相关类别的相对频率加起来,从而达到该阈值,在上面这个例子当中,它就是70%(7/10=70%),我们就可以说,找到对该研究产品耐受性至少为良好的人的概率,是70%

好了,关于发生频率的问题,我已经给你讲完了,你看,频率是可以以一种非常容易让人理解的方式,向我们提供很多有价值的信息。

关注我,降低产品上市认知门槛。

*个人观点,仅供参考。




品牌推广 培训合作 | 商业咨询 | 资料商店 | 转载开白

请在公众号后台回复  合作 

诊断科学
诊断科学,产品和合规咨询顾问,打造了《IVD上市课》等系列课程,曾为多家国内外诊断公司提供战略咨询服务,提倡“从概念到市场”的理念,为诊断厂家提供产品和合规规划的参考方向,一起更早看到未来。使命:降低产品上市认知门槛。
 最新文章