刘博:什么是定性变量?定量变量呢?它们之间能转化么?

文摘   2024-11-02 08:01   广东  

Hello,大家好,又到了周末统计课的时间了。

在对临床数据做完描述性统计之后,就需要开始对数据进行推断性统计分析了,在这个时候,你必须要知道你的数据,是什么样子的?

这个时候你就会说了,数据我还没见过,不就是1/2/3/4嘛?

其实不然,在临床试验当中,数据的类型是多种多样的,所以,你需要先把区分数据,确认它是定量的,还是定性的,以及每个变量的量度级别类型——它是名义变量、序数变量、又或者度量变量。

这就是今天我打算和你谈论的问题。

在对临床数据进行处理的时候,你经常会遇到这样一个问题,“我在处理哪种变量,定量还是定性?”

定量变量是由可测量,或者说可计算的特征组成,比如生存时间、血细胞数量、血压、年龄或者家中孩子的数量等等。

而与之相反,定性变量都是以文本的形式呈现,不可测量,比如血型、性别、患者对治疗的满意度、疾病状态、或者生存状态等等。

定量变量都是属于度量变量,当然,在这里我们要特别注意,因为度量数据又可以分为两种——离散变量和连续变量。

离散变量就是那种只取整数的变量,比如,患者的数量,阳性结果的个数等等。而连续变量是哪种可以无限细分,取任意值的变量,比如身高体重、定量试剂的检测结果等等。

对于度量变量来说,它都存在一个范围,而且可以按照大小进行排序,因此,两个变量之间是可以通过计算来进行解释的。

定性变量则不同,一般来说,定性变量又可以分为名义变量序数变量

名义变量就是那种没有不能进行排序的类别数据,比如血型,当然,由于他们不能排序,也没有办法解释两个类别之间到底差多少。

另一方面,序数变量就是指出现的类别是可以排序,像测量强度、符合率或者满意度等等,都可以按照从强到弱的的顺序进行排列,类别之间的距离是可以解释的,但有可能是无法进行比较的,在很多时候,可以把这种变更成为半定量

总结一下,名义变量,就是只确定变量的某种状态,而序数变量,则可以进行排序。


当然,这些知识不仅仅在临床当中使用,对于IVD产品来说,在产品开发的过程中也能发挥很大的价值。

首先,你需要认识到这样一点,随着变量包含信息的不同,是可以从高量表级别转换为低量表级别,比如,我们可以把连续变量,转化为名义变量

我在这里用胶体金产品做个例子,大家都知道,我们通过判断胶体金颜色的深浅,来判断被测量的含量,以及阴阳性结果。

颜色的深浅,往往采用L1-L10这样十个颜色梯度来进行计算,你看,这就是序数变量。

但胶体金试剂只有序数变量么?当然不是,颜色的深浅变化,实际上是一个连续变量,在胶体金判读仪当中,就是将颜色的深浅转化为一个连续变量,然后,和临界值进行比较。

这主要是因为对于肉眼来说,判读精度没有设备那么高,无法读出连续变量,所以只能将其设置为颜色梯度这样的序数变量。

当然,我们还可以进一步的压缩变量信息,比如,将颜色梯度,转化为阴阳性结果,这就是一个名义变量

你看,定量变量和定性变量是可以很清楚的区分开来,而且,你可以根据你所需要呈现的信息,调整该变量的量表级别。

关注我,降低产品上市认知门槛。

*个人观点,仅供参考。




品牌推广 培训合作 | 商业咨询 | 资料商店 | 转载开白

请在公众号后台回复  合作 

诊断科学
诊断科学,产品和合规咨询顾问,打造了《IVD上市课》等系列课程,曾为多家国内外诊断公司提供战略咨询服务,提倡“从概念到市场”的理念,为诊断厂家提供产品和合规规划的参考方向,一起更早看到未来。使命:降低产品上市认知门槛。
 最新文章