对线性研究数据进行初步检查的目的,是为了排除离群值

文摘   2024-10-14 08:00   广东  

对于线性研究实验来说,对实验结果进行分析,是非常重要的一个环节,而在进行这一步之前,我们需要先对结果进行评估,确定实验结果是否可靠,可接受,然后才能进行数据分析的环节。
绘制图表

对于任何数据来说,先采用目视方法进行检测,都是一个正确的选择。

所以,做为数据初步检查的一部分,你需要先把我们在实验当中获得的数据绘制在坐标轴上,其中,Y轴,也就是纵轴,是实验中测得的结果;X轴,也就是Y轴,是线性参考品的相对浓度(RC)。

通过对图形的目测检查,你就可以比较容易的发现每个线性参考品的重复是否是可接受的,是否存在不精密的情况,以及,是否存在离群值
举例说明

光讲理论是很难理解的,下面我就用研究设计A1的方案来给你做个说明。

现在假设我们打算评估一套测量程序(试剂+设备+校准品)的线性范围,该测量程序是用于检测男性尿液中的生物标志物ABC,这是在这个例子当中虚构的生物标志物。而该测量程序的待评估线性范围为10 ~ 300 ng/mL,临床上可接受的ADL是±10%。

在研究当中,所使用的高值样品是样品1,它也被称为“起始样品”。高值样品的平均浓度水平是高于300 ng/mL,也就是说,它高于测量程序的线性范围上限(ULLI),具体的数值可以见表1。

由于生物标志物ABC在女性尿液当中不存在——这也是一个假设——所以,在研究当中,选择女性尿液做为空白样品,也就是浓度为0的样品。

接下来,我们就要按照比例混合方案,将高值样品和低值样品按不同的比例混合在一起,总共制备11个线性参考品,在这里我们用Si来表示。

想要了解什么是比例混合方案的同学,可以阅读我这篇文章《三个方案,制备靠谱的线性参考品》。

这11个线性参考品的浓度水平,在10 ~ 300 ng/mL这个区间内均匀分布,这其也包括接近医学决定水平的浓度。而其中最低浓度的参考品是S11,它的平均浓度低于10 ng/mL,也就是低于测量程序的线性参考范围下限(LLLI),具体的数值可以见表1。

每个线性参考品都重复5次,在这里,我还要强调一点,在本次线性研究当中,空白样品是不进行测量的,测试的最低浓度参考品是S11,整个检测结果请见表1。

表1 | 生物标志物ABC数据表
缩略语:RC,相对浓度;Rep,重复。

发现离群值

其实离群值在不同的性能研究当中,含义会不太一样,通常来讲,离群值是指不符合其他数据所代表的模式的结果。

但是,在线性研究当中,“离群值”是指对同一线性参考品进行多次检测,而和其他检测结果明显不同的单次检测结果。

而对于离群值评估来说,最简单的方式就是结合测量程序本身的准确度性能,对散点图中进行目视检查,如果存在离群值的话,往往就很容易被发现。

所以,你可以做两种散点图来进行离群值检测。

让我们回归到上面所举得例子,可以按照文章开头所描述的方案,将每个参考品的五次检测结果和RC做散点图,具体情况可以看下面这张图:

图1 | 生物标志物ABC的五个重复与RCs的散点图
缩略语:RC,相对浓度;Rep,重复。

又或者,你可以对每个线性参考品分别做作散点图,那就能够得到下面这样一张图,

图2 | 生物标志物ABC的每个线性参考品的单独散点图

在这个例子当中,每个线性参考品的重复结果都是合格的,不存在离群值,所以都可以包括在线性研究的计算中。

实际上,造成离群值的误差因素有很多,比如文字输入错误,系统出现故障导致出现离群值等等,但这些事情都是偶发事件,所以才能被称为离群值,在这种情况下,你直接把离群值剔除就可以了,不用去深究造成离群值的原因。

但要注意,剔除离群值的记录必须要做好,特别是关于删除离群值的解释部分,而且,这些记录最好长期保留(至少三年以上),

这样,如果你发现,“唉,这个情况又重复出现了,它好像不是偶发事件啊?”

在这种情况下,你才能有据可查,能够去探寻出现这个问题的真正原因。

关注我,降低产品上市认知门槛。

*个人观点,仅供参考。






品牌推广 培训合作 | 商业咨询 | 资料商店 | 转载开白

请在公众号后台回复  合作 

诊断科学
诊断科学,产品和合规咨询顾问,打造了《IVD上市课》等系列课程,曾为多家国内外诊断公司提供战略咨询服务,提倡“从概念到市场”的理念,为诊断厂家提供产品和合规规划的参考方向,一起更早看到未来。使命:降低产品上市认知门槛。
 最新文章