【版权声明】正文来源中国医疗器械杂志 2022年46卷第5期,供医疗器械从业者们学习、借鉴。如需转载,请与原创作者或中国医疗器械杂志联系,谢谢合作。医疗器械从业者(MDP)转载/合作/引用须知
【医疗器械从业者原创观点】(如需转载,请注明来源)
计数抽样检验是医疗器械质量控制的常用手段之一,在生产和监管过程中得到了广泛应用。GB/T2828系列标准给出了不同类型的计数抽样检验程序。本文对如何平衡准确性和经济性给出了建议,对于医疗器械生产企业和监管部门的使用具有指导作用。
抽样检验的实质是质量控制中准确性和经济性之间相互妥协的选择。对于定性判定的质量特性,只能采用计数抽样检验的方法;而对于定量判定的质量特性,既可以使用计量抽样检验,也可以使用计数抽样检验。
任何时候都必须保持学习能力。通过学习可以提高自己的技能,适应产业的变迁,抵御时代的冲击。通过学习还可以提高认知能力和分辨能力,在经济不景气的年代少踩雷,少踩坑,不被不良思潮蛊惑,规避风险,就是胜利。
以下为转载文章:原标题
计数抽样检验程序及其在医疗器械领域的应用
作者:张博12,万敏12,张翔12,熊巍12,李文丽12,陈聪12
单位:1山东省医疗器械和药品包装检验研究院,济南市,250101
2国家药品监督管理局医用卫生材料及生物防护器械质量评价重点实验室,济南市,250101
内容提要:计数抽样检验是医疗器械质量控制的常用手段之一,在生产和监管过程中得到了广泛应用。GB/T2828系列标准给出了不同类型的计数抽样检验程序。介绍了GB/T2828系列标准,以及在不同情景下计数抽样检验方案的设计与检索。同时,还对如何平衡准确性和经济性给出了建议,对于医疗器械生产企业和监管部门的使用具有指导作用。
关 键 词:抽样检验;监督抽验;接收质量限;极限质量;声称质量水平
1.引言
2.计数抽样检验概述
医疗器械风险管理是指根据医疗器械自身的特性和预期用途,识别所有相关危害、危害处境造成的医疗器械不良事件,对每种风险进行评价。当风险被评价为不可接受的情况时,制定措施降低或控制风险;完成控制后要继续重复评价危害或损害的剩余风险,不断重复进行这种评价以及必要的控制,直至所有风险可接受为止。2017年5月新修订的《医疗器械监督管理条例》强化了2014年版条理内容,【小编注:现为2021版】强调了风险管理在医疗器械全程监管中的极端重要性。
计数抽样检验程序,是在两类错误(“错判”和“漏判”)发生概率一定的条件下,设计的一种特殊假设检验。目前,最常用的就是GB/T2828系列标准,已经发布了7部分标准,现行有效的版本分别是:①GB/T2828.1-2012《计数抽样检验程序第1部分:按接收质量限(AQL)检索的逐批检验抽样划》;②GB/T2828.2-2008《计数抽样检验程序第2部分:按极限质量(LQ)检索的孤立批检验抽样方案》;③GB/T2828.3-2008《计数抽样检验程序第3部分:跳批抽样程序》;④GB/T 2828.4-2008《计数抽样检验程序第4部分:声称质量水平的评定程序》;⑤GB/T 2828.5-2011《计数抽样检验程序第5部分:按接收质量限(AQL)检索的批序贯抽样检验系统》;⑥GB/T2828.10-2010《计数抽样检验程序第10部分:GB/T2828计数抽样检验系列标准导则》;⑦GB/T2828.11-2008《计数抽样检验程序第11部分:小总体声称质量水平的评定程序》。
这7个标准可以归纳为3个部分:①GB/T2828.10-2010是整个系列标准的导则,介绍标准不同部分的制订目的和应用范围的差异;②GB/T 2828.1-2012、GB/T 2828.2-2008、GB/T2828.3-2008和GB/T2828.5-2011适用于验收抽样检验,也就是为生产方和使用方提供了判断交付产品是否满足质量协议的抽样规则;③GB/T2828.4-2008和GB/T 2828.5-2011给出了验证被检验总体是否满足声称质量水平的抽样规则。
2.以验收为目的的计数抽样检验
2.1 接收质量限和极限质量
接收质量限(acceptance quality limit,AQL)是生产方和使用方协商确定的批不合格(品)率p的最大值,当批产品的实际不合格(品)率小于p,时,应以高概率接收此批产品。而极限质量(limit quality,LQ)是生产方和使用方都认为不可接收的批不合格(品)率p的最小值,当批产品的实际不合格率大于p时,应以低概率接收此批产品。
GB/T 2828.1是按照AQL检索的抽样计划主要针对已经足够应用转移规则的连续系列批若用于孤立批时需要特别注意抽样方案的检索;而GB/T 2828.2是按照LQ检索的抽样方案,针对的是孤立序列批或者单批。具体来说,如果采购方已经和生产方合作了一定时间,对于生产方的质量水平有了一定的信心和了解,这时候可以制订一个抽样计划,只要达到规定的接收质量限(AQL),该批次产品就被接收,而该抽样计划使第一类错误(错判)发生的概率较小。如果采购方只采购了该生产方的一批样品,或者第一次采购该生产方的产品,那么就要制订另外的抽样方案,只要产品未达到规定的极限质量,则该批次产品就被拒收,该抽样计划使发生第二类错误(漏判)的概率较小。图1表示了分别按照AQL和LQ检索对于产品总体质量水平的意义。
案例1:某制造商生产了一批避孕套,批量为30000只。采购方和制造商约定“爆破体积和压力”指标不合格率不能超过1.5%,也就是总不合格品数不超过450个。
为了说明按照AQL和LQ对连续批和鼓励批检索抽样方案不同,使用案例1模拟了以验收为目的的检验场景。如果这批次产品是双方连续供货批次中的一批,那么可以按照AQL=1.5检索抽样计划,也就是将“不合格率不能超过1.5%”的约定理解为:只要不合格率低于1.5%就应该被接收。参考GB/T7544-2019(等同采用ISO4074:2002)附录A选择检验水平为“一般检验水平工”,从而得到一次抽样方案:样本量字码为K(125只),合格判定数为5,不合格判定数为6。也就是抽取125个样品,如果出现5个或5个以下的不合格品就接收该批次产品,如果出现6个或6个以上就拒收该批产品。图2给出了样本量字码K的抽检特性(operating characteristic,OC)曲线,表示提交产品的质量按照不同的AQL值进行检验,预期被接收的概率有多大。从图2中可以看出,上述抽样方案可以保证如果该批次产品中的实际不合格率不超过1.5%,就有95%以上的概率被接收。
但是通过抽检特性曲线可知,如果这批次产品中不合格率达到了3%,即超过了约定一倍,仍有80%以上的概率被接收;如果不合格率达到了4.5%,即超过了约定的两倍,仍有50%的概率接收这批产品。虽然这样的抽样方案放大了使用方或接收方的风险,而保障了生产方或提供方的利益,但是在连续批中如果每批次都不能达到规定的质量限,那么被拒收的可能性就会随批次的增多而不断累积。一旦出现被拒收的批次,就要根据GB/T 2828.1中规定的转移规则进行加严检验,直至暂停检验(接收),从而降低“漏判”的风险。这就是GB/T2828.1主要适用于足以应用转移原则的连续批检验的原因。
如果这批次避孕套产品是孤立批,或者是供需双方合作的最开始的几批产品(连续批的批数序列长度尚无法应用转移规则),那么采用上述抽样方案显然是不适合的。我们先看一下在GB/T7544-2019(等同采用ISO4074:2015)《天然彩胶橡胶避孕套技术要求与试验方法》附录B中的规定:对于孤立生产批的合格判定虽然仍然按照AQL索引,但是规定了样本量至少按字码M。案例1如果样本量按照字码M(315只)抽样检验,那么当该批产品的实际不合格率为1.5%、3.0%和4.5%时,根据字码M的OC曲线(见图3),该批次产品被拒收的概率就会增大到85%,大大地降低了犯第二类错误(漏判)的可能。
如果这批产品是孤立批产品,而使用方想要尽可能地将风险降低,就可以依据GB/T 2828.2中的LQ检索抽样方案,步骤如下:首先选择LQ值,由于1.5为非LQ优先数值,因此根据GB/T2828.2中表8选取优先数值为1.25。然后再查表1,可得抽样方案样本量n=315,接收数Ac=1也就是抽取315只样品,如果不合格品数超过1个,则拒收该批次产品。这样的检验方案可以保证使用方采购到不合格率高于或等于1.25%的风险降到9.4%以下。但是需要指出的是,如此抽样会使生产方承担过大的风险,因为当该批次产品不合格率为1.25%时,接收概率也仅有10%,而如果想要将接收概率增加至95%以上,则生产方需要将产品的不合格率控制在0.114%以下。
在样本量固定的情况下,生产方风险降低必然带来使用方风险的增加。如果采用双方风险折中的方案,可以根据GB/T2828.2-2008中4.3的建议,将LQ规定为“最小3倍于所期望的,也就是1.5x3=4.5,根据标准中表8选取最接近4.5的LQ优先数值为5.0。查GB/T 2828.2-2008表1,可得抽样方案n=315、接收数Ac=10.而根据GB/T 7544-2019(等同采用ISO4074:2015)中附录B的规定,按照AQL检索GB/T2828.1,得到的抽样方案同样也是n=315、接收数4c-10。这种巧合说明,在对孤立批进行抽检的时候,GB/T 7544-2019(等同采用ISO 4074:2002)已经充分考虑了使用方风险,从而制订了较为均衡的抽样方案。
2.2 多次抽样检验和序贯抽样检验
在当前生产过程中,特别是在医疗器械这种高风险领域,期望不合格品率往往非常低。在这种情况下,如果采用一次抽样方案,通常需要非常大的样本量才能将错判概率降到比较低的水平。而多次抽样检验和序贯抽样检验就可以有效降低平均样本量,而不提高错判的风险。
这两种抽样检验的方式可以这样理解:如果抽取较小样本量时得到的质量水平远高于或远低于接收质量限,那么就可以有较大的把握直接接收或拒收该批次产品;如果质量水平接近于接收质量限,再抽取更多的样品进行检验。
而多次抽样检验和序贯抽样检验的区别就在于:多次抽样是把整个抽样过程分成若干个阶段,每个阶段进行判定;而序贯抽样是每抽一个样品就是一个阶段并进行判定。从这个意义上来讲,多次抽样检验类似一个离散的过程,而序贯抽样检验更类似一个连续的过程。
在案例1中,如果供需双方依然按照AQL=1.5检索抽样程序,那么先看二次抽样程序。同样是查到字码K,按照正常检验水平检索GB/T2828.1-2012中表3-A二次抽样方案,得到第一次检验方案为80[2,5]、第二次检验方案为80【6,7】。图4给出了二次抽样的操作流程。
从图4中我们可以看到,第一次抽检的样本中不合格数不超过2个或大于等于5个,就仅需要一次抽样80个。但如果第一次抽样检出的不合格数或不合格品数为3个或4个,则需要再次抽取80个样品进行检验,这样共抽取了160个,高于一次抽样的样本量125个。
同理,我们还可以进行多次抽样来进一步降低平均样本量。按照正常检验水平检索GBT 2828.1-2012中附表4-A,同样是样本量字码为K,多次抽样方案及累计样本量如表1所示。从表1中可以看出,最少需要32个样品就可以拒收该批样品,最少需要64个样品就可以接收该批样品,只有较小的概率累计样本量会超过一次抽样或二次抽样。
在一定情况下,序贯抽样检验在经济性方面相较于二次、多次抽样更有优势。对于质量很好或很差的批,二次抽样方案比一次抽样方案平均节省37%的成本,五次抽样方案平均节省75%的成本,而序贯抽样方案平均节省85%的成本。但是序贯抽样要求多次抽样,如果不同时间抽取样品的成本较高,那么序贯抽样方案的经济性就会被降低。因此,序贯抽样方案主要适用于单个样本测试费用较高的情况。
对于案例1,如果按照序贯检验制订抽样方案,根据GB/T 2828.5-2011中表1查的样本量字码同样是K,再查表A.1,得:
3.声称质量水平的评定
3.1 声称质量水平评定的风险特征
从标准题目上看,GB/T2828系列标准的第1、2、3、5部分都是“检验(inspection)而第4、11部分是“评定(assessment)”’,这恰恰说明了这两部分应用情景的不同。
GB/T 2828系列标准的第1、2、3、5部分都是以验收为目的的抽样程序,而第4、11部分评审、审核中验证声称质量水平(declaredqualitylevels,DQL)而开发的。从出现“错判”的风险来看,GB/T 2828系列标准的第1、3、5部分都是按接收质量水平(AQL)检索的,仅与验收抽样的实际目的有关,因而出现两类“错判”的风险的均衡;而第2部分按照极限质量水平(LQ)制订抽样方案,目的是防止接收个别劣质批,因此出现“错判”的风险较大;而第4、11部分为评定产品的实际质量水平是否符合声称质量水平而设计,适用于类似监督抽验的场景,因此充分考虑出现“错判”带来的严重后果,从而大幅降低了“错判”的风险,但付出的代价是“漏判”的风险增大。
由于第4、11部分的风险不平衡,因此在表述抽检结果时也应该有所体现。当按照声称质量水平检索的抽样方案结果不合格时,有很大的把握认为“核查总体的实际质量水平劣于该声称质量水平”,而当结果为合格时,“未发现核查总体的实际质量水平劣于该声称质量水平”是合适的结果表述方式。
3.2 声称质量水平评定的应用情景
GB/T 2828.4-2008的发布实施代替了GB/T14437-1997《计数一次监督抽样检验程序及抽样表》和GB/T 14162-1994《计数监督抽样检验程序及抽样表》,而GB/T 2828.11-2008代替了GB/T15482-1995《产品质量监督小总体计数一次抽样检验程序及抽样表》。可以看出监督抽检是这两部分标准的重要适用情景之一。但这种对于目标总体声称质量水平的评定并不仅限于监督抽查,同样适用于使用方、生产方的相关部门或者其他第三方对于总体质量的核查。
3.3声称质量水平的选取
在确定声称质量水平时,公认的技术文件(如国家标准、行业标准、企业标准或相关行政文件)中给出的验收检验接收质量水平(AQL)是重要的参考依据,通常选取的声称质量水平(DQL)不应低于接收质量水平(AQL)。在医疗器械质量抽检中,除了上述文件外,还应参考被批准的产品内控标准的规定。
对于医疗器械这种对人类的生命健康具有重要影响的产品,在制订监督抽检方案时,通常不能允许一些关键项目出现不合格,因此需要选取DQL=0来制订检验方案。按照GB/T2828.4-2008的规定,合格判定数为0,样本量n根据实际情况需要从1~N中选取(N为这批产品的总量)。鉴于此,在国家药品监督管理局历年公布的抽检方案中常用的检验方案为样本量n=3或5,合格判定数为0。
3.4 极限质量比水平的选取
虽然按照声称质量水平来评定产品的质量时,主要考虑有针对性地减小“错判”的风险,但在制订检验方案的时候,仍然需要考虑“漏判”的风险。GB/T 2828.4-2008给出了“极限质量比(limiting quality ratio,LQR)水平”这参数来控制“漏判”风险,它是指将错误判定核查总体抽检合格的风险限定为某一较小值时的质量比的值,在GB/T 2828.4-2008中规定这种风险为10%。标准中对LQR规定了4个水平等级,分别是O、I、Ⅱ、Ⅲ。
3.5 应用声称质量检索检验方案
案例2:某制造商生产了批避孕套,批量为30000只,企业声称产品质量符合GB/T7544一2019的规定。
为了说明如何按照声称质量水平(DQL)检索抽样方案,案例2模拟了以核查为目的的检验场景。如果监管部门对该批次产品的“爆破体积和压力”性能进行抽检,该项性能指标可参照GB/T 7544-2019中规定的AQL为1.5作为声称质量水平DQL。按照LQR水平分别选取O、I、Ⅱ、Ⅲ时,从GB/T 2828.4-2009中检索的抽样方案如表2所示,其中n表示样本量,L表示不合格品限定数(也就是合格判定数)。同样检索GB/T 2828.4-2009的表2到表5,可以得到LQR值和对应的不合格品率,数据如表2所示。从表中可以看出,不同LOR水平下的“错判”概率均可以保证在5%以下,但即便选择LQR水平为最高等级的Ⅲ级,对于高出实际不合格品率高出DQL 5.44倍的批次产品,“漏判”的可能性仍有10%。因此,如果按照DQL检索的方案检验,出现不合格时可以有较大的把握判定该批次产品实际质量水平达不到DQL;而如果抽检合格,也仅能证明未发现该批次实际质量水平劣于DQL。
4.总结
邀请您加入MDP知识星球能干什么?
………
【强烈推荐】卫老师ISO 14971医疗器械风险管理体系系列课上线了
【强烈推荐】《医疗器械生产质量管理规范的理解和应用》在线系列直播课
【学习】定制式义齿医疗器械规范检查要点及常见问题分享(建议收藏)
【学习】定制式义齿医疗器械规范检查要点及常见问题分享下篇(建议收藏)
【学习】时间的朋友(2023-2024)跨年演讲:眼前一亮!
【学习】NMPA新法规体系下医疗器械产品注册和变更注册立卷审查要求解析
【学习】浅析体外诊断试剂(IVD)成品检验及留样检验的若干要求
【视频精华版】设计开发功能实现方法之一公理设计的八大规则
【视频精华版】国产医疗器械还有机会吗?
医疗器械从业者Medical Device Practitioner
“专注、专业、分享、成长":专注医疗器械行业领域,学习、分享专业资讯、知识、技能,促进医疗器械从业者自我成长与提升。欢迎医疗器械行业的研发、注册、法规、体系、品质、工艺、生产、采购、HR等医疗器械从业者关注。
*善*行*善*念 **合*作*共*赢*