————医械铁锅炖————
人工智能医疗器械注册审查基本原则
基于算法特性
01
人工智能技术
人工智能技术从发展驱动要素角度是基于模型/数据和算力的算法,其中:
模型/数据是人工智能技术的基础,
算力是人工智能技术的保证,
算法是人工智能技术的核心。
由于算力所用计算资源本身不属于监管对象,计算资源的监管要求取决于其所属的计算平台类型。
02
安全有效性评价
故从监管角度出发,人工智能医疗器械安全有效性评价基于其预期用途、使用场景、核心功能,
——以算法特性为核心重点关注其泛化能力,
——以模型/数据为基础重点关注其质控情况,
——从风险管理角度兼顾算力不足与失效的影响。
03
组合形式整体评价
人工智能算法的类型不同,其算法特性、适用场景也不同,评价重点亦有所侧重;同时,不同类型的人工智能算法可组合使用,需结合各算法特性和算法组合形式进行整体评价。
因此,注册申请人需结合人工智能医疗器械的预期用途、使用场景、核心功能选择与之相适宜的人工智能算法或算法组合,基于算法特性并结合风险管理开展相应验证与确认工作。
以深度学习为例,其是指通过训练具有多个隐层的神经网络而获得输入输出映射关系的人工智能算法,亦是基于海量数据和高算力的黑盒算法,既可用于有监督学习又可用于无监督学习。因此,对于采用深度学习技术的人工智能医疗器械,基于其预期用途、使用场景、核心功能,重点关注其算法泛化能力、数据质控、可解释性等问题,同时,深度学习若与其他类型的人工智能算法组合使用,还需基于各算法特性重点关注算法组合的整体评价问题。
基于风险导向
人工智能医疗器械的风险水平亦可用软件安全性级别进行表述,软件安全性级别越高,其生存周期质控要求越严格,注册申报资料越详尽,同时由于全新类型的潜在未知风险多于成熟类型,故需结合成熟度予以综合考虑,具体要求详见医疗器械软件指导原则。
基于预期用途、使用场景、核心功能判定
人工智能医疗器械的软件安全性级别可基于产品的预期用途、使用场景、核心功能进行综合判定,其中:
——预期用途主要考虑用途类型、重要程度、紧迫程度等因素,
——使用场景主要考虑使用场合、疾病特征、适用人群、目标用户等因素,
——核心功能主要考虑功能类型、核心算法、输入输出、接口等因素。
通过风险管理等级判定
亦可根据风险管理所确定的风险等级进行判定,软件安全性级别与风险等级的分级可以不同,但二者存在对应关系,因此可根据风险等级来判定软件安全性级别,但应在采取风险控制措施之前进行判定。
人工智能医疗器械的主要风险
从算法角度包括过拟合和欠拟合,其中:
—— 过拟合是指算法对于训练数据过度学习而将非普遍规律作为重要特征,
—— 欠拟合是算法对于训练数据学习不充分而遗漏重要特征,均会降低算法泛化能力。
从用途角度,辅助决策主要包括假阴性和假阳性,其中:
——假阴性即漏诊,可能导致后续诊疗活动延误,特别是要考虑快速进展疾病的诊疗活动延误风险,
—— 假阳性即误诊,可能导致后续不必要的诊疗活动;非辅助决策从算法设计目标能否得以实现角度,亦可参考辅助决策分为假阴性和假阳性。
进口人工智能医疗器械
进口人工智能医疗器械还需考虑中外差异风险,如人种、流行病学特征、临床诊疗规范等差异。
注册申请人应结合人工智能医疗器械的预期用途、使用场景、核心功能开展风险管理活动,采取风险控制措施将风险降至可接受水平,并贯穿于人工智能医疗器械全生命周期过程。
全生命周期质控
注册申请人应结合质量管理体系要求,参考软件、人工智能相关标准和良好工程实践,建立人工智能医疗器械生存周期过程,开展与软件安全性级别相匹配的产品质量保证工作,将风险管理、可追溯分析贯穿于生存周期全程,形成记录以供体系核查。
上市前开展充分、适宜、有效的验证与确认活动,保证算法泛化能力满足用户需求,识别可预见风险并将其降至可接受水平,明确产品使用限制(含技术限制,下同)和必要警示提示信息。
上市后持续开展算法泛化能力研究,同时结合用户投诉、不良事件和召回等情况识别前期未预见的风险,并采取有效的风险控制措施将风险降至可接受水平。
此外,根据产品更新需求,经评估后实施更新活动,开展与之相适宜的验证与确认活动,保证算法泛化能力持续满足用户需求。
【End】
作者 | 医械小囡