一、背景介绍
这款设备作为一款医疗软件,运用了梯度增强决策树算法。通过机器学习技术筛选出关键的行为特征,将精确预测各种表型特征下的孤独症谱系障碍。
其底层机器学习算法的研发,建立在数千份儿童病历数据的基础上,这些儿童具有不同的健康状况、表现及共患病,并经过标准化诊断工具验证,涵盖了支持年龄范围内的男女性别。经过多轮迭代改进、专家意见补充及长达7年的前瞻性验证,该算法得以不断优化。
这款设备的多模块输入设计,与当前孤独症评估指南和建议保持一致,既包含了家长和临床医生的意见,也涵盖了对孩子的结构化观察。早期算法迭代分析的结果显示,这种多输入结合的方式能够显著提升算法的性能。
该设备历年来的研究情况发表
二、软件运行流程
a. 儿童的照顾者用手机填一份5分钟的问卷;
b. 照顾者上传两段孩子在家的短视频,每段视频的时长为1分30秒-5分钟。这些视频由专业的视频分析师进行分析;
c. 主治医生填写一份10分钟的临床问卷;
d. 这些输入(问卷答案、视频和临床问题答案)会被传输给专业分析师,分析师在大约11分钟内提取视频的特征;
e. 照顾者、主治医生和视频分析师的输入被组合成一个数学向量,用于机器学习分析和分类;
f. 设备最后会提供“孤独症阳性”、“孤独症阴性”或“无法确定”的输出。无法确定的输出意味着提供的信息不够详细,无法在当时做出判断。
软件运行流程图
三、输出结果
(一)受试者纳入情况
本次多中心、双盲、前瞻性、主动对照队列研究进行于2019年8月至2020年6月,共有711名参与者入组,最终有425人顺利完成了整个研究过程。
受试者入组情况
成功完成研究的孩子的平均年龄为3.33岁(标准差为1.15岁)。软件显示为ASD阳性的孩子,平均年龄为2.81岁(比目前的平均诊断年龄早 1.5 岁)。
(二)输出结果
这款设备为31.8%(135/425)的参与者提供了确定的输出结果(孤独症阳性或阴性)。换句话说,大约每三名受试者中就有一名可以从设备中获得确定的结果。
在由临床专家诊断为孤独症的参与者中,有52.5%(64/122)获得了确定的结果,且除了一个假阴性之外,所有结果都被设备正确分类。
对于临床专家诊断为ASD阴性和典型神经发育的参与者,有35.0%(14/40)获得了设备给出的孤独症阴性结果,且没有被误分类为孤独症阳性。
本次试验的准确性参数为
阳性预测值(PPV):80.8%;
阴性预测值(NPV):98.3%;
敏感度(sensitivity):98.4%;
特异性(specificity):78.9%;
(PPV:当设备判断一个人为孤独症阳性时,这个人实际上是孤独症阳性的可能性。NPV:当设备判断一个人为孤独症阴性时,这个人实际上是孤独症阴性的可能性。敏感度:实际为ASD阳性的参与者中,被设备正确判断为ASD阳性的比例。特异性:实际为ASD阴性的参与者中,被设备正确判断为ASD阳性的准确率。)
(三)协变量分析
研究者发现参与者的性别、种族、民族、收入或教育水平对软件性能没有影响。但是与3岁及以上的参与者相比,该设备对3岁以下的参与者有更高的确定率(阳性或阴性确定情况);而该设备对3岁及以上的参与者有更高的特异性(不易将非患者误诊为患者)。
协变量分析结果
四、小结
相较于目前专业环境中使用的评估工具,该设备显著缩短了评估时间,降低了专业培训需求。此外,它还能捕捉视频数据,为医疗人员提供儿童在诊所外自然行为的丰富洞察。
在这项研究样本中,近三分之一的儿童通过这款设备与临床判断相结合,得到了高效且高度准确的诊断评估。这一发现意义重大,因为目前在美国,仅有约1%的孤独症患儿能在初级护理中得到诊断。
该设备还有潜力降低一部分儿童的平均诊断年龄和诊断时间。例如,设备给出孤独症阳性结果的完成者的平均年龄为2.81岁,比目前的平均诊断年龄早了1.5年。同时,与使用现有评估工具相比,使用该设备所需的时间也大大减少,这使得它在时间紧迫的初级护理环境中更具实用性。
此外,当专业医疗人员通过远程方式进行问卷评估时,并没有发现设备性能下降。这一研究发现说明了该设备有潜力减少某些偏远地区人群在诊断方面的滞后问题。
为了减少假阴性的可能性,作为一种风险控制措施,该设备内置了一个牺牲覆盖率的非确定性输出。如果去掉非确定性输出,本研究中观察到的敏感性和特异性下降。但是该设备的目标并不是能够对所有孤独症表现进行诊断,而是帮助初级保健医疗专业人员进行诊断,从而可能减少将所有儿童转诊至三级中心进行评估的需求。即使只减少三分之一的转诊量,也能显著缩短开始干预的等待时间。
总体而言,这款设备不仅为医疗专业人员提供了一种高效、便捷的诊断孤独症的工具,而且其移动性和远程医疗功能也使其在特殊情况下具有广泛应用前景。它的设计不仅提升了诊断的准确性和效率,还减少了对专业人员的依赖,为孤独症的早期发现和干预提供了新的可能性,有望为更多家庭带来福音。