科研创新
眼动结合机器学习算法
早期诊断阿尔茨海默病
近日,重庆医科大学附属第一医院老年病科吕洋教授团队,在Cognitive Computation杂志上发表题为《Diagnostic Potential of Eye Movements in Alzheimer’s Disease via a Multiclass Machine Learning Model》的研究成果,研究提出了一种新颖的方法,旨在构建一个基于眼动参数的非侵入性、低成本的分类模型,用以区分由阿尔茨海默病引起的痴呆(ADD)、轻度认知障碍(MCI)及正常认知状态。
这项研究在医学研究与人工智能融合的道路上迈出了坚实的一步,不仅展示了机器学习技术在复杂医疗诊断中的潜力,还拓宽了我们对认知障碍早期识别手段的理解。
研究方法
研究共收集了258名受试者的眼动数据,其中包括111名ADD患者、81名MCI患者以及66名认知正常的个体。在注视、平滑追踪、正向眼跳和反向眼跳任务中记录了受试者的眼球运动参数。随后,研究者使用机器学习算法筛选关键的眼动参数,并构建诊断模型。
研究结果
1. 通过Lasso和LightGBM-RFE算法筛选眼动特征
研究者使用单因素分析筛选有意义的眼动变量,接着使用两种不同的算法(Lasso和LightGBM-RFE)进一步筛选特征集。Lasso算法基于lambda值的最小平均交叉验证误差选择了21个参数作为特征集;而LightGBM-RFE算法则基于最高的macro_f1值选择特征集,并在特征数量为20时分类器误差最小。最终,两种算法共同选出了16个眼动特征作为认知障碍的诊断标志物进行进一步分析。
2. 建立基于眼动参数的多分类机器学习诊断模型
研究团队使用Pycaret训练了14个模型,并评估了它们的性能。在多种机器学习算法中,梯度提升分类器(Gradient Boosting Classifier)模型脱颖而出,展现了最佳的分类性能。在多分类任务中,该模型达到了68.2%的准确率和66.32%的F1分数,显着优于其他模型。这一结果表明,基于眼动参数的分类模型在区分不同认知状态方面具有高度的准确性和可靠性。
为进一步验证GBC模型的性能,研究者加入基于全连接神经网络(FCNN),特征变换Transforme框架(FT-Transformer)和自注意力框架的深度学习方法进对比实验。结果显示,FCNN模型的准确率、召回率、精确度和F1分数分别为0.6508、0.6508、0.6870和0.6553;FT-Transformer模型对应指标为0.6091、0.5970、0.5969和0.5802;自注意力模型则为0.5818、 0.5576、0.6053和0.5404。结果表明这三个模型的性能均不如GBC模型。这种差异可能由于研究中的眼动数据为一维向量,不适合端到端的机器学习模型开发。此外,这三个模型需要大量数据进行稳健训练以实现有效的特征表示和泛化,而GBC模型在小规模结构化数据集上可能表现更佳。
3.GBC模型中重要性排名前五的眼动参数与神经心理量表的相关性
研究者通过计算基尼重要性评估了各特征对GBC模型性能的贡献,并确定了五个最重要的特征。这些特征包括:反向扫视任务中的扫视潜伏期、反向扫视任务的错误率、正向扫视任务中的扫视潜伏期、反向扫视任务中的正向扫视次数,以及正向扫视任务中右区域注视时长占总注视时长的百分比。
此外,研究还利用皮尔逊相关分析探讨了最优模型中五个最重要的眼动指标与神经心理学量表之间的关系。结果显示,这些眼动参数与多种认知功能密切相关,包括但不限于整体认知功能、注意力、视空间能力、情景记忆、短期记忆、语言能力和工具性日常生活活动能力。这一发现不仅揭示了眼动参数在反映认知功能变化方面的潜力,也为深入理解AD的病理机制提供了新的视角。
研究价值
随着全球老龄化社会的加速到来,阿尔茨海默病等认知障碍疾病的发病率逐年攀升,给家庭和社会带来了沉重的负担。眼动参数结合机器学习方法的应用,为实现阿尔茨海默病的早期、快速、非侵入性诊断提供了一条有效途径,有望在未来成为临床诊断AD的重要辅助工具。随着技术的不断进步和研究的深入,我们期待这一领域能够带来更多创新成果,为AD患者带来更大的福音。
END
作者:宋佳琦 重医基础医学院神经科学研究中心
编辑:汪晗玥 重医2022级中医学
审核:吕 洋 重医一院老年病科