Cell | 可穿戴设备与AI融合:精神疾病研究的新里程碑

学术   2024-12-22 15:30   江苏  

引言

精神疾病的诊断与治疗一直是现代医学领域的难题,其复杂性不仅体现在遗传因素和环境影响的交织上,还由于个体行为和心理特征的高度异质性。传统的诊断方法通常依赖于患者的自我报告或临床医生的观察,这种方式虽然为精神疾病的识别提供了便利,但却难以全面、客观地捕捉疾病的动态特征。这种局限性直接影响了研究人员对疾病发病机制的理解,从而阻碍了精准治疗方案的开发。
随着科技的进步,智能可穿戴设备的广泛应用为精神疾病研究带来了前所未有的机遇。设备如智能手表、运动追踪器等能够以低成本、非侵入的方式,持续监测佩戴者的生理和行为数据,包括心率、步数、睡眠质量和活动强度等。这些数据不仅反映了个体的身体状态,还可以通过分析揭示潜在的心理和行为模式。然而,这些数据的真正潜力在于,如何将其转化为易于解释的“数字表型”(Digital Phenotypes),以更科学、更客观地描述精神疾病的特征。
在此背景下,12月19日Cell的研究报道“Digital phenotyping from wearables using AI characterizes psychiatric disorders and identifies genetic associations”,通过将人工智能技术与可穿戴设备数据相结合,为精神疾病的研究与诊断开辟了新路径。研究人员分析了来自美国青少年大脑认知发育项目(ABCD Project)的庞大数据集,包括超过11,000名青少年的可穿戴设备记录、基因组信息和临床诊断数据。通过机器学习算法,他们成功构建了能够准确识别精神疾病的数字表型。这些数字表型不仅显著提高了精神疾病的诊断准确性,还在全基因组关联研究(GWAS)中揭示了多种与行为和精神疾病相关的遗传位点,为深入理解疾病的遗传机制提供了重要线索。
这项研究的意义在于,它展示了可穿戴设备与人工智能在精神疾病研究中的潜力,不仅能提高诊断的精准度,还能通过数字表型的构建,建立起行为、遗传与疾病之间的桥梁。这为未来精神医学的研究和治疗指明了方向,也让我们看到了科技在医疗领域应用的更多可能性。

精神疾病诊断的传统困境与新机遇
精神疾病是一类复杂的神经心理疾病,其诊断和治疗在现代医学中面临诸多挑战。据统计,全球每七名儿童和青少年中就有一人受到精神疾病的困扰,其中常见的外化性障碍如注意缺陷多动障碍(ADHD)和内化性障碍如焦虑症尤为普遍。然而,这些疾病的研究却长期受制于传统诊断方法的局限性。
传统精神疾病的诊断主要依赖于临床医生的观察和患者或家属的自我报告。这些基于症状的评估方式虽然提供了简便易用的诊断工具,但在捕捉疾病的异质性和动态性方面存在明显不足。例如,患者的行为模式可能随时间和环境变化而发生显著改变,而传统方法难以全面记录这些变化。此外,这种基于主观评价的方式容易受到观察偏差和患者记忆偏差的影响,从而导致诊断的不准确性。更重要的是,这种“宏观表型”(macrophenotypes)的分类方式常常忽视了疾病的潜在连续性,使得研究人员难以深入探索其背后的遗传和环境因素。
为了弥补传统诊断方法的不足,现代科学开始转向更客观、更量化的手段。数字表型(Digital Phenotypes)作为一种新兴工具,正试图突破传统框架的限制。这一概念通过分析可穿戴设备等工具采集的行为和生理数据,量化个体的动态行为特征,并将其转化为可测量的科学指标。例如,智能手表能够记录心率、步数、睡眠质量等数据,这些生理信号可以映射出患者行为背后的深层心理活动。
随着人工智能技术的融入,数字表型在精神疾病领域的潜力逐渐显现。这种方法不仅能够更全面地捕捉个体行为,还为揭示疾病的复杂遗传机制提供了新工具。该研究表明,通过整合AI分析的数字表型,不仅能显著提升精神疾病的诊断精度,还能在全基因组关联研究(GWAS)中发现多个重要遗传位点。

数字表型:从行为到基因的桥梁
精神疾病的复杂性不仅体现在症状表现上,还延伸到遗传、环境和行为特征的交互影响。研究这些因素需要新的工具来突破传统方法的限制,而数字表型(Digital Phenotypes)的提出正是为了填补这一空白。
数字表型是通过收集和分析可量化的行为与生理数据来描述个体心理状态的科学方法。这些数据通常来自智能可穿戴设备,如智能手表或运动追踪器,能够实时记录心率、步数、睡眠模式和活动强度等生理信号。这些动态和静态特征为研究个体在不同环境下的行为变化提供了丰富的信息,与传统依赖主观报告的诊断方法相比,数字表型更为客观和精确。
在精神疾病研究中,数字表型的独特价值体现在其能够捕捉个体行为与遗传特征之间的联系。研究发现,许多精神疾病如注意缺陷多动障碍(ADHD)和焦虑症,与特定行为模式和生理状态密切相关。在基于ABCD研究的数据分析中,研究人员利用可穿戴设备生成了超过250种数字表型特征,包括心率变化、活动强度和睡眠质量。这些特征不仅能够有效区分患病个体与健康对照组,还为全基因组关联研究(GWAS)提供了连续性、客观化的表型数据。通过这种方式,研究团队识别了16个显著的遗传位点以及37个与精神疾病相关的基因,包括ELFN1和ADORA3。
更重要的是,数字表型打破了疾病分类的传统框架,提供了一种更为全面的行为与基因关联的视角。它帮助研究人员从连续变量的维度探索疾病的特征,超越了传统二元分类的局限性。

ABCD研究中整合临床、数字和遗传数据以改进精神疾病表征(Credit: Cell

描述了ABCD研究如何通过整合可穿戴设备数据、临床诊断数据和基因组信息,为精神疾病的研究提供创新方法。
(A) 框架示意图
展示了研究的整体框架,说明如何利用可穿戴设备生成的数字表型(Digital Phenotypes)来探索宏观表型(Macrophenotype)与基因型(Genotype)之间的关联。数字表型与宏观表型的关联不仅验证了数字表型的构建有效性,还为疾病的诊断提供了客观依据。基于可穿戴设备的全基因组关联研究(GWAS)通过将基因型与数字表型相结合,揭示了遗传变异如何影响行为和生理特征。
(B) ABCD研究的队列构成
ABCD研究队列包括11,878名年龄在9至14岁的青少年,分为9类基于Kiddie Schedule for Affective Disorders and Schizophrenia-5的宏观表型诊断类别。最常见的诊断类别是焦虑症和注意缺陷多动障碍(ADHD),其次为其他内化性和外化性精神疾病,包括双相或精神病性障碍(“Bipolar”)。图表底部的柱状图显示了每种疾病类别的人数分布情况。
(C) 来自Fitbit设备的数字数据
研究中,共有5,339名参与者佩戴Fitbit设备以收集包括心率、步数、睡眠模式等在内的时间序列数据。这些数据被处理为动态特征(Dynamic Features)和静态特征(Static Features),涵盖了从基础生理到高级行为的多个维度。这些特征为进一步的疾病分类和遗传分析提供了数据基础。
(D) 基因数据的采集与处理
遗传数据通过Smokescreen基因分型芯片采集,并通过标准化的质量控制(QC)流程处理,以确保基因型数据和单核苷酸多态性(SNP)的高质量。主成分分析(PCA)在8,791名参与者的157,556个基因型数据上进行,揭示了不同的族群遗传结构。推断出的主成分被用作后续遗传分析的协变量。

可穿戴设备:捕捉行为特征的利器
在精神疾病研究中,传统的观察和问卷调查方式难以全面捕捉个体的动态行为和生理变化。近年来,可穿戴设备的出现为这一领域带来了革命性突破。这些设备不仅能够低成本、非侵入地收集海量生理与行为数据,还能为疾病的诊断和研究提供持续的动态监测能力。
智能手表等可穿戴设备具备多种传感器,能够记录个体在日常生活中的生理和行为特征。例如,Fitbit智能手表可以追踪心率、步数、卡路里消耗、活动强度和睡眠模式等数据。这些数据可以精确反映佩戴者的身体活动水平、作息规律以及生理节律,为研究个体行为提供了丰富的信息来源。特别是在青少年精神疾病的研究中,这些设备展现出强大的潜力。在ABCD研究中,共有5,339名青少年佩戴智能手表记录了长期的生理数据,这些数据后来被用来构建动态和静态的数字表型。
动态特征是通过分析时间序列数据生成的,能够保留行为和生理变化的时序模式,如一天中心率的波动情况。这种时间敏感的特征对于研究精神疾病中个体行为的日常变化具有重要意义。而静态特征则通过对数据进行汇总统计生成,例如平均心率、总步数或睡眠时间,能够更直观地反映个体的整体生理状态。研究表明,这些特征在分类精神疾病患者和健康个体时,准确性甚至超过了传统的磁共振成像(fMRI)等昂贵方法。
可穿戴设备的另一个优势在于其使用门槛低、可广泛普及,使得大规模数据采集成为可能。这不仅为大样本研究提供了坚实的数据基础,还为探索精神疾病的遗传机制和行为模式之间的关系创造了条件。通过这些设备的实时动态监测,研究人员能够更精准地捕捉精神疾病的细微特征。

人工智能赋能:从数据到洞察的关键工具
在可穿戴设备收集的海量生理与行为数据背后,隐藏着揭示精神疾病奥秘的重要信息。然而,这些数据的高维度、复杂性和时间序列特性,使得传统分析方法难以充分挖掘其潜力。这时,人工智能(AI)技术成为破解这一难题的关键工具,为从数据中提取关键信息铺平了道路。
在精神疾病研究中,AI的主要任务是将可穿戴设备生成的原始数据转化为有意义的数字表型。在ABCD研究中,研究团队开发了一套先进的AI建模框架,将超过250种动态和静态特征整合成一系列易于解读的数字表型。动态特征保留了行为和生理信号的时间模式,例如一天中不同时间段的心率变化;静态特征则通过统计汇总提供了对总体行为的概览,如平均睡眠时长或总步数。AI模型通过这些特征,不仅能够高效地分类青少年是否患有焦虑症或注意缺陷多动障碍(ADHD),其准确性还超过了传统的基于行为问卷或宏观表型的诊断方法。
为了最大化数据的诊断潜力,研究团队采用了两种核心AI技术:梯度提升树算法(XGBoost)和基于卷积神经网络的Xception模型。其中,XGBoost擅长处理静态特征,能够通过非线性分析捕捉数据中隐藏的复杂关系;Xception则利用动态特征的时间序列模式,通过残差连接和多层网络设计,提取出与精神疾病密切相关的高阶信息。研究显示,动态特征模型在诊断ADHD时的受试者工作特征曲线(AUROC)高达0.89,远超仅依赖传统行为特征的模型。
更重要的是,这些AI模型不仅擅长预测,还能通过可解释性模块揭示疾病与行为模式之间的深层关联。例如,通过“Grad-CAM”技术,研究人员发现心率的时间动态在区分ADHD患者与健康个体时至关重要,而睡眠质量则是焦虑症的关键特征

ABCD研究:揭开青少年精神疾病的遗传奥秘
精神疾病的发生常常是遗传、环境与行为多重因素交织的结果。然而,传统研究方法在探究这种复杂关系时面临诸多挑战,如缺乏足够规模的样本和客观的行为数据。为了填补这一空白,美国“青少年大脑认知发育计划”(Adolescent Brain Cognitive Development, 简称ABCD研究)应运而生,成为目前全球规模最大的青少年大脑与行为发育研究项目之一。
ABCD研究由美国国家卫生研究院(NIH)主导,自2016年启动以来,已招募了超过11,000名9至14岁的青少年(包括5,682名男性和6,196名女性),涵盖多个族群与地理区域。该研究旨在通过对青少年的长期追踪,揭示大脑发育、行为变化与环境因素之间的相互作用。数据的采集范围广泛,包括行为问卷、临床诊断记录、认知测试、基因组数据,以及由可穿戴设备采集的实时生理和行为信息。
在精神疾病的研究领域,ABCD研究具有开创性的科学意义。研究团队利用标准化的诊断工具,将参与者分为九种不同的精神疾病类型,包括焦虑症、注意缺陷多动障碍(ADHD)等,建立了详细的“宏观表型”(macrophenotypes)分类体系。同时,通过结合可穿戴设备数据,该项目为数字表型的开发提供了宝贵的素材。例如,研究人员通过Fitbit手表采集了5,339名参与者的动态生理特征,如心率、步数和睡眠质量,从而构建了一套全面描述行为特征的数据库。此外,ABCD研究还收集了基因组数据,利用全基因组关联研究(GWAS)分析精神疾病与遗传因素的关系。
这项研究的最大亮点在于规模与深度的结合。借助庞大的样本量和多维数据,ABCD研究不仅发现了16个与精神疾病相关的显著遗传位点,还识别了多个潜在的关键基因,如ELFN1和ADORA3,为探索青少年精神疾病的遗传机制提供了重要线索。通过这种系统性研究,ABCD项目为理解青少年行为、遗传与疾病之间的复杂关系铺平了道路,也为精准治疗奠定了科学基础。

核心发现:数字表型如何精准预测精神疾病
研究团队分析了ABCD研究中由Fitbit手表收集的动态和静态特征,包括心率、步数、活动强度和睡眠质量等,共提取出超过250种特征,构建了全面反映个体生理与行为状态的数字表型。这些特征随后被用于AI模型的训练与测试。
为了验证数字表型在精神疾病诊断中的效力,研究团队构建了两种核心AI模型:用于静态特征的梯度提升树算法(XGBoost)和用于动态特征的深度学习卷积神经网络(Xception)。在对青少年注意缺陷多动障碍(ADHD)的分类中,动态特征模型的表现尤为突出,其受试者工作特征曲线(AUROC)达到0.89,精确率高达83%。相比之下,传统基于行为问卷的模型仅能达到0.83的AUROC。类似地,在焦虑症的分类中,动态特征模型的AUROC为0.71,同样优于传统方法。
更为重要的是,AI模型展现出的强大解释力。研究发现,心率动态是区分ADHD的重要指标,而睡眠质量则是焦虑症的核心特征。这种洞察不仅帮助研究人员更好地理解疾病特征,还为临床医生提供了更具操作性的参考指标。

基因与行为:全基因组关联研究的突破
精神疾病的复杂性不仅体现在其多样的临床表现上,还与其深层的遗传背景息息相关。然而,传统的全基因组关联研究(GWAS)通常依赖于简单的二元分类标签(患病或健康),难以揭示遗传变异与行为特征之间的复杂关系。通过引入数字表型,这一局限正在被突破,为精神疾病的遗传研究开辟了全新路径。
在ABCD研究中,研究团队将数字表型作为GWAS的响应变量,而非传统的二元诊断标签。这种创新方法显著提高了统计效率,使研究能够更加灵敏地捕捉遗传位点与行为模式之间的关联。研究通过分析超过5,000名青少年的数字表型和基因组数据,成功识别了16个显著遗传位点以及37个与精神疾病相关的关键基因,包括ELFN1和ADORA3。这些基因被认为在神经发育和精神疾病中发挥重要作用。例如,ADORA3与神经递质调节密切相关,而ELFN1的突触功能对注意缺陷多动障碍(ADHD)的行为特征影响显著。
研究还通过多变量GWAS进一步探索数字表型的不同特征如何与特定基因相关。例如,在ADHD研究中,研究发现某些遗传变异与心率动态和久坐时间的变化显著相关。这些遗传位点不仅揭示了行为和生理特征之间的关联,还为进一步解读精神疾病的遗传机制提供了重要线索。此外,研究团队还发现了一些传统GWAS未能识别的位点,这些位点通过与行为特征的交互作用,为疾病诊断和治疗提供了新的可能性。
这一突破性的研究表明,数字表型可以作为遗传研究的重要工具,将行为模式和遗传信息连接起来,为理解精神疾病的发生机制提供了全新的视角。

动态与静态特征:解读数字表型的多样性
数字表型的核心优势在于其能够整合多维数据,通过动态与静态特征全面描绘个体的生理和行为状态。这种特征分类方法不仅提升了模型的诊断准确性,还显著增强了对精神疾病特征的解释能力。
动态特征是通过时间序列数据生成的,它们能够捕捉行为和生理状态的时序变化。例如,在ABCD研究中,动态特征包括连续记录的心率波动、活动强度变化和睡眠深度的昼夜变化。这些特征在区分不同精神疾病中展现出极高的敏感性。例如,研究发现注意缺陷多动障碍(ADHD)患者在午后时段心率动态特征显著异于健康个体,而焦虑症患者的睡眠深度变化在夜间表现出明显差异。通过AI模型中的卷积神经网络(Xception),这些动态特征被深度学习算法识别为疾病分类的关键指标。
相较之下,静态特征则是对时间序列数据的汇总与统计,提供了个体行为的总体概览。研究团队通过对Fitbit设备采集的数据进行分析,提取了包括平均心率、总步数、睡眠时长和代谢水平在内的258种静态特征。这些特征被聚类为七大类,分别反映个体的生理活动、睡眠质量和代谢状态。例如,ADHD患者的久坐时间显著低于健康对照组,而焦虑症患者的睡眠质量得分则显著较低。这些静态特征在基于XGBoost的模型中,能够准确预测精神疾病类别,并为行为特征与疾病之间的联系提供了更多直观的解释。
动态与静态特征的结合使数字表型在描述精神疾病复杂性方面达到新的高度。动态特征可以提供行为模式的细粒度变化,而静态特征则为这些变化提供了全局视角。在两者的协同作用下,AI模型不仅能够更准确地区分疾病类型,还能揭示潜在的病理机制,为精准医学的发展铺平了道路。

数字表型在精神医学中的应用潜力
尽管数字表型在精神医学研究中展现了巨大潜力,但其应用仍面临诸多挑战,尤其是在从实验室到临床的转化过程中,需要克服数据、技术和伦理等多方面的困难。这些挑战不仅为未来的发展指明了方向,也激励研究人员进一步完善这一领域的理论与实践。
首先,数据质量与标准化是数字表型应用的首要问题。目前,数字表型数据主要来源于消费级可穿戴设备,这些设备虽然易于获取且成本低廉,但在数据采集精度和一致性上仍存在不足。例如,基于活动追踪的睡眠质量评估可能与专业设备存在偏差。此外,不同设备之间的数据格式和测量标准各异,缺乏统一的规范,这对多中心研究和临床推广构成了挑战。未来,需要发展更高精度的医疗级可穿戴设备,并制定国际化的数据采集和处理标准。
其次,环境和外部干扰因素对数字表型的影响仍需进一步研究。参与者的生活方式、服药历史或情绪波动等因素可能干扰设备采集的数据。这些干扰因素在现有研究中未能完全控制,可能影响结论的稳健性。未来研究应关注如何更精确地排除这些变量的干扰,例如通过更复杂的多变量分析模型或长期的追踪研究来解决这一问题。
此外,伦理与隐私问题是数字表型推广的关键障碍。可穿戴设备采集的数据高度敏感,涉及个人隐私和健康状况。如何保护数据安全、避免滥用,同时在医疗实践中获得参与者的充分信任,是一个需要长期探索的问题。
尽管如此,数字表型在精神医学中的应用潜力仍然令人期待。从科学研究的角度看,它为理解行为、基因和疾病之间的复杂关系提供了强大的工具。从临床实践的角度看,数字表型可以实现精神疾病的早期筛查、个性化诊断和治疗效果的实时监控。例如,通过AI模型生成的评分系统,可帮助临床医生快速识别高风险个体,并制定更精准的干预方案。未来,随着数据技术、算法性能和设备硬件的持续进步,数字表型有望成为精神医学领域不可或缺的核心工具,推动个性化、精准化医疗的全面实现。



参考文献


Liu JJ, Borsari B, Li Y, Liu SX, Gao Y, Xin X, Lou S, Jensen M, Garrido-Martín D, Verplaetse TL, Ash G, Zhang J, Girgenti MJ, Roberts W, Gerstein M. Digital phenotyping from wearables using AI characterizes psychiatric disorders and identifies genetic associations. Cell. 2024 Dec 18:S0092-8674(24)01329-1. doi: 10.1016/j.cell.2024.11.012. Epub ahead of print. PMID: 39706190.



责编|探索君
排版|探索君
转载请注明来源于【生物探索】
声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!

End




往期精选

围观

Nature | 单细胞分析技术的革命性进展

热文

Nature | 环状RNA(circRNA)为何成为基因调控的新宠?

热文

Cell | AI取代科研人员还有多远?

热文

新英格兰 | 司美格鲁肽(semaglutide)又有新发现:助力关节炎治疗


热文

CRISPR技术进化史 | 24年Cell 综述

生物探索
探索生物科技价值的新媒体
 最新文章