利用手机APP收集数据,对情感障碍患者进行分类,发表一区SCI(IF 15.2),

学术   2024-11-20 21:18   陕西  
一、文章介绍
《Classifying and clustering mood disorder patients using smartphone data from a feasibility study》,发表在npj Digital Medicine期刊上。研究团队来自不同的研究机构,包括贝斯以色列女执事医疗中心、梅奥诊所和约翰霍普金斯大学。
研究的目的是探索使用智能手机收集的数据来区分和分类情感障碍患者(包括双相情感障碍和重性抑郁障碍)的可行性。研究团队在两个研究地点招募了患者和未确诊的对照组,要求他们在12周内使用一个名为mindLAMP的应用程序来收集智能手机数据,包括地理位置、加速度计和屏幕使用时间等被动数据,以及通过调查问卷收集的主动数据。
研究使用了多种机器学习模型进行数据分析,包括二元分类和三组k-最近邻(KNN)分类,以及k-均值聚类。结果显示,最佳的二元分类模型(随机森林)能够以0.91的AUC值区分对照组和非对照组患者,而最佳的多分类模型(逻辑回归)在区分MDD和双相情感障碍方面的AUC值为0.62。聚类分析产生了一定的分层效果,但准确性仍有待提高。
文章强调,尽管智能手机数据在区分情感障碍方面显示出潜力,但目前的方法在准确性上存在不一致性,需要更多的数据流和更大的样本量来进一步验证这些发现。研究的开放性和透明度得到了强调,因为提供了用于分析的代码,并且研究设计旨在可复制性。
这项研究为未来利用数字表型分析方法来改善情感障碍的诊断和治疗提供了初步的证据,并为未来的研究方向和潜在的临床应用奠定了基础。     

 

二、文章质量评估    

1.研究设计:文章描述了一项旨在探索使用智能手机数据对情感障碍患者进行分类和聚类分析的可行性研究。研究设计包括了两个研究地点,以及对不同诊断类别的患者进行招募,这有助于增加研究的多样性和普遍性。

2.样本多样性:研究包括了不同性别和诊断类别的参与者,这有助于提高研究结果的代表性和外推性。

3.数据处理:研究者对缺失数据进行了适当的处理,使用了数据插补的方法来减少缺失数据的影响,这是一种常见的数据处理策略。

4.统计分析:文章使用了多种统计模型进行分类和聚类分析,包括随机森林、逻辑回归、支持向量机等,这有助于从不同角度验证研究假设。

5.结果解释:研究者对结果进行了详细的解释,并讨论了其在临床实践和未来研究中的潜在应用,同时也指出了研究的局限性和未来研究的方向。

6.透明度和可重复性:文章提供了用于数据分析的代码链接,这有助于其他研究者验证和复制研究结果,增加了研究的透明度和可重复性。

7.研究意义:研究探讨了数字表型分析在情感障碍诊断和治疗中的潜在应用,这是一个新兴且具有重要临床意义的研究领域。

总体而言,这篇文章在研究设计、数据处理、统计分析和结果解释方面都表现出较高的质量。然而,由于样本量相对较小,研究结果可能存在过拟合的风险,这限制了其在临床实践中的应用。研究者也意识到了这一点,并建议未来的研究应该使用更大的样本量来验证和改进这些方法。因此,这篇文章为未来在该领域的研究提供了一个有价值的起点,并指出了进一步研究的方向。

         

 

三、文章的样本量情况

根据提供的文件内容,这项研究的样本量情况如下:

- 总共有207名参与者被纳入研究。

- 其中,女性参与者有84名,男性参与者有32名。

- 按照诊断分类,参与者的分布为:

  - 对照组(未确诊的情感障碍)有35名。

  - 重性抑郁障碍(MDD)有53名。

  - 双相I型障碍(Bipolar I)有13名。

  - 双相II型障碍(Bipolar II)有15名。    

研究在两个地点进行,分别是梅奥诊所和约翰霍普金斯大学。参与者的种族分布包括白人、亚洲人、黑人、西班牙裔以及其他种族。研究中提到,由于样本量较小,对于分类模型的预测,将双相I型和双相II型患者合并为一个“双相组”。

需要注意的是,研究中提到的样本量可能不足以完全克服过拟合的风险,作者建议未来的研究应该使用更大的样本量来验证和改进基于智能手机数据的分类和聚类方法。此外,研究中还提到了一些参与者由于数据质量不足而未能提供足够的样本用于计算平均值和方差,导致了一定程度的缺失数据。       

 

四、文章缺失值处理情况

是的,这篇文章中对缺失数据进行了处理。研究者采用了以下方法来处理缺失数据:


1.数据过滤:首先,研究者对数据进行了过滤,排除了数据质量低于0.8的1小时时间段,假设这些低质量的时间段会产生有偏的结果。
2.数据插补:由于回归模型中使用的输入变量数量较多,如果排除所有有缺失数据的参与者,将大幅减少具有适用数据的参与者数量。因此,研究者选择使用平均特征值来填补缺失值,而不是完全排除这些参与者。

这种处理缺失数据的方法旨在尽可能保留更多的参与者数据,同时减少缺失数据可能引入的偏差。通过这种方法,研究者能够利用现有的数据集进行更全面的分析,尽管这种方法可能并不完美,但它是在处理实际研究中常见的数据不完整性问题时的一种常见实践。

生物科研实验
本公众号全力打造科研实验思路及最新文献研究进展,SCI文章写作发表投稿以及国自然相关信息,为实验工作者提供科研实验思路及科研进展最新信息提供更多的获取平台!另外,每天还有更多实验技术资源及国自然干货免费领取,感谢您的关注!
 最新文章