利用手机APP收集数据，对情感障碍患者进行分类，发表一区SCI（IF 15.2），

学术 2024-11-20 21:18 陕西

一、文章介绍

《Classifying and clustering mood disorder patients using smartphone data from a feasibility study》，发表在npj Digital Medicine期刊上。研究团队来自不同的研究机构，包括贝斯以色列女执事医疗中心、梅奥诊所和约翰霍普金斯大学。

研究的目的是探索使用智能手机收集的数据来区分和分类情感障碍患者（包括双相情感障碍和重性抑郁障碍）的可行性。研究团队在两个研究地点招募了患者和未确诊的对照组，要求他们在12周内使用一个名为mindLAMP的应用程序来收集智能手机数据，包括地理位置、加速度计和屏幕使用时间等被动数据，以及通过调查问卷收集的主动数据。

研究使用了多种机器学习模型进行数据分析，包括二元分类和三组k-最近邻（KNN）分类，以及k-均值聚类。结果显示，最佳的二元分类模型（随机森林）能够以0.91的AUC值区分对照组和非对照组患者，而最佳的多分类模型（逻辑回归）在区分MDD和双相情感障碍方面的AUC值为0.62。聚类分析产生了一定的分层效果，但准确性仍有待提高。

文章强调，尽管智能手机数据在区分情感障碍方面显示出潜力，但目前的方法在准确性上存在不一致性，需要更多的数据流和更大的样本量来进一步验证这些发现。研究的开放性和透明度得到了强调，因为提供了用于分析的代码，并且研究设计旨在可复制性。

这项研究为未来利用数字表型分析方法来改善情感障碍的诊断和治疗提供了初步的证据，并为未来的研究方向和潜在的临床应用奠定了基础。

二、文章质量评估

1.研究设计：文章描述了一项旨在探索使用智能手机数据对情感障碍患者进行分类和聚类分析的可行性研究。研究设计包括了两个研究地点，以及对不同诊断类别的患者进行招募，这有助于增加研究的多样性和普遍性。

2.样本多样性：研究包括了不同性别和诊断类别的参与者，这有助于提高研究结果的代表性和外推性。

3.数据处理：研究者对缺失数据进行了适当的处理，使用了数据插补的方法来减少缺失数据的影响，这是一种常见的数据处理策略。

4.统计分析：文章使用了多种统计模型进行分类和聚类分析，包括随机森林、逻辑回归、支持向量机等，这有助于从不同角度验证研究假设。

5.结果解释：研究者对结果进行了详细的解释，并讨论了其在临床实践和未来研究中的潜在应用，同时也指出了研究的局限性和未来研究的方向。

6.透明度和可重复性：文章提供了用于数据分析的代码链接，这有助于其他研究者验证和复制研究结果，增加了研究的透明度和可重复性。

7.研究意义：研究探讨了数字表型分析在情感障碍诊断和治疗中的潜在应用，这是一个新兴且具有重要临床意义的研究领域。

总体而言，这篇文章在研究设计、数据处理、统计分析和结果解释方面都表现出较高的质量。然而，由于样本量相对较小，研究结果可能存在过拟合的风险，这限制了其在临床实践中的应用。研究者也意识到了这一点，并建议未来的研究应该使用更大的样本量来验证和改进这些方法。因此，这篇文章为未来在该领域的研究提供了一个有价值的起点，并指出了进一步研究的方向。

三、文章的样本量情况

根据提供的文件内容，这项研究的样本量情况如下：

- 总共有207名参与者被纳入研究。

- 其中，女性参与者有84名，男性参与者有32名。

- 按照诊断分类，参与者的分布为：

- 对照组（未确诊的情感障碍）有35名。

- 重性抑郁障碍（MDD）有53名。

- 双相I型障碍（Bipolar I）有13名。

- 双相II型障碍（Bipolar II）有15名。

研究在两个地点进行，分别是梅奥诊所和约翰霍普金斯大学。参与者的种族分布包括白人、亚洲人、黑人、西班牙裔以及其他种族。研究中提到，由于样本量较小，对于分类模型的预测，将双相I型和双相II型患者合并为一个“双相组”。

需要注意的是，研究中提到的样本量可能不足以完全克服过拟合的风险，作者建议未来的研究应该使用更大的样本量来验证和改进基于智能手机数据的分类和聚类方法。此外，研究中还提到了一些参与者由于数据质量不足而未能提供足够的样本用于计算平均值和方差，导致了一定程度的缺失数据。

四、文章缺失值处理情况

是的，这篇文章中对缺失数据进行了处理。研究者采用了以下方法来处理缺失数据：

1.数据过滤：首先，研究者对数据进行了过滤，排除了数据质量低于0.8的1小时时间段，假设这些低质量的时间段会产生有偏的结果。

2.数据插补：由于回归模型中使用的输入变量数量较多，如果排除所有有缺失数据的参与者，将大幅减少具有适用数据的参与者数量。因此，研究者选择使用平均特征值来填补缺失值，而不是完全排除这些参与者。

这种处理缺失数据的方法旨在尽可能保留更多的参与者数据，同时减少缺失数据可能引入的偏差。通过这种方法，研究者能够利用现有的数据集进行更全面的分析，尽管这种方法可能并不完美，但它是在处理实际研究中常见的数据不完整性问题时的一种常见实践。

http://mp.weixin.qq.com/s?__biz=MzA4Mjk5OTE1OA==&mid=2651373381&idx=2&sn=d32a282eef88600e04f6d096ac8670ec

生物科研实验

本公众号全力打造科研实验思路及最新文献研究进展，SCI文章写作发表投稿以及国自然相关信息，为实验工作者提供科研实验思路及科研进展最新信息提供更多的获取平台！另外，每天还有更多实验技术资源及国自然干货免费领取，感谢您的关注！

最新文章

影响因子缩水大背景下，这本期刊涨到16.6，国人发文第2名！

利用手机APP收集数据，对情感障碍患者进行分类，发表一区SCI（IF 15.2），

WB条带不理想，常见问题分析：高背景

医学1区，最新影响因子12.4！

如何用流式细胞仪分选T细胞

首个决定7天，最新影响因子跌破10分!

WB条带不理想，常见问题分析：非特异性条带

这本国产期刊,最新影响因子已突破20分！

One step cloning实验步骤及注意事项

PCR——像复印机一样复制DNA

最新影响因子16.4，已实现11连涨，不要版面费！

AACR旗下新秀，最新影响因子29.7分！

细胞计数的实验步骤&常见问题分析

老牌期刊，最新影响因子12.5分！

无缝克隆技术的介绍和经验分享

国人发文第一名，免版面费，最新影响因子跌破10分！

审稿速度快！影响因子5分，中科院三区，无版面费生信友好期刊！曾经两度被中科院预警的期刊还值得投吗？

细胞周期实验：从原理到操作，你需要知道的一切

无版面费，这本期刊最新影响因子3.7分！

WB实验如何选择封闭液？

这本期刊接收率32%，影响因子14.6！

细胞稳定转染的操作步骤及经验分享

柳叶刀旗下新刊物,最新影响因子13.6分！

这本期刊发文量超100，最新影响因子跌破10分！

审稿快，最新影响因子稳住10.7分！

老牌期刊，最新影响因子12.5分！

IHC出现假阳性、假阴性等问题该怎么办?

这本期刊年发文量超2000，影响因子7.7分！

实验解析｜引物设计与验证的注意事项

跟十分文章学做图

PCR实验的常见问题及解决方案

新刊，最新影响因子接近腰斩！

一文弄懂细胞迁移和侵袭实验

这本期刊年发文量超400+，专科top1，最新影响因子12.8！

Pull-down实验详解

Cell旗下新贵期刊，最新影响因子11.7！

1000+同领域母语PhD编辑团队，帮你解决论文语言问题

顶刊旗下新姊妹刊，最新影响因子8.3分，后续有望暴涨！

流式细胞术的多色荧光搭配原则及注意事项

这本期刊接受率23%，最新影响因子9.4分！

实验动物的基础操作

专发综述文章，最新影响因子11.4分！

Nature 系列！影响因子5+，中科院二区，近期刊登肿瘤与非肿瘤纯生信研究

Nature旗下新刊物，影响因子23起步！

WB条带量化之ImageJ软件分析

新刊，最新影响因子接近腰斩！

我国学者连发4篇Nature论文，苏大/北大/南大/中科院各1篇

一篇SCI学校奖励8万！原来写SCI可以这么简单

划痕实验（细胞迁移）的实验流程及经验分享

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉