2024年底直播预告
如果你需要全文,请公众号后台回复关键词“pdf”。更多关于临床试验设计与数据分析服务,请联系郑老师团队,助教微信:aq566665
ALAN暴露(单位:毫瓦特/平方厘米/球面度[nW/cm 2/sr])使用卫星获得的夜间光线图像以500 m的空间分辨率进行测量。 城市居民的失眠发病率通过社交媒体上与失眠相关的帖子数量来衡量的。
在第一阶段,根据与失眠相关的关键词收集具有互联网协议位置的社交媒体帖子。只有包含指定关键词的社交媒体帖子被纳入研究。 在第二阶段,通过用户名收集社交媒体用户的位置等公开的个人信息。由于一些含有失眠相关关键词的帖子,如新闻、广告等,可能不能真实反映人们的失眠情况,我们选择了极限梯度提升(XGBoost)来完成微博数据的文本分类任务。
夜间户外人造光暴露会增加失眠风险
在深入研究后,研究团队发现ALAN暴露与失眠之间的暴露-反应曲线呈上升趋势,低暴露时上升较快,高暴露时趋于平稳。
这意味着在ALAN低暴露水平时,每增加一定量的暴露,失眠发生率显著增加;但当暴露达到一定高水平后,暴露对失眠发生率的影响减弱。
统计学方法
1. 主要统计方法:该研究是一项采用时间序列设计的多城市研究,主要使用多变量调整线性回归评估夜间人造光(ALAN)暴露与中国人群失眠之间的关联。
2. 暴露-反应曲线的估计:为了评估ALAN暴露与失眠发生率之间的暴露-反应曲线,研究者进行了平滑项拟合。
具体而言,在多变量调整模型中,ALAN暴露被拟合为平滑项,使用具有3个节点的样条(spline)函数来实现。
3. 亚组分析:为了检查潜在的影响变化,研究者进行了亚组分析,分别按以下因素进行分层:
城市类别:大城市(人口>500万)、中等城市(人口≥300万且≤500万)、小城市(人口<300万);
时间因素:周末、假日、季节(春、夏、秋、冬);
环境因素:温度和空气质量指数。
4. 敏感性分析:为了确保效果估计的稳健性,研究者进行了一系列敏感性分析,包括:
调整变量:调整人均国内生产总值指数或社交媒体受欢迎程度;
机器学习回归:使用机器学习回归方法进行模型拟合,包括随机森林、决策树和XGBoost等算法;
假阳性关联检查:对可能与失眠无关的单词(如烹饪和跳舞)进行相同的处理,以检查假阳性关联的可能性;
社交媒体流行度控制:微博的流行度由微博平台上讨论的话题的流行度得分来定义,在协变量中调整为十大热门话题的平均指数,以控制社交媒体发布量和公共事件的影响力。
公众号后台回复关键词“pdf”,即可获取原文!更多关于临床试验设计与数据分析服务,请联系郑老师团队,助教微信:aq566665
关于郑老师团队及公众号
全国较大的线上医学统计公众号平台,专注于医学生、医护工作者学术研究统计支持,我们是统计助理!
我们提供以下临床试验全流程服务: