基于社交媒体数据的心理健康社会感知指数构建与城市层面监测研究(Developing a social sensing index for monitoring place-oriented mental health issues using social media (twitter) data)
Jaehee Park, Ming‑Hsiang Tsou, Atsushi Nara, Susan Cassels and Somayeh Dodge
研究表明,某些外部因素会影响社区中许多人的心理健康。此外,随着新冠疫情的爆发,心理健康的重要性在近年来显著提升。许多人通过社交媒体平台交流和表达情绪,这为研究人员提供了机会,能够深入了解人们的观点和心理状态。尽管在过去十年中,利用社交媒体数据进行社会感知研究已取得蓬勃发展,许多使用社交媒体数据检测和预测心理健康状态的研究主要集中在个人层面。在本研究中,我们旨在通过生成一个心理健康的社会感知指数,来监测与心理健康密切相关的情绪健康,并识别城市层面的负面情绪日常趋势。我们对Twitter数据进行情感分析,并计算情感变化的熵值以开发该指数。研究发现,情感趋势在面对异常事件时出现显著波动。该社会感知指数反映了触发负面情绪的城市范围内及本地事件,以及负面情绪持续的区域。本研究对使用社交媒体数据在城市层面探讨心理健康的研究领域做出了贡献。相比个人层面的研究,我们更关注城市层面的心理健康,这为了解整个群体的心理健康提供了更广泛的视角。心理健康社会感知指数使公共卫生专业人员能够监测和识别持续的负面情绪以及潜在的心理健康问题区域。
引用
Park, J., Tsou, MH., Nara, A. et al. Developing a social sensing index for monitoring place-oriented mental health issues using social media (twitter) data. Urban Info 3, 2 (2024).
https://doi.org/10.1007/s44212-023-00033-5
研究背景
心理健康问题在全球范围内引起了越来越多的关注,而疫情等突发事件则加剧了这种关注。通常,心理健康的监测依赖于传统的问卷调查,这类方法尽管有效,但受限于时间和资源。与此同时,社交媒体平台(如Twitter)提供了实时、高频的用户情绪数据,这些数据不仅可以用于个人层面的心理状态分析,也为集体层面的情绪监测提供了可能性。
研究方法
Park等人从亚特兰大、丹佛、圣地亚哥和西雅图四个城市的Twitter数据中,收集了2020年4月15日至6月3日之间发布的超过150万条推文。在数据清理过程中,研究者剔除了自动生成的推文(如天气预报、广告等),仅保留与“心理健康”、“抑郁”、“焦虑”等相关的原创推文。经过初步筛选后,最终留下了1,444,474条推文用于进一步的情感分析。
研究者采用了基于词典的情感分析工具TextBlob,对每条推文进行情感极性打分(情感值从-1表示极度负面到1表示极度正面)。为了避免单个用户频繁发布的推文对整体情绪产生偏差,研究者对同一用户的多条推文进行了平均计算,确保每日的情感分数能够更客观地反映集体情绪。
除此之外,研究者还通过计算熵值来衡量每日情绪变化的不可预测性,熵值越高意味着情绪波动越大,越难以预测。这种结合了情感分析和熵值的社会感知指数能够更好地揭示出突发事件引起的情绪变化以及这些变化在一段时间内的持续性。
数据分析与结果
1. 四个城市的每日平均情感变化
图1展示了四个城市在研究期间(2020年4月至6月)的每日情感变化趋势。可以清楚地看到,随着乔治·弗洛伊德事件的发生,5月25日之后所有城市的情感分数都出现了明显的下降。这一趋势反映了该事件在全国范围内引发的强烈负面情绪。此外,5月16日圣地亚哥的情感分数出现了局部下降,这与当地的“开放圣地亚哥”抗议活动有关,表明当地事件对情感变化的影响同样不可忽视。
图1:四座城市(亚特兰大、丹佛、圣地亚哥和西雅图)的每日平均情绪变化
2、亚特兰大与圣地亚哥每日情感与情感变化幅度
图2与图3详细展示了亚特兰大和圣地亚哥在特定日期的情感变化:
颜色:红点表示情感下降(负面情感增加),蓝点表示情感上升(正面情感增加)。
大小:点的大小代表情感变化的幅度,点越大代表情感波动越剧烈。
例如,亚特兰大在5月7日(Ahmaud Arbery事件)和5月26日(乔治·弗洛伊德事件)出现了显著的负面情感变化,红色大点表明这些事件引发了强烈的负面情绪。而圣地亚哥在5月16日由于“开放圣地亚哥”抗议活动,情感波动也较为明显。
图2:亚特兰大日均情绪值及情绪变化程度
图3:圣地亚哥日均情绪值及情绪变化程度
3、每日情感变化幅度的热力图
图4是四个城市每日情感变化幅度的热力图,通过颜色表示情感变化的程度。绿色代表正面情感的显著增加,而红色代表负面情感的显著下降。从5月25日开始,多个城市同时出现了红色区域,表明乔治·弗洛伊德事件带来了全国性的负面情绪。
图4:每日情绪变化程度热力图
4、社会感知指数
图5是社会感知指数的图表,它结合了每日的熵值与情感等级。条形图的高度代表熵值,颜色的深浅代表情感的负面程度。较高的熵值和较深的颜色表明该日发生了异常的情绪变化,并且这种变化以负面情绪为主。例如,5月16日圣地亚哥的熵值明显较高,颜色也较深,表示“开放圣地亚哥”事件引发了强烈且不可预测的负面情绪。相比之下,5月26日之后,亚特兰大和圣地亚哥的熵值虽有所下降,但负面情绪持续存在,说明乔治·弗洛伊德事件后的负面情绪延续了数天甚至数周。
图5:心理健康社会感知指数
研究意义与展望
这项研究通过分析社交媒体数据,成功开发了一种城市层面的心理健康监测工具。相比传统的问卷调查方法,社交媒体数据具有即时性和广泛覆盖的特点,能够更加及时、精准地反映集体情绪的变化。社会感知指数不仅可以用于检测重大事件引发的情绪波动,还可以识别负面情绪的持续时间,为公共卫生干预提供依据。
尽管该研究展示了使用社交媒体数据监测心理健康的潜力,但研究仍存在一些局限性。例如,Twitter用户的群体代表性存在偏差,较年轻、受教育程度较高的人群比例较大。未来的研究可以通过引入其他数据源,如医院就诊率、紧急医疗记录等,来进一步验证社会感知指数的准确性和实用性。此外,研究者建议开发更全面的数据收集工具,以便在全球范围内推广这一监测系统。
Jaehee Park,博士研究生,就读于圣地亚哥州立大学地理系。
Ming-Hsiang Tsou,圣地亚哥州立大学地理系教授、移动时代人类动态中心 (HDMA) 创始主任。他的研究兴趣包括网络空间地图绘制、社交媒体、互联网地图绘制和分布式 GIS、移动 GIS、用户界面设计和网络基础设施。2014 年春季,Tsou教授成立了移动时代人类动态中心 (http://humandynamics.sdsu.edu/),旨在整合地理信息科学、公共卫生、社会科学、社会学和传播学的研究成果。2014 年秋季,Tsou教授因“跨社交媒体和社交网络的人类动态时空建模”获得美国国家科学基金会跨学科行为和社会科学研究 (IBSS) 奖。
https://geography.sdsu.edu/people/bios/tsou
Atsushi Nara,圣地亚哥州立大学地理系副教授。研究兴趣包括地理信息科学、时空数据分析、行为地理建模和复杂的城市社会系统以及地理计算。他在数据收集、数据集成、数据库管理、传感器技术和软件开发方面拥有丰富的经验和技术专长,可以进行跨学科的 GIScience 研究。他使用数据分析、模拟模型和 GIS 来研究人类动态、运动行为、基于位置的社交网络及其应用于城市动态、疏散和灾难响应、公共卫生和复杂医院环境中的系统管理的背景。
https://geography.sdsu.edu/people/bios/nara
Susan Cassels,加州大学圣巴巴拉分校地理系教授,布鲁姆人口学中心主任。研究的重点是地理流动性、性健康和艾滋病毒预防。她研究艾滋病传播动态的社会和行为决定因素,探索为什么某些人群更易感染艾滋病,以及艾滋病在何时、何地以及为何传播到其他人群。研究主要分析迁移和人类流动如何与艾滋病传播相关,包括流动人口的性行为和感染艾滋病的风险,以及不同社会和物理环境如何影响这些风险。此外,她还研究人类流动如何连接不同的性网络,并如何影响艾滋病在人群中的传播。她使用数学模型来探索社会和行为因素在艾滋病传播动态中的重要性,并通过回答假设性的“如果”问题,帮助政策制定者决定如何实施艾滋病干预措施。
https://www.geog.ucsb.edu/people/faculty/susan-cassels
Somayeh Dodge,加州大学圣巴巴拉分校地理系副教授,MOVE实验室 (https://move.geog.ucsb.edu/)负责人,空间研究和数据科学中心的副主任。研究重点是开发数据驱动的分析、机器学习、建模和可视化技术,以研究人类和自然系统中的运动。她的研究应用了空间数据科学和计算方法来提高人们对动态生态和社会系统中运动模式形成方式的认识和理解。目标是开发一个广泛适用的分析框架,以揭示个体的运动模式是如何由人们的行为、环境以及跨多个时空尺度的相互作用驱动的。
https://www.geog.ucsb.edu/people/faculty/somayeh-dodge
END
编辑:肖之阳、徐志萌
审核/指导:曾凡鑫