对COVID-19爆发的公众关注、风险认知、情绪和行为反应评估:中国的社交媒体监测

文摘   2024-11-05 15:31   江苏  

『柏拉图说』是由南京大学计算传播学实验中心的成员们于20224月发起的论文精读与推介活动,我们将定期推送新闻传播学TOP期刊最新内容、新闻传播学前沿及相关量化研究方法论文。我们致力于深耕传播学领域,紧跟专业研究热点,延伸学术视角,拓展群体智慧。

柏拉图说 论文推介第 159 

Hou, Z., Du, F., Jiang, H., Zhou, X., & Lin, L. (2020). Assessment of public attention, risk perception, emotional and behavioural responses to the COVID-19 outbreak: social media surveillance in China. MedRxiv, 2020-03.

摘要

利用社交媒体监测数据,本研究旨在实时评估公众对 COVID - 19 爆发的关注、风险认知、情绪和行为反应。我们收集了 2019 年 12 月 1 日至 2020 年 2 月 15 日来自最受欢迎的社交媒体(新浪微博、百度搜索引擎和阿里电子商务市场)的数据。微博帖子数量和百度搜索量被用于生成评估公众关注度的指数。公众对推荐的防护措施的意向和实际采用情况,以及由谣言和错误信息引发的恐慌性购买行为,通过百度和阿里指数进行衡量。通过语言查询与字数统计文本分析程序对微博定性帖子进行分析,以评估公众对流行病学事件、政府公告和控制措施的情绪反应。我们确定了 COVID - 19 爆发早期疫情控制的两个错失的机会窗口,一个在 2019 年 12 月,另一个在 2019 年 12 月 31 日至 2020 年 1 月 19 日之间,尽管疫情爆发,但公众关注度非常低。信息发布延迟引发了负面公众情绪。公众对政府公告反应迅速,并根据发布的指南采取了推荐的行为。我们发现关于治疗方法的谣言和错误信息导致了疫情期间的恐慌性购买,及时澄清谣言有效地减少了非理性行为。社交媒体监测能够及时评估公众对风险沟通和疫情控制措施的反应以及对谣言的即时澄清。这应充分纳入疫情准备和应对系统。

研究方法

(一)数据收集

1.百度指数

百度搜索引擎在中国相当于谷歌,拥有超过 10 亿中国用户。百度指数源于百度搜索引擎上的搜索频率,由百度统计提供支持,并以预设关键词的形式呈现。百度指数反映了用户在一段时间内对特定关键词的关注,从而评估公众的认知度。对于本研究,我们手动扫描并识别了所有包含 COVID - 19、推荐的个人防护措施以及谣言和错误信息的百度指数关键词。国家卫生健康委发布了一系列指南,建议居民采取个人防护措施,包括呼吸防护、手部卫生、家庭消毒和健康监测四个主要方面。因此,我们将 “口罩”、“洗手液”、“消毒剂” 和 “体温计” 确定为反映上述四项措施的关键词(表 1)。我们还从微博 “热搜” 排名中确定了三个关键词:“板蓝根”、“双黄连” 和 “大蒜”,这些都是关于个人健康保护的某些草药的广泛流传的谣言和错误信息。为了进行比较,我们还收集了去年同一时间段(2018 年 12 月 1 日 - 2019 年 2 月 15 日)的百度数据作为基线数据。

2.新浪微博

我们使用 Python 编写了一个爬虫程序,从 2019 年 12 月 1 日至 2020 年 2 月 15 日从新浪微博网站的高级搜索功能中收集省级层面的微博状态,共收集了 6,216,572 条微博帖子。所有收集的帖子都按日期和用户位置(即在湖北省内或省外)进行排序。从最初识别的五百条帖子中手动扫描了一份关于 COVID - 19 的微博关键词(标签 ##)列表,并在用于数据爬取之前对其进行了敏感性和特异性测试。爬取的微博帖子单独或组合使用,以生成关于 COVID - 19 以及谣言和错误信息的各种微博关注度和认知度指数(表 1,图 1 和图 5)。此外,为了确定引发公众反应的事件,我们参考微博的 “热搜” 排名来识别吸引公众关注的热门微博话题。

3.阿里指数

阿里平台在中国相当于亚马逊,是一个强大且受欢迎的基于互联网的电子商务市场,拥有超过 10 亿用户,其采购指数反映了在线购买特定产品的数量。我们采用了与推荐的个人防护措施相关的相同关键词:“口罩”、“洗手液”、“消毒剂” 和 “体温计”,以评估公众对 COVID - 19 爆发的行为反应(可以理解的是,阿里平台没有为与谣言相关的物品生成指数)。我们同样收集了当前疫情期间和前一年的行为数据。

(二)数据分析

使用微博和百度的每日指数评估公众关注度和认知度以及谣言和错误信息。为评估公众关注度和认知度,我们使用与 COVID - 19 相关关键词的 “帖子” 每日数量构建了一个微博指数,计算每日呈现包含这些关键词的微博帖子的比例。通过将所有收集的微博帖子导入语言查询与字数统计(LIWC)文本分析程序来评估公众情绪,该程序用于评估心理结构,特别是与情绪相关的结构。我们采用了中文版(SCLIWC),它之前已适应中国语境并在微博帖子中得到验证。在本研究中,我们评估了选定的心理语言学特征:消极情绪(即焦虑、悲伤、愤怒)和风险感知(即驱动力)。利用百度和阿里的每日指数,我们评估了在 COVID - 19 爆发期间采用推荐的个人防护措施和 / 或关于无效治疗的谣言的意图和行为。最后,我们采用 Spearman 等级相关分析来检测微博、百度和阿里指数的一致性,并评估公众反应不同方面(公众关注度和认知度、风险感知和消极情绪、意图和行为)不同指数之间的相关性。我们还进行了回归模型以估计不同时期不同省份在风险感知和各种消极情绪方面的差异。

研究结果

(一) 公众对 COVID - 19 的关注和认知

第一例 COVID - 19 病例于 2019 年 12 月 8 日出现,武汉市卫生健康委于 12 月 31 日首次宣布。2019 年 12 月整个月,COVID - 19 的百度搜索指数无结果,在 12 月 31 日武汉卫生健康委首次报告共有 27 例不明原因肺炎患者时,搜索量跃升至 127,336 次(微博热搜 #4)。然而,公众的关注和认知度在第二天立即下降到 30,504 次搜索,并在 1 月 1 日 - 19 日之间保持较低水平。从 1 月 20 日开始,当国家卫生健康委确认人传人(微博热搜#1)时,搜索量急剧增加,并在 1 月 25 日达到 3,039,324 次的峰值。然后随着小幅波动稳步下降。图 1 突出显示了早期疫情控制错失的机会窗口。微博指数呈现出与百度指数类似的趋势,在 2 月 2 日出现一个异常峰值,这是春节假期后人们原定返回工作的前一天(微博热搜 #25)。相关性分析表明,百度和微博指数之间的公众关注和认知度呈正相关(Spearman 等级相关系数 0.897,p<0.001)。

(二)公众风险感知和情绪反应

共收集了 2,937,082 条微博帖子,其中包括湖北省内的 159,624 条(5.4%)和湖北省外的 2,777,458 条(94.6%)。微博帖子中表达感知风险和情绪(正负向)的每日比例在图 2 中呈现,由于在 1 月 20 日之前公众对 COVID - 19 的认知度较低,在此期间由于数据量小(许多天微博帖子 < 1000),这三个指标出现了强烈波动。

图 3 更详细地分析了微博上表达的三种负面情绪:公众焦虑、悲伤和愤怒;它们都在 1 月 1 日、13 日和 2 月 6 日左右三次达到峰值,并在触发事件发生后的 24 小时内表现出来。国外第一例确诊病例的报告在湖北省外引发了更多的焦虑、悲伤和愤怒,并且对来自湖北的输入性病例的风险感知上升。在 1 月 13 日,湖北省外 18.0% 的微博帖子对疫情感到愤怒,远高于湖北的 8.3%。在 2 月 6 日,李文亮医生,这位首先警告疫情并被警方指控传播假新闻的吹哨人,死于 COVID - 19。这再次引发了公众的负面情绪表达,特别是在湖北。湖北约 23% 的微博帖子对李医生的死亡表达了焦虑、悲伤和愤怒,远高于湖北以外 14% 的用户。

值得注意的是,1 月 20 日确认人传人标志着公众焦虑开始稳步下降;在此期间,公众悲伤和愤怒增加,但在 1 月 23 - 25 日实施防控措施后开始下降。武汉市从 1 月 23 日开始实施了一系列疫情控制和隔离措施:城市的公共交通关闭,所有从武汉出发的航班和火车都被取消(微博热搜 #13)。在 1 月 25 日,中国大陆除西藏外的 30 个省(自治区、直辖市)启动了重大突发公共卫生事件一级响应(微博热搜#11)。为了评估 1 月 20 日确认人传人对公众感知风险和负面情绪的影响,我们对沟通前后的子样本进行了回归分析(表 2),发现没有证据表明在 1 月 20 日之前湖北和湖北以外居民在公众感知风险和所有三种负面情绪方面存在差异;然而,有证据表明在 1 月 20 日之后,湖北居民比湖北以外居民更有可能有更高的感知风险和负面情绪。

(三)行为反应

国家卫生健康委在 1 月 21 日发布的保护指南中首先提出了呼吸防护和手部卫生,在 1 月 22 日和 25 日分别首先提出了家庭消毒和健康监测。公众对具体指南的发布反应迅速,相应地,意图和实际购买行为都急剧增加。除了体温计的阿里指数外,四项推荐的个人防护措施的百度和阿里指数都在 1 月 21 日开始急剧上升,在 1 月 24 日(除夕)出现异常下降(图 4)。体温计的阿里指数从 1 月 25 日开始迅速上升。百度指数中表示采取所有四项措施的意图比阿里指数中的实际行为上升更早。去年同期(基线)这两个指数都稳定在较低水平。

图 5 显示了关于谣言的百度和微博指数的趋势,分别代表意图行为和公众关注。板蓝根是一种用于发热的传统中药,在中国其有效性仍然被广泛相信。“板蓝根” 的百度指数在疫情首次宣布时就开始增加,在 1 月 20 日确认人传人时进一步急剧增加,并在 1 月 21 日达到峰值。它在 1 月 21 日 - 24 日期间开始下降,在此期间《人民日报》发表了三篇报道试图驳斥其对 COVID - 19 有效的谣言。在 1 月 31 日,《人民日报》报道双黄连,另一种中药,可以抑制 COVID - 19,“双黄连” 和 “板蓝根” 的百度指数都迅速达到峰值。它们在 2 月 2 日迅速下降,当时《人民日报》澄清了这一错误信息,声明双黄连不能预防 COVID - 19。“大蒜可以预防 COVID - 19” 的谣言在 1 月 21 日在微博上开始传播,“大蒜” 的百度指数相应增加。它在 1 月 27 日达到峰值,并在 1 月 28 日之后下降,当时《人民日报》首先驳斥了关于大蒜保护功能的谣言。然而,这三个百度指数仍然高于它们之前观察到的水平,即使在 2 月下旬。作为基线,这些指数在去年同期一直稳定在较低水平。代表公众关注的微博指数与代表意图行为的百度指数对于谣言呈现出相同的模式。

我们进一步进行了相关性分析,结果显示所有推荐措施的百度和阿里指数之间有很强的正相关(相关系数范围为 0.676 - 0.860,p<0.001),所有谣言的百度和微博指数之间也有正相关(相关系数范围为 0.676 - 0.860,p<0.001)。

讨论

信息延迟发布引发了负面公众情绪。公众风险感知和焦虑在确认人传人后开始下降,而悲伤和愤怒在实施防控措施之前增加。我们发现公众对政府公告反应迅速并相应地遵循官方指南,但发现关于草药疗法的谣言和错误信息导致了疫情期间的非理性恐慌性购买。及时澄清谣言有效地减少了非理性行为。

本研究提出了在疫情爆发期间进行社交媒体监测的严谨方法流程,可为未来研究提供参考,特别是在中国背景下。存在一些局限性。首先,中国对微博存在审查,因此可能存在我们没有捕获所有帖子的可能性。为减少这种偏差,我们在政府干预之前每日收集数据(即微博帖子)。其次,LIWC 是一种通过单词频率而非整个帖子来检测情绪的工具,这可能导致误分类。我们采用了其经过改编的中文版,该版本已在当地得到验证,可以更好地与微博匹配以减少误分类。第三,社交媒体研究存在固有偏差,数据可能无法准确反映现实世界,因为用户在网上可能表现不同, 或代表了偏向年轻的人群。

计算传播学园
寻找人类传播行为的基因,通往计算传播研究之路
 最新文章