揭开社交媒体上的道德和情感话语:三个案例的研究

文摘   2024-10-31 18:04   江苏  

『柏拉图说』是由南京大学计算传播学实验中心的成员们于20224月发起的论文精读与推介活动,我们将定期推送新闻传播学TOP期刊最新内容、新闻传播学前沿及相关量化研究方法论文。我们致力于深耕传播学领域,紧跟专业研究热点,延伸学术视角,拓展群体智慧。

柏拉图说 论文推介第 156 



Chen, Y., Chen, A. X., Yu, H., & Sun, S. (2023). Unraveling moral and emotional discourses on social media: a study of three cases. Information, Communication & Society27(7), 1295–1312. https://doi.org/10.1080/1369118X.2023.2246551


一、摘要

越来越多的研究表明,以道德和情感为特色的信息更有可能在社交媒体平台上传播开来。我们的研究调查了微博(相当于中国的 Twitter)上激烈讨论的三个有争议的事件,重点是非西方文化背景下道德/情感与社交媒体之间的联系。我们发现 (1) 在三个事件的在线讨论中,道德内容多于非道德内容,(2) 单个帖子和媒体帖子之间每小时聚合的道德/情感内容没有延迟,以及 (3) 具有更强烈但异质性情绪的帖子会吸引更多的转发、评论和点赞,而帖子中的同质道德基础可以获得更多的评论和点赞,但不能获得转发。

二、文献综述

在这项研究中,作者通过关注微博(中国最受欢迎的社交媒体平台之一)探索社会认同理论和 SIDE 模型在错误信息研究中的应用,特别是研究国家认同语言如何影响新冠阴谋论在社交媒体上的传播和讨论,拓展相关理论在这一领域的解释力。

三个案例
这三项活动均发生在 2018 年底,媒体对每项活动的报道和在线讨论时间从几个月到一年多不等。
事件一:孟晚舟被拘禁事件(下文以MWZ指代)最初被认为是中国和加拿大/美国之间的政治事件。相比之下,在中国政府和外交官介入之前,挪威警察暴力(下文以SP指代)并没有成为政治。贺建奎基因编辑婴儿事件(下文以HJK指代)被媒体描述为“污染了人类基因库”。所有事件都涉及具有不同脆弱程度的个体:两名婴儿被基因编辑 (HJK),(老年)游客在半夜被强行带走 (SP),一名女性 CTO 突然被捕 (WMZ)。
在本研究的三个样本事件中,MWZ 和 SP 可以被视为涉及中国与其他国家(即瑞典和加拿大)的组间冲突,而 HJK 可以被视为组内冲突,其中中国科学家的行为被认为威胁到人类基因库的安全。这三场活动都引起了争议,并引发了媒体的密集报道和在线讨论。通过调查这三个事件的在线讨论,我们试图揭示道德和情感在群体内和群体间环境中的作用
道德基础
道德是指一种好的、公正的、正确的或合乎道德的做事方式(Haidt,2012 年)。研究人员研究了群体内和群体间层面的道德。作为道德的统一理论框架,道德基础理论 (MFT, Graham et al., 2013) 提出了以下五个基础:关心/伤害、公平/欺骗、权威/颠覆、忠诚/背叛和纯洁/堕落。前两个被归类为个性化基础,后三个被归类为有约束力的基础。更具体地说,关心/伤害是指对他人痛苦的看法,其动机是关心、培养和保护;公平/欺骗表示对互惠社会互动的敏感性和合作的动机;权威/颠覆涉及社会等级、服从和尊重;忠诚/背叛指向联盟内部的信任和合作;纯洁/堕落强调生理和行为的清洁度。研究表明,潜在的道德价值观可以反映在语言使用中(Araque et al., 2020),并且 MFT 已广泛应用于分析社交媒体内容(Hoover et al., 2020;Trager等人,2022 年)。检测社交媒体帖子中道德基础的研究得出结论,不同的社会话题具有独特的道德和词汇特征(Rezapour 等人,2021 年)。集体文化通常强调结合基础,而个人主义文化强调个性化基础(Yilmaz et al., 2016)。例如,关于唐纳德·特朗普的在线帖子包含更多与权威相关的词,而堕胎和女权主义帖子包含更多与关怀和纯洁相关的词。鉴于中国社会与西方社会相比相对集体主义的特征,我们预计微博讨论将显示出突出的、具有约束力的道德基础。
H1:就每个事件而言,微博帖子表现出比个人化的道德基础(即关心/伤害、公平/欺骗)更具约束力的道德基础(即权威/颠覆、忠诚/背叛、纯洁/堕落)。
情感和道德
研究表明,道德情感内容在社交媒体平台上的分享频率更高。不同的情绪可能以不同的方式和不同程度与道德相关。在我们的研究中,SP 和 MWZ 案件涉及外国对中国公民的威胁,而 HJK 案件涉及国内科学家对人类基因库造成的威胁。考虑到这三个事件的性质,本研究将愤怒、厌恶和恐惧视为道德情绪,而惊讶、悲伤和快乐则视为非道德情绪。
H2:对于每个事件,微博帖子表现出比非道德情绪(即快乐、悲伤、惊讶)更强的道德情绪(即愤怒、厌恶、恐惧)。
在集团内部和集团间冲突中的机构和个人行为者
社交媒体上复杂而生动的话语是由各种传播者或参与者(布鲁诺·拉图尔的术语)共同构建的,例如个人用户、政府机构和媒体组织等。也就是说,不同传播者的话语可能在风格或含义上有所不同,因为它们代表了不同的利益相关者、利益和目标。中国的传统媒体(如报纸和电视台)和社交媒体受到政府的严格控制。通过区分微博上的媒体账户和个人用户,本研究提供了对社交媒体关于道德和情感的话语生成机制的见解。
H3a:随着时间的推移,媒体报道所表达的整体道德的强度或强度与个人报道所表达的整体道德呈正相关。
H3b:平均而言,媒体报道所表达的整体道德程度或强度低于个人报道。
H4a:随着时间的推移,媒体账户所表达的整体情绪的大小或强度与个人账户所表达的整体情绪呈正相关。
H4b:平均而言,媒体账户表达的整体情绪的强度或强度低于个人账户。
道德/情感对社交媒体参与度的影响
过去的研究表明,社交媒体内容中的道德和情感是驱动用户参与行为的关键因素,例如点赞、分享和评论。在信息论中,熵量化了事件传达的信息或不确定性(Shannon,1948)。当一个事件涉及多种可能的结果或微观状态时,不确定性或熵就很高。换句话说,结果的异质性越强,不确定性或熵就越高。相比之下,当一个事件只涉及一个结果或微观状态时(即事件更具确定性),不确定性很低,熵也很低。换句话说,事件的结果越同质,不确定性或熵就越低。根据这个推理,每一种类型的道德基础或情感都可以被解释为一种可能的微观状态。社交媒体帖子中出现的道德基础类型越多,熵就越高。社交媒体帖子中出现的情绪类型越多,熵就越高。或者,可以说,熵越高,帖子中的道德或情感就越异质。上述推理引出了以下研究问题。
RQ:道德/情感语言的异质性与个体性之间有什么关系
三、方法
数据收集和清理
我们使用了关键词组合,并对这三个事件中的每一个进行了事后数据收集(表 1)。我们选择每个事件发生的日期作为数据收集的起点,并选择每日帖子变得零星(即达到数据饱和)的时间作为终点。最终的原始数据集包括元数据(例如,帐户信息和用户响应指标,如点赞和评论)和帖子。删除机器人和重复帖子后,我们的最终数据包含 129 个媒体账户,其中发布了 286 篇关于 SP 的文章,572 篇关于 HJK 的文章,以及 1205 篇关于 MWZ 的文章。
文本挖掘和措施
我们使用分布式词典表示 (DDR, Garten et al., 2018) 来量化帖子中的道德和情感内容。DDR 需要字典、要分析的文本和预先训练的单词嵌入。它使用预先训练好的词嵌入对字典和文本中的词进行向量化,然后计算给定文本与字典中预定义概念(如道德基础、情感)之间的余弦相似度(详见补充材料)。

计算道德负荷
我们通过翻译开发了一本中文道德基础词典,同时使用英文 MFD 的完整和缩写 (Graham et al., 2009, 2018)。我们的词典构建遵循了 Lind et al. (2019) 提出的关键步骤——关键词预选、翻译、关键词评估和评估整体词典性能。我们首先使用缩写的英文 MFD 作为种子,以获得尽可能多的中文同义词。对于每个基金会,我们根据它们在微博上的口语用法将同义词集缩小为四个词。然后,我们将这四个单词回传成英文,并将它们与英文 MFD 的完整版本进行匹配。重复该过程,直到所有 40 个单词在英语 MFD 中都有对应的单词(表 2)。进行了额外的分析以提高可靠性并证明 CMFD 的有效性。

计算情绪负荷
为了最大限度地减少量化道德和情感的方法差异,我们开发了中文情感词典 (CED),其方式与构建 CMFD 的方式相同。我们以这六种情绪为种子词,进行翻译,构建了六本具有相同键的词典(表 3)。


计算道德和情感语言的异质性
我们对每个帖子中表达的道德和情感进行了二值化,随机选择了 100 个帖子,检查了它们的道德和情感负荷,并将多标签帖子的阈值设置为 0.6(道德)和 0.5(情绪)。例如,假设后 A 有三个道德负载超过 0.6,两个情绪负载超过 0.5。在这种情况下,这三个道德维度中的每一个都算 1,其他七个道德维度算 0,两个情感维度中的每一个都算 1,其他四个情感维度算 0。后 A 中道德内容的概率为 0.3 = 3/10,情感内容的概率为 0.33 = 2/6。然后,道德和情感语言的异质性被分别用作道德和情感的熵,使用以下公式进行操作。圆周率表示道德或情感维度出现在帖子中的概率 (i = 1, 2, 3, ... , n)。帖子中存在的道德或情感维度越多,帖子所展示的熵就越高。
四、结果
描述统计
在所有三个事件中,道德情绪(即愤怒、厌恶和恐惧)在媒体和个人账户中的得分都高于非道德情绪(即快乐、悲伤和惊讶)(图 2b)。然而,总体情绪得分低于道德得分。

按事件划分的道德和情感
我们的结果表明,在所有三个事件中,道德情感内容明显比非道德情感内容更普遍,SP 为 (t(8,241) = 190.511,p < .001),HJK 为 (t(4,534) = 151.644,p < .001),MWZ 为 (t(48,237) = 396.387,p < .001)。H2 得到完全支持。
道德和情感对用户参与度的影响
关于点赞数,在 SP 事件中,道德异质性与点赞数 (β = −0.266, p < .001) 和被点赞的几率 (β = −0.545, p < .005) 呈负相关。相比之下,情绪异质性与点赞数的增加呈正相关 (β = 0.389,p < .001),但与被点赞的机会呈负相关 (β = −1.18,p < .001)。当模型达到计算奇点时,我们没有发现道德或情感异质性对事件 HJK 中的点赞有显着影响。对于事件 MWZ,道德异质性 (β = 0.048,p < .001) 和情绪异质性 (β = 0.404,p < .001) 都与点赞数呈正相关,但对获得点赞的机会没有显著影响。
不同行为者在社交媒体话语中的作用
我们发现,在这三个事件中,单个帖子和媒体帖子中每小时汇总的道德和情感内容之间没有延迟。这一发现与第三级议程设置理论相呼应,即媒体和公众对设定彼此的议程有相互影响。这也可能归因于社交媒体上内容更新的频率很高。换句话说,如果时间间隔较短,我们可能会观察到单个帖子的内容与媒体帖子的内容相关,但滞后不同。但是,较短的时间间隔会产生更多的缺失值;未来的研究可以通过使用具有更高时间密度的数据来重新审视这一假设。此外,我们发现,对于事件 HJK 和 MWZ,而不是事件 SP,媒体帖子中的道德和情感内容不如单个帖子中的道德和情感内容强烈。SP 中的非显著结果可能是由于数据点有限 (N = 22),因为我们汇总了 8 小时的帖子以避免缺失值。事件 HJK 和 MWZ 的显著结果表明,媒体账户中的帖子比个人账户中的帖子在道德和情感上更加克制。这可能主要是由于不同的语言风格。媒体账户代表官方声音,倾向于使用更正式的语言;个人账户更口语化,包含更多的脏话、俚语和禁忌词,并且更加情绪化(Breeze,2020 年)。此外,政府对媒体账户进行监管,以道德和情感为特色的媒体帖子受到严格监控和审查。相比之下,每个用户帐户都有自己的语言风格,因此,其道德和情感内容也存在更多变化。
将道德、情感和用户参与度联系起来
我们发现,道德语言的异质性与所有三个事件获得转发的机会(而不是数量)呈负相关。帖子中出现的道德基础类型越多(道德语言越异质),这篇文章被转发的可能性就越小。一篇介绍多种道德基础的帖子对读者来说可能过于压倒性或要求太高,而缺乏对特定道德基础的明确关注可能会阻止读者分享。相比之下,那些道德类型较少但专注于特定道德类型的作品更有可能与读者产生共鸣并被分享。另一方面,情感语言的异质性对所有事件中的转发次数始终有积极影响。尽管如此,它被转发的机会并不那么一致。换句话说,帖子中存在的情绪越异质,它的转发就越多。与道德不同,道德可以同时存在多个基础,一个帖子中存在来自不同价态(即积极和消极)的情绪会引起混淆并削弱表达每种情绪的力量。因此,不同情绪的抵消作用可能是关于情绪和转发之间联系的发现不一致的原因之一。此外,情绪中的效价并不总是平衡的。例如,当有四种消极情绪、一种积极情绪和一种双向情绪(例如,惊喜)时,消极部分就过度成比例了。许多研究广泛证明了负面情绪与转发之间的关系(例如,Stieglitz & Dang-Xuan,2013)。根据我们的研究结果,道德/情感异质性与社交媒体上的用户参与度之间的关系比最初假设的要复杂得多。换句话说,研究结果喜忧参半,道德异质性与评论数量呈负相关,而情感异质性则与此呈正相关。这种差异可能说明了道德和情感的不同性质,它们往往纠缠在一起。

作者信息

YiBei Chen
a Department of Communication, University of California, Santa Barbara, CA, USA

分享者

安静静
jingjing-an.github.io
南京大学新闻传播学院2024级专业硕士研究生

南京大学计算传播学实验中心成员

研究方向:计算叙事、数据分析

计算传播学园
寻找人类传播行为的基因,通往计算传播研究之路
 最新文章