探索新冠疫情期间强制远程工作时的公众情绪

文摘   2024-12-02 12:06   江苏  

『柏拉图说』是由南京大学计算传播学实验中心的成员们于20224月发起的论文精读与推介活动,我们将定期推送新闻传播学TOP期刊最新内容、新闻传播学前沿及相关量化研究方法论文。我们致力于深耕传播学领域,紧跟专业研究热点,延伸学术视角,拓展群体智慧。

柏拉图说 论文推介第 173

Zhang, C., Yu, M. C., & Marin, S. (2021). Exploring public sentiment on enforced remote work during COVID-19. Journal of Applied Psychology, 106(6), 797.

摘要

由于2019年冠状病毒病(COVID-19)大流行,许多员工被强烈鼓励或要求在家工作。本研究通过分析2020330日至75日的Twitter数据,试图了解公众对远程工作的态度和经历。我们使用远程办公在家工作远程工作等关键词从网络上抓取了超过100万条推文,并使用自然语言处理(NLP)技术分析了内容。情绪分析结果显示,与远程工作相关的推文普遍表达了积极的态度,周末略有下降。主题建模结果揭示了推文中的主题,包括家庭办公、网络安全、心理健康、工作与生活的平衡、团队合作和领导力,14周期间主题略有变化。研究结果指出了关于在家工作的特别令人担忧的主题,并有助于指导未来研究的假设生成。

介绍

Covid-192020年初给全球范围内的很多国家带来了影响。众多国家执行了封禁政策,由于封锁使人们呆在家里,大多数企业一直在尝试在家办公(WFH)的概念,将不是那么重要的员工安排在家进行远程工作。远程工作是一种工作安排,员工居住和工作地点位于雇用组织工作地点当地通勤区域之外。这种安排通常包括全职远程工作,并可能导致工作地点变更为替代工作地点。除此之外,也包括一些其他的术语,如telework, telecommuting, distributed work等等。

作为一种大规模的社会改变,研究人们对强制远程工作的情绪很有必要,这种强制性的远程工作相较于传统的远程工作有两个区别:第一,传统的远程工作人员的工作时间是一部分远程在家工作,另一部分前往办公室工作;第二,传统的远程工作人员做出(远程工作)这一行为考量于自己的偏好和实际情况。相反,现在的情况是很多非必要的部门都会鼓励或要求他们的员工远程工作,因此,他们面临着独一无二的挑战。

考虑到Covid-19带来的巨大影响,本研究的目标有两个:第一,这是一项大规模的努力,旨在调查目前对远程工作的看法和反应尚未得到充分研究。第二,旨在确定远程工作带来的好处和挑战。预计到2021年底,在新冠疫情结束后,相当一部分劳动力(25-30%)将继续至少部分地远程工作。因此,本研究的结果可以为远程工作的文献做出理论贡献,同时也可以让组织了解远程工作的主要优点和缺点,其中一些可能会影响未来的人力资源管理决策。

远程工作的影响

研究人员指出了远程工作的悖论。一方面,它可以增加员工工作方式和地点的灵活性,提高感知到的工作自主性,从而改善与工作相关的态度和绩效;另一方面,远程办公可能会增加工作与生活界限的渗透性,增加工作负担和角色模糊性,导致疲劳和与同事关系恶化等负面后果。另外,个人差异(如对经验的开放性、工作以外的社会联系和成就需求)可能会缓和对员工幸福感。过去的研究主要关注远程工作与结果之间的联系,但研究结果往往源于研究人员对员工工作体验可能受到何种影响的猜测。人们对远程工作的主观看法指出了诸如工作时间灵活性、更少通勤和自主性等好处,以及诸如抵制变革和缺乏远程工作采用知识等障碍。公众的见解可能会凸显传统上被忽视的问题。

理论基础:资源保护理论与劳动力情绪

资源保护理论(COR)提供了一个框架来探索公众对远程工作的看法。COR理论认为,个人有动力去保护现有资源、获取新资源并防止资源流失。资源是个人认为有助于实现其目标的任何事物,大致定义为帮助个人自我调节以实现目标的物体、状态、条件等,通常包括社会和组织支持、工作自主权、自我发展机会、休息和喘息以及家庭友好的工作场所政策。资源的价值与个人经历息息相关。资源的保护和培养与积极的幸福感有关,而资源的损失则与心理困扰、焦虑和抑郁有关。随着工人转向远程工作,他们可能不仅在工作中失去资源(例如,缺乏同事支持),而且在生活中也失去资源(例如,社会孤立、缺乏服务)。COR理论研究不足的领域包括识别工人认为有价值的资源,以及资源通道,后者指的是改变资源损失或获得速度的环境条件。

随着远程工作变得越来越普遍,研究远程工作相对于传统工作模式的好处(收益)以及挑战和障碍(损失)将非常有价值。彻底了解这些经验可以帮助组织为其成员做好远程工作的准备。因此,我们不会集中讨论远程工作的某些特定后果,而是采取自下而上的方法,在社交媒体上抽样调查有关在家工作的讨论,以了解关于远程工作的广泛意见和担忧。

数据:推特作为一种用来捕获社会情绪的数据来源

尽管Twitter用户并非总人口的完美人口代表,但新冠疫情已使更多人通过数字和社交媒体进行交流,数量创下了历史新高。事实上,Twitter用户群在2020年第二季度增长了34%,达到平均每日1.86亿活跃用户。他们预计的每日用户活动似乎正在大幅增长,同时越来越多的员工正在转向在家办公。这为从公众那里了解对远程工作的看法提供了一个独特的机会,其中很大一部分人自己可能也在远程工作。

有机数据是在没有任何明确研究设计元素的情况下生成的,其特点是结构性较差、连续生成的数字数据,可以自动提取用于各种研究目的。在考虑不同的采样方法时,有机Twitter数据比调查等替代方法更符合本研究的目标。EdmondsonMcManus (2007)提出,使用定性数据的探索性分析与新兴理论和研究的方法更契合。虽然与资源变化及其对福祉的影响相关的基本概念已经得到充分研究和成熟,但与远程工作相关的特定资源以及加强这些资源的背景通道标志着COR的较新兴元素。

因此,Twitter数据的有机性质可能对本研究特别有利。由于COVID-19而进行的远程工作体验可能与传统的远程工作不同。研究人员设计的调查将不可避免地局限于现有知识或推测,许多细微差别可能会丢失。Twitter提供了对大量开放式数据的访问,以探索开放式问题,例如对远程工作的普遍情绪和态度。通过Twitter的应用程序编程接口(API)抓取的数据不仅可以立即访问推文,而且只能在指定的时间范围内(例如,在提取后的几天内)从每个用户提取一条推文,这意味着数据受每日或每周大量推文的影响较小。在分析方面,主题建模对于理论构建特别有价值,包括检测新颖性和突发性以及分析在线受众(Hannigan等人,2019年)。因此,在社会工作结构发生重大变化的时代,收集和分析有机数据比对任何单个样本进行调查具有更容易获取、规模更大、更及时的优势。当然,这种方法并非没有缺点。有机数据的大小、丰富性和及时性是以减少实验控制为代价的。此外,Twitter用户可能无法代表整个人口,我们无法区分远程工作者和非远程工作者的反应。

本研究利用NLP技术,即情绪分析和主题建模,对COVID-19疫情爆发期间的Twitter数据进行分析。情绪分析通常用于根据作者所写的文本探索作者的观点和态度,方法是根据从负到正的尺度对组成词的效价进行评分(Feldman, 2013),并用于研究以下研究问题:1.公众对远程工作的总体情绪是什么?2.COVID-19疫情期间,远程工作情绪会发生变化吗?主题建模是一种无监督机器学习技术,用于根据文本中单词的含义和共性生成语义类别,并用于研究以下问题:3. Twitter帖子表达的一些与远程工作相关的常见主题是什么?具体来说,哪些主题与远程工作的好处(资源收益)有关?哪些主题与远程工作的挑战(资源损失)有关?

方法

数据收集和预处理

用推特APItwitterR2R包,我们获得了2020330日至7514周期间发布的推文,搜索词包括teleworkremote workwork from home及其派生形式、WFH等各种缩写词以及所有词的hashtag版本。排除了转发和非英文推文,共有672,931个独立个体的1,364,742条推文。接着,在分析之前对原始数据进行预处理,包括通过词典Rpackage将表情符号和表情符号替换为其相应的单词含义,以及将缩写和缩写替换为其扩展形式。所有文本都转换为小写,并删除了URL、数字、标点符号和空格。然后对所有单词进行词形还原,对其标注为单字词和双字词。

情感分析

情绪分析将推文分为从负面到正面的连续类别。通过参考三个单独的预训练情绪词典的组合,为每个token分配情绪值:SenticNetSentiWordNetSlangSD。这三个情绪词典来自词典R包(Rinker2019年)。每条推文的情绪计算为每条推文的标记情绪的平均值。为了评估在COVID-19危机不断发展期间数据收集期间可能出现的变化,将单个推文的情绪汇总为每日情绪值,计算为每天生成的推文的平均情绪。

主题模型

通过将单个单字或双字短语视为独立的,并将它们分组为具有语言意义的变量而不考虑词序,进行词袋建模以发现语义主题。删除仅由无信息停用词组成的标记(例如,the),以降低提取无信息主题的可能性。创建了一个稀疏标记计数矩阵,列中是token,行中是推文,单元格中是每个token在每条推文中出现的次数。为了确保模型收敛,删除了出现在少于1,000条推文中的极其稀疏的词(即少于0.08%)。不再包含任何token的推文也被删除。常见词的频率可以在图1中找到。最常用的词包括muchgooddaytimecovid,每个词占所有分析词的1%1.5%28%的推文包含这五个最常用词中的至少一个。常用的工作相关词包括officeteamjobbusinessemployeecompany


主题模型用每周的推文(周一至周日)进行训练,以平衡对主题随时间变化的调查与计算时间。使用stm R包估计主题模型,并使用潜在狄利克雷分配的谱算法初始化主题模型,这是stm作者对大量文档建模的建议。此外,由于要评估的模型数量众多,因此使用MimnoLee2014年)方法在算法上设置要提取的主题数量。14个每周模型平均包含69个主题(最小值= 51,最大值= 99)。

每个模型的主题按其在推文中的平均概率或分布(θ)排序,每周的前50个主题都经过定性编码。对于每个主题,论文的第一作者和第三作者尽可能独立地分配标签,方法是检查根据主题内的词概率(即,建模的词在主题内的可能性)确定的前八个词和根据频率和排他性(FREX)(给定主题内的词频的调和平均值和给定主题的词的排他性;Bischof & Airoldi2012)确定的前八个词。例如,在一个主题中,基于概率的前八个词包括团队、管理、构建、客户、项目、经理、成员、您的团队,而基于FREX的前八个术语包括构建、管理、管理、构建、远程团队、构建、分发和管理。两位编码员都将此主题标记为团队管理69%的主题标签达成一致,然后通过与第二作者讨论解决分歧。三位作者均未给出有意义标签的主题被排除在结果之外。

研究结果

情感分析

下图2显示了按天划分的推文情绪值。平均情绪略显积极,每日变化相对较小。然而,按星期几检查趋势会发现一个周期性模式,即对远程工作的情绪在工作日保持稳定,在周末(即周六和周日)略有下降。对推文情绪值进行二分回归分析(工作日与周末变量)表明,周末与工作日发布的远程工作相关推文的情绪不太积极,在统计上存在显著差异,但实际上差异很小(B = −.009p < .001)。


为了调查这种星期几模式是否只是一般推文情绪的一个特征,我们确定了一个公共推文数据集,其中包含160万条不针对任何特定主题的一般推文(Go等人,2009年)。虽然这是一个相对较旧的数据集,包含200946日至67日期间发布的推文,但它规模很大,已经标注了情绪值,并且代表了推文内容的广泛快照,因此可以作为此目的的合理基准比较。图3显示,这些普通推文之间没有可区分的每周模式。此外,相同的回归模型表明,工作日和周末发布的推文并不能显著预测其情绪(B = −.000p = .980)。


主题模型

为方便视觉理解,主题模型结果以词云形式显示,词云由Rwordcloud2创建,每个主题根据各自的θ值加权。图4显示了在此期间出现的前50个主题的词云。总体而言,根据我们的搜索参数的定义,与在家工作(WFH)特别相关的主题在此期间最为常见,包括明确提到在家工作或远程工作,以及更具体的主题,包括生产力、灵活性、技术问题、家庭办公室设置、电话会议和网络安全。建议主题也很常见,通常包括博客、网络研讨会和其他远程学习机会的链接。ablestill这两个术语经常搭配在一起,表示仍然能够[做某事]”,包括工作和WFH。大家还经常讨论与COVID-19相关的话题,包括COVID-19本身、社交距离、新常态、居家/安全,以及由于COVID-19带来的工作相关挑战,包括心理健康、工作与生活的平衡、缺乏结构、基本工作、寻找工作、业务连续性和重返办公室。


随周变化的主题

我们评估了每周的热门话题,以确定突出话题是否以及如何随时间变化(图5)。每周最突出的话题相当稳定,换句话说,人们在疫情和社交疏离令开始时关注或经常讨论的话题在几个月后仍然很流行。接下来,我们仅提取每周前50个主题中确定的新主题(图6)。每周都有几个主题是独一无二的,主要描述各自每周的时事。除了与时事相关的话题外,每周的许多新话题在主观上仍然与第一周确定的许多话题相关,但有些似乎代表了人们不断发展的想法,即疫情不会是一个短暂的问题。


后续研究

由于情绪分析显示,与工作日相比,周末的积极情绪略有下降,但统计上显著,因此我们建立了单独的主题模型来比较工作日和周末发布的推文(图7)。结果表明,工作日讨论的话题与周末讨论的话题有相当大的重叠,涵盖了之前关于每周主题描述的主题范围。我们建立了额外的主题模型来调查情绪值为负(大于零下1个标准差[SD])、情绪值为中(介于零下1个标准差和零上1个标准差之间)和情绪值为正(大于零上1个标准差)的推文之间讨论的主题差异(图8)。结果表明,虽然带有消极、中性或积极情绪的推文之间的主题有所不同,但从这些主题模型来看,工作日和周末推文之间的情绪差异并不明显,因为工作日和周末推文之间的情绪差异实际上很小。


结论与讨论

鉴于COVID-19疫情对员工的影响是前所未有的,因此,了解人们对远程工作的感受和看法符合组织的最大利益。本研究使用Twitter数据的NLP技术,特别是情绪分析和主题建模,来评估公众在COVID-19疫情期间对远程工作的态度、看法和想法。研究结果强调了公众认为远程工作具有的一些常见好处和挑战,这些好处和挑战对于不得不远程工作的员工尤其重要(例如,当整个工作团队都是虚拟的或无法搬迁时)。随着远程工作成为一种更常见的工作模式,更好地了解过渡到远程工作可能带来的资源收益和损失将有助于组织在未来更好地应对这种情况。

为了根据COR理论评估资源的得失,我们重点关注了可能突出在家工作带来的好处或挑战的主题关于远程工作的好处,推文提到协作和通信工具的可用性有助于从面对面过渡到虚拟连接。许多人认为远程工作有利于提高他们的工作效率。他们还表示享受参与远程学习和灵活工作的机会。最后,推文提到能够通过技术与他人保持联系。这些主题指出了远程工作可能获得的资源(例如灵活性、生产力、社交联系)以及实现此类资源收益的通道(例如技术工具)。另一方面,推文还强调了几个描述远程工作相关困难或挑战的主题。推文提到长时间的电话会议可能会让人精疲力竭,个人远程工作的能力受到不理想的家庭办公室设置或不良互联网连接的阻碍。与COR理论一致,我们的研究结果确定了在家工作在结构和灵活性、工作与生活平衡、人际关系以及可能影响资源变化轨迹的资源通道方面获得的或损失,包括技术的可用性、技术的使用和育儿职责。虽然有些主题与传统研究的主题相吻合,但其他主题为未来的研究方向提供了启示。例如,远程工作时的心理健康体验似乎因人而异。进一步的研究应该研究远程工作者面临的具体心理健康挑战、导致某人特别容易经历幸福感下降的因素,以及针对这些挑战的潜在干预措施或保障措施。另一个例子是强调领导力和团队合作。过去的研究通常将远程工作和不远程工作的人视为两个不同的群体,而忽视了组织环境的网络性质。疫情引发的远程工作凸显了考虑领导力和团队合作等单位级行为的重要性。


主要作者介绍

Charlene Zhang

PhD in Industrial and Organizational Psychology with quantitative research focusing on personnel selection and training, personality, biodata, situational judgment tests, student and employee performance, research methodology, and psychometrics.

Skilled in data management and analytics, psychometrics, research design and methodology, and statistical programming.



分享者介绍

黄靖翔

https://huang-jingxiang.github.io/

raconz1211@gmail.com

南京大学新闻传播学院2024级专业硕士研究生
南京大学计算传播学实验中心成员

研究方向:计算传播、自然语言处理


计算传播学园
寻找人类传播行为的基因,通往计算传播研究之路
 最新文章