点击关注“政治学评介”获取更多资讯
编者按
实验方法在社会科学研究中发挥着越来越重要的作用。本文设计了一个非常有趣的对照实验,在公司中考察了居家办公对于员工离职率与工作绩效的影响。一方面,实验在新冠疫情期间展开,将应对疫情的特殊措施推广为一种新型且极为有利的工作模式,消除了管理者对于居家办公的疑虑,更为工作者提供了更为便利的办公体验。另一方面,本实验的设计也有得天独厚的优势,借助携程网的天然试验场地与携程网创始人梁建章的协助,本文积累了丰富且十分有价值的数据,为实验结果提供了强有力的支持。因此,无论从研究意义还是研究方法来看,本文所进行的实验都极具价值。这些实验结果可以通过文末提供的实验的数据与代码进行重现。此外,本文一些段落的行文也极为有趣。
PS:顶刊译评由政治学评介外文编译团队义务提供,团队坚持分享、翻译学界研究成果,旨在方便大家了解更多的学术资讯,为促进国内政治学特别是比较政治学的发展略尽绵薄之力。如有任何意见和建议请多多批判指正,期待您在后台给我们公众号留言,或添加政治学评介的官方编辑部微信-政评君(Z-Pjun)。我们也诚邀志同道合的学友加入我们,共同领略政治学的风采,为学术公益贡献力量。
作者介绍
Nicholas (Nick) Bloom 是斯坦福大学William D. Eberle经济学教授、SIEPR 高级研究员,以及美国国家经济研究局生产力、创新和创业项目的联合主任。他的研究重点是管理实践和不确定性。
Climate Policy 和 Socio-Economic Review上。
韩若冰是香港中文大学(深圳)经济学院的助理教授,从斯坦福大学获得经济学博士学位。他的专业领域是量化营销,同时他对产业组织和应用微观经济学以及中国经济的动态也有浓厚的兴趣。除了学术研究,他热爱阅读并在业余时间喜欢打篮球
梁建章(James Liang),人口经济学家。现为携程集团联合创始人、董事局主席,北京大学光华管理学院教授,全球化智库资深副主席。美国斯坦福大学经济学博士,佐治亚理工学院计算机硕士,复旦大学首届 (1985级) 少年班毕业 。1991年至1999年,曾在美国甲骨文公司美国总部和中国分公司任职。1997年至1999年,任美国甲骨文中国分公司ERP咨询部门总管理人员。1999年梁建章先生参与创建携程旅行网,自2003年起担任携程集团董事局主席,并于2000至2006年间和2013至2016年间,担任携程集团首席执行官。
文章来源
Bloom, N., Han, R. & Liang, J. Hybrid working from home improves retention without damaging performance. Nature 630, 920–925 (2024).
期刊简介
英国著名杂志《Nature》是世界上最早的国际性科技期刊,自从1869年创刊以来,始终如一地报道和评论全球科技领域里最重要的突破。
居家办公已成为拥有大学学历员工的一种标准工作模式。在欧洲和北美,最为常见的方案是混合办公模式,大约有1亿员工采用这种模式,即员工每周在家中和工作场所各工作几天。然而,混合居家办公对员工和企业的影响一直存在争议,一些管理人员认为这种模式损害了生产力、创新和职业生涯的发展。在此,我们进行了一项为期六个月的随机对照试验,研究了2021年至2022年间在中国一家科技公司的1612名员工中混合居家办公的效果。我们发现,混合居家办公提高了工作满意度,并将离职率降低了三分之一。对于非管理人员、女性员工和通勤时间较长的员工,离职率的降低尤为显著。基于零等价检验(null equivalence test),我们发现混合居家办公在接下来的两年绩效评审中并未影响绩效等级,并且也没有证据可以表明整体员工或任何主要的员工群体在晋升方面存在差异。最后,零假设等价检验显示,混合居家办公对员工中的计算机工程师的编写代码行数没有影响。我们还发现,在实验过程中395名管理人员改变了关于混合工作制对生产力的影响的看法,从实验前认为会产生负面影响(平均为-2.6%)转变为实验后认为会产生正面影响(+1.0%)。这些结果表明,每周两天居家办公的混合办公模式并不会损害绩效。
主要内容导读
新冠疫情后,居家办公(WFH,Working from home)现象激增,2023年期间,大学毕业的员工通常每周居家办公一至两天。以往关于居家办公的因果研究多集中于完全远程办公的员工,他们通常在客服中心、数据录入和服务台等岗位独立进行工作。这些研究发现,完全远程办公对生产率的影响往往是负面的,因此有人呼吁减少居家办公。然而,在解释这些研究时存在两个重要的问题。首先,全球超过70%的居家办公员工采用的是混合居家办公,这一群体超过1亿人,最常见的办公模式为每周三天在办公室、两天在家办公。其次,大多数经常居家办公的员工是在科学、法律、金融、信息技术(IT)和其他行业中从事重要的创新型团队工作的大学毕业生,他们的工作并非是重复性的数据录入或客服处理任务。
本文从两方面弥补了以往研究的不足。首先,我们采用了随机对照试验的方法,研究了员工每周居家办公两天的混合居家办公的因果效应。其次,本研究聚焦于大学毕业的软件工程、市场营销、会计和金融领域的员工,他们主要从事创新性的团队工作。
我们的研究进行了一项从2021年8月开始至2022年1月结束的随机对照试验,参与试验的有Trip.com(携程网,一家大型中国旅游科技跨国公司)机票和IT部门的1612名大学毕业员工。员工按照出生日期为奇数或偶数被随机分配,其中一半为采用混合居家办公(每周三和周五居家办公,其余三天到办公室上班)的实验组和另一半为全部五天到办公室上班的对照组。
我们发现,在混合居家办公组(实验组)中,人员流失率下降了三分之一(meancontrol = 7.20,meantreat = 4.80,t(1610) = 2.02,P = 0.043),工作满意度得分也有所提高(meancontrol = 7.84,meantreat = 8.19,t(1343) = 4.17,P < 0.001)。员工表示,居家办公节省了通勤时间和成本,使他们能够在白天灵活地处理的个人事务(在晚上或周末补上)。对于非管理人员(meancontrol = 8.59,meantreat = 5.33,t(1215) = 2.23,P = 0.026)、女性员工(meancontrol = 9.19 meantreat = 4.18 t(568) = 2.40 P = 0.017)和通勤时间长较长(高于中位数)的员工(meancontrol = 6.00 meantreat = 2.89 t(609) = 1.87 P = 0.062),人员流失率显著地降低了。
同时,根据零假设等价检验,我们发现没有任何证据表明员工的绩效考核受到显著影响,也没有证据表明在长达两年的时间里员工的晋升率存在差异(“方法”章节中的 “零假设结果 ”部分)。我们还发现,实验前后,非管理人员和管理人员对居家办公对生产率影响的看法存在显著差异。实验前,管理人员倾向于认为混合居家办公会对生产率产生负面影响(-2.6%),而非管理人员则持有更积极的看法(+0.7%)(t(1313)=-4.56,P<0.001)。实验后,管理人员的看法转变为正面(+1.0%),与非管理人员的看法(1.62%)趋于一致(t(1343)=-0.945,P=0.345)。这表明混合办公的实际体验改变了人们的看法,这与亚洲、美洲和欧洲在疫情期间的整体经验一致,这些地区的人们在疫情后对居家办公的看法有了显著改善。
实验在携程网进行,该公司在2019年是全球第三大旅游代理商(按销售额计)。携程网成立于1999年,2003年在纳斯达克上市,实验时市值约为200亿美元。公司总部设在上海,在中国其他地区和国际上设有办事处,拥有约35000名员工。
2021 年夏天,携程网决定评估混合居家办公对其机票部门和 IT 部门 1612 名工程、营销和财务人员的影响,其中包括 395 名管理人员和 1217 名非管理人员。所有参与实验的员工都接受了基线调查,调查内容包括员工的期望、背景以及是否有兴趣自愿提前参与实验。公司将生日为奇数(出生在每月的第一天、第三天、第五天,以此类推)的员工随机编入实验组。
图 1:携程网员工在现代化的开放式办公室工作,团队成员坐在一起。
图1展示了两张员工在办公室工作的照片,其中有三个重点。首先,在 2021 年下半年,新冠在上海的发病率非常低,员工在办公室既没有戴口罩,也没有保持社交距离。虽然新冠疫情曾导致 2020 年初和 2022 年期间的封锁,但在 2021 年下半年,上海的员工可以自由上班,而且通常在办公室都不戴口罩。其次,员工在现代化的开放式办公室工作,同一团队的 4 至 6 名同事共用一张办公桌,体现了对于协作的重视。第三,办公室是一座大型现代化建筑,与许多亚洲、欧洲和北美的大型办公室相似。
携程网开展实验的一个主要动机是评估混合居家办公对员工人员流失和工作满意度的影响。实验的净效果是,在此期间,人员流失率降低了 2.4%,与对照组 7.2% 的基数相比,人员流失率降低了三分之一(33%)(meancontrol = 7.20,meantreat = 4.80,t(1610) = 2.02,P = 0.043)。与辞职率的降低相一致,实验组的员工在工作满意度调查中也给出了更积极的回应(meancontrol = 7.84,meantreat = 8.19,t(1343) = 4.17,P < 0.001)。在 2022 年 1 月 21 日对员工进行的匿名调查中,实验组员工在“工作与生活的平衡”、“工作满意度”、“生活满意度”和“向朋友推荐”方面的得分明显高于对照组,而在“辞职意向”方面的得分明显低于对照组。
实验组辞职率较低的一个可能的解释是,因为对照组人员对被随机排除在实验之外感到恼火,所以相较于他们的辞职率,实验组的辞职率较低。然而,在实验前六个月,机票部门和 IT 部门的辞职率为 9.8%,高于对照组在实验期间的辞职率。另外两个我们有数据的部门(商务旅行和市场营销)在实验期间的辞职率分别为 10.5% 和 9.8%,同样高于对照组在实验期间的辞职率。这表明,如果说实验降低了对照组的辞职率,而不是增加了辞职率的话,这可能是因为他们中的一些人猜测(猜对了),一旦实验结束,这项政策就会推广到所有员工。
图2显示了将数据进行三次拆分后分别得出的人员流失率变化情况。首先,我们分别考察了对 1217 名非管理人员和 395 名管理人员的人员流失的影响。我们发现,非管理人员的人员流失率明显下降了 3.3 个百分点,与对照组 8.6% 的基数相比,下降了 40%(meancontrol = 8.59,meantreat = 5.33,t(1215) = 2.23,P = 0.026)。相比之下,管理人员的人员流失率出现了不明显的增长(meancontrol = 2.96,meantreat = 3.13,t(393) = -0.098,P = 0.922)。我们还发现,非管理人员更热衷于参与试验,自愿参与率为 35%(而管理人员为 22%),这与媒体的观点一致,即虽然非管理人员热衷于居家办公,但许多管理人员并不热衷(t(1610) = 4.86,P < 0.001)。
图 2:居家办公总体上减少了 33% 的人员流失,对非管理人员、女性和通勤时间较长的人员的影响尤为明显。
该数据包括了截至 2022 年 1 月 23 日的 1612 名员工人员流失数据。左上方为所有员工。只有 1259 名员工填写了关于通勤时长的基线调查问题,因此通勤时长(往返)样本为 1259 名员工。对照组和实验组的样本量分别为 820 人和 792 人;非管理人员和管理人员的样本量分别为 1217 人和 395 人;女性和男性的样本量分别为 570 人和 1042 人;通勤时间短的员工和通勤时间长的员工的样本量分别为 648 人和 611 人。对照组和实验组之间各组内人员流失difference的双尾 t 检验结果为(difference = 2.40,s.e. = 1.18,confidence interval (CI) = [0.0748,4.72],P = 0.043);非管理人员组(difference = 3.26,s.e. = 1.46,confidence interval = [0.392,6.12],P = 0.026);管理人员组(difference = -0.169,s.e. = 1.73,confidence interval = [-3.57,3.23],P = 0.922);非管理人员组(difference = 5.01 s.e. = 2.08 CI = [0.915 9.10], P = 0.017);女性(difference = 0.997 s.e. = 1.43 CI = [-1.82 3.81], P = 0.487);男性(difference = 2.61 s.e. = 1.93 CI = [-1.19 6.41],P = 0.178);通勤时间为中位数(90 分钟,往返)或更短的员工(difference = 3.11,s.e. = 1.66,CI = [-0.156,6.37],P = 0.062);通勤时间高于中位数(90 分钟,往返)的员工(difference = 3.11,s.e. = 1.66,CI = [-0.156,6.37],P = 0.062)。
其次,我们研究了通勤总时长对人员流失的影响,根据通勤总时长的中位数(往返通勤时间在 1.5 小时或以下与超过 1.5 小时的员工人数分别为 648 人和 611 人),将样本分为通勤总时长较短的员工和通勤总时长较长的员工。我们发现,通勤时间较长的员工的辞职率降低幅度更大(52%)(meancontrol = 6.00,meantreat = 2.89,t(609) = 1.87,P = 0.062)。如果我们将通勤时长较长定义为往返通勤时间超过 2 小时,那么通勤时长较长的员工的辞职率同样会大幅下降(meancontrol = 7.33,meantreat = 1.89,t(307) = 2.31,P = 0.021)。自愿参加实验的员工的单程通勤时间更长(meannon-volunteer = 0.80,meanvolunteer = 0.89,t(1257) = -3.68,P <0.001)。这并不奇怪,因为居家办公最常被提及的好处就是不用通勤。
第三,我们对 570 名女性员工和 1042 名男性员工分别进行了调查,研究了不同性别对人员流失的影响。我们发现,女性员工的辞职率降低了 54%(meancontrol = 9.2,meantreat = 4.2,t(568) = 2.40,P = 0.017)。男性员工的辞职率虽然降低了 16%,但结果并不显著(meancontrol = 6.15,meantreat = 5.15,t(1040) = 0.70,P = 0.487)。将女性辞职率的降低与之前的研究结果联系起来,这些研究表明女性比男性更看重居家办公。值得注意的是,尽管居家办公对女性员工的实验效果更加显著,但自愿参与者中的女性比例较低(meannon-volunteer = 0.37,meanvolunteer = 0.32,t(1610) = -2.02,P = 0.043);这可能表明,女性更担心参与居家办公的实验会给他人一种信号,是她们被认为对职业工作的态度较为负面。
对于携程网而言,另一个关键问题是混合居家办公对员工绩效的影响。为了衡量这种影响,我们设计了四种绩效衡量标准:六个月一次的绩效考核、实验开始后两年内的晋升结果、详细的绩效评估以及计算机工程师编写的代码行数。我们还收集了实验参与者在实验前后对混合居家办公对生产力的影响的自我评价,以评估员工的看法。
在携程网内部,绩效考核非常重要,因为它决定着员工的薪酬和职业发展,因此要谨慎进行。每位员工的绩效考核流程都建立在其管理人员、同事、直接下属的正式评估,以及在适当情况下由客户提供的正式评估的基础之上。这些评估由相关人员进行审核,并由管理人员和人力资源团队进行整理,然后由管理人员和员工进行讨论。这一漫长的过程耗时数周,为衡量员工绩效提供了可靠的依据。尽管这些评估并不完美,但它们关系到员工的薪酬和职业发展,管理人员和员工都为制定这些翔实的绩效衡量标准付出了大量努力。
图3报告了实验组和对照组员工在四个半年期内的绩效等级分布情况:2021 年 7 月至 12 月、2022 年 1 月至 6 月、2022 年 7 月至 12 月和 2023 年 1 月至 6 月。这四次绩效考核的时间跨度为实验期开始后的两年。在所有绩效考核期间,我们发现实验组和对照组的考核结果均无差异(“方法”中的 “零假设结果”部分)。
图 3:居家办公对接下来两年的绩效考核没有显著影响。
数据包括了2021 年 7 月至 12 月对 1507 名员工进行绩效考核的结果、2022 年 1 月至 6 月对 1355 名员工进行绩效考核的结果、2022 年 7 月至 12 月对 1301 名员工进行绩效考核的结果以及 2023 年 1 月至 6 月对 1254 名员工进行绩效考核的结果。由于原实验样本中员工的离职,样本量随时间有所减少。在对每个字母等级赋予从 1(D)到 5(A)的数值后,对对照组和实验组在每个时期内的绩效差异进行双尾 t 检验,结果如下:2021 年 7 月至 12 月(difference = 0.056,s.e. = 0.043,CI = [-0.029,0.14],P = 0.198);2022 年 7 月至 12 月(difference = 0.034,s.e. = 0.044,CI = [-0.0529,0.122],P = 0.440);2022 年 1 月至 6 月(difference = -0.019,s.e. = 0.046,CI = [-0.11,0.072],P = 0.677);2023 年 1 月至 6 月(difference = 0.046,s.e. = 0.051,CI = [-0.054,0.146],P = 0.369)。“方法”中的 "零假设结果 "部分包含了零假设等价检验。
图4显示了同一时期内实验组和对照组员工晋升结果的分布情况。我们看到没有证据可以表明实验组和对照组员工的晋升率存在差异。鉴于有其他研究认为完全居家办公会损害员工的发展和晋升,我们的这一个结果较为重要。
数据包括了1522 名员工在 2021 年 7 月至 12 月的晋升结果、1378 名员工在 2022 年 1 月至 6 月的晋升结果、1314 名员工在 2022 年 7 月的晋升结果至 12 月以及 1283 名员工在 2023 年 1 月至 6 月的晋升结果。由于原实验样本中员工的离职,样本量随时间有所减少。对照组和实验组在每个时期内的晋升差异的双尾 t 检验结果为:2021 年 7 月至 12 月的晋升差异为(difference = -0.86,s.e. = 1.34,CI = [-3.51 1.74],P = 0.509);2022 年 7 月至 12 月的晋升差异为(difference = 0.12,s.e. = 0.85,CI = [-1.54 1.78],P = 0.892);2022 年 1 月至 6 月的晋升差异为(difference = -0.51,s.e. = 1.12,CI = [-2.72 1.70],P = 0.651);2023 年 1 月至 6 月的晋升差异为(difference = -0.99,s.e. = 1.02,CI = [-2.99 1.00],P = 0.328)。“方法”部分中的 "零假设结果 "部分包含了零假设等价检验。
我们还对各种员工进行分组,分析了他们的绩效等级和晋升结果在实验中受到的影响,包括管理人员、实验组中有上级管理人员的员工、工龄较长的员工、通勤时间较长的员工、女性员工、有子女的员工、计算机工程师和住得较远的员工,并研究了网络速度是否有影响。我们发现没有证据显示这些群体对实验的反应存在差异。
实验还分析了员工绩效的另外两个衡量标准。首先,携程网的绩效考核有“创新”、“领导力”、“发展”、“执行力”等(共九个类别)有关个体行为的项目,而这些项目式是员工个人非常重要的职责。我们收集了这些数据,并对四段为期六个月的绩效考核的成绩进行了分析。这九个主要类别中我们发现并没有证据可以显示这四段绩效考核期有所差别。这说明,在更需要软技能或团队合作的考核类别中(如开发和创新),没有证据可以表明混合居家办公在随机试验中会产生实质性影响。其次,对于 653 名计算机工程师,我们收集了每位工程师每天上传代码行数的数据。就“提交代码行数”这一指标而言,我们发现对照组和实验组员工之间没有差异( “方法”中的 "零假设结果 "部分)。
2021 年 7 月 29 日和 30 日,所有实验参与者在实验前都接受了基线调查,其中包括一个两部分递进的问题,这个问题有关于他们对混合居家办公对工作效率的影响的看法。员工被问及“您预计混合居家办公对生产率有何影响?”,有“积极”、“没有”或“消极”三个选项。选择“积极”答案的员工需要继续回答一组选项,有关于他们认为的“积极”的程度,选项从[5% 到 15%] 到[35% 或更多],选择“消极”答案的员工也与之类似。对于总体影响,我们选取每个分组范围的中点,此外,大于 35% 取 42.5%,小于 35% 取 -42.5%。在 2022 年 1 月 21 日实验结束后,我们用同样的问题再次对员工进行了调查。
图5左侧面板显示,员工在实验前对居家办公和生产率的看法差异极大。平均值基线为-0.1%,但存在普遍的偏差(标准偏差为 11%)。对于任何在居家办公对生产率影响的讨论中支持积极的观点的人来说,这种差异都不足为奇。在 2022 年 1 月 21 日进行的端线调查中,这些看法的平均值显著增加到 1.5%,这表明混合办公的经历使员工对混合办公对生产率影响的平均看法有了小幅改善(meanbaseline = -0.06%,meanendline = 1.48%,t(2658) = -3.84,P <0.001)。这可能是因为混合居家办公节省了员工的通勤时间,减少了员工的体力消耗,而且在集体工作和更加安静的个人工作之间有间歇休息,可以提高工作绩效。
图 5:实验之后,人们对居家办公对生产率的影响的看法有所改善,尤其是管理人员。
基线样本为 1315 名员工(314 名管理人员,1001 名非管理人员),端线样本为 1345 名员工(324 名管理人员,1021 名非管理人员)。在赋予与桶中点相对应的数值后,对基线与端线之间的生产率预期差异进行了双尾 t 检验(baseline mean = -0.058,end-line mean = 1.48,difference =-1.54,s.e. = 0.40,CI = [-2.33,-0.753],P <0.001)。管理者与非管理者生产率期望值基线差异的双尾 t 检验为(difference = -3.28,s.e. = 0.72,CI = [-4.69,-1.86],P <0.001),端线差异的 t 检验为(difference = -0.571,s.e. = 0.604,CI = [-1.76,0.615],P =0.345)。
图 5 右侧面板显示,在基线调查中,管理人员认为混合办公对其工作效率的影响是负面的,平均影响为-2.6%。相比之下,非管理人员的看法则要积极得多,在基线调查中为 +0.7%(meannon-manager = 0.7%,meanmanager = -2.6%,t(1313) = -4.56,P < 0.001)。实验结束时,管理人员的看法向积极转变(提升至1.0%),而非管理人员的平均值则为 1.6% ,也就是说没有证据表明试验后这两者之间还存在差异 (meannon-manager = 1.62%,meanmanager = 1.05%,t(1343) = -0.95,P = 0.345)。因此,实验使管理人员对混合居家办公如何影响生产率的看法变得更加积极,并与非管理人员的看法逐渐趋于一致。
值得注意的是,我们发现实验组和对照组的员工相类似,对生产率的自我评估在实验中都有所提高(difference = 0.58%,s.d. = 0.59%)。在 2022 年 3 月实验结束后,携程网其他四个部门的员工也接受了关于混合居家办公对生产率影响的调查,在 3461 个样本中,平均估计值为 +2.8%,与实验样本的 1.5% 端线相似。这表明,即使是近距离接触混合居家办公也足以让员工改变看法,这与之前的证据一致,即在 2020 年新冠疫情后,全社会对居家办公对生产率的影响的看法发生了积极转变。
实验结束后,携程网执行委员会根据数据分析结果投票决定立即将混合办公政策扩展至公司所有部门的所有员工。他们的逻辑是,每名员工的离职都会给公司带来约2万美元的招聘和培训成本,因此离职率降低三分之一将为公司节省数百万美元。这一决定于2022年2月14日公开宣布,并在中国媒体上广泛报道。此后,其他中国科技公司也采用了类似的混合办公政策。
这一结果表明,与以往关注完全居家办公的因果研究不同(这些研究大多发现其对生产率有负面影响),混合居家办公的实施可以不损害绩效。考虑到离职成本约占员工年薪的50%,混合居家办公对企业而言具有盈利能力。同时,混合办公还为员工提供了一些有价值福利(如减少通勤时间和缓解育儿压力),从而对社会产生积极影响。
本实验在携程网(位于中国上海的一家中国科技公司)进行。虽然无法在其他情境下完美复制这些结果,但携程网是一家大型跨国公司,具有全球供应商、客户和投资者。其办公室是现代建筑,与许多美国、亚洲和欧洲城市的办公室相似。携程网员工平均每天工作8.6小时,接近美国大学毕业员工每天8小时的工作时间。此外,公司在 2020 年的收入大幅下降,但在随后的 2021年至 2022年的实验期间,收入基本保持不变,因此这不是一个有着剧烈波动时期。因此,我们相信这些结果——即允许员工每周居家办公两天可以降低离职率且不会明显的影响到绩效——可以适用于其他组织。此外,本实验分析了每周三天在办公室、两天居家办公的模式。我们认为这些发现可能适用于其他类似办公天数安排的混合模式(如每周两天或四天在办公室),但不确定是否适用于居家时间更长的设置(如每周一天或更少时间在办公室),因为完全居家办公模式可能面临培训、创新和文化方面的挑战。
最后,我们应指出实验设计的两个启示。首先,全面普及混合办公很重要,因为担心自愿参与会被视为对职业发展的负面信号。女性员工尽管离职率大幅降低,但自愿参与率较低,这一点尤为明显。其次,实验具有重要价值。实验前,管理人员对混合办公对生产率的看法普遍比较消极,但实验后转变得更加积极。这突显了实验对公司评估新工作实践和技术的好处。
“方法”部分在原文中是与正文相对独立的实验设计内容,其中“零假设结果”在前文多处被提及,翻译中选择性地删除了一些有关于变量设置的部分
地点和实验设置
本实验在中国上海的携程网进行。2021年7月,在看到美国科技公司普及了混合居家办公之后,携程网决定评估混合居家办公对其机票部门和IT部门员工的影响。首先,公司于7月27日对这两个部门符合条件的1612名工程师、市场营销和财务员工进行了关于混合居家办公的调查。我们排除了实习生和处于试用期的新员工,因为这些员工特别需要现场的学习和指导。携程网选择这两个部门作为公司的代表,其中包含各种类型的员工,以评估潜在的不同影响。这些员工中约一半是技术人员,负责编写网站软件代码,以及前端或后端操作系统。其余员工从事业务发展工作,如与航空公司、旅行社或供应商合作开发新产品和服务;进行市场规划和执行广告及营销活动;以及处理一系列财务、监管和策略问题。这些员工中包括395名管理人员和1217名非管理人员,样本量足够大,可以对两组员工对混合居家办公的反应进行评估。
随机化
实验开始前,员工收到一封电子邮件,信件中向他们简述了为期六个月的实验,在实验中他们可以选择在每周三和周五进行居家办公(但非强制)。在初始邮件和两次后续提醒后,有518名员工自愿参与。公司随机分配奇数出生日期(每月的第一天、第三天、第五天等)的员工进入混合居家办公计划,该计划于8月9日那一周开始。偶数出生日期(每月的第二天、第四天、第六天等)的员工未获资格,因此成为对照组。
公司高层对混合居家办公方案的低自愿参与率感到惊讶,他们怀疑许多员工因担心自愿参与会被视为对职业发展的负面信号而犹豫不决。这一担忧并非不合理。例如,之前的一项研究发现,曾经一家美国公司对居家办公进行评估,其中居家办公员工在生产率方面受到负面评价。因此,9月6日,公司告知所有剩余的1094名非自愿员工,他们也将被纳入该计划。奇数出生日期的员工再次被随机分配至混合居家办公实验组,并于9月13日那一周开始实验。在本文中,我们将两组员工的数据合并分析,但我们也分别考察自愿和非自愿的员工,得出了相似的结果,即离职率降低且对绩效无影响。
员工特征和平衡测试
图 1 显示了一些员工在办公室工作的照片(左侧)。所有员工都在现代化的开放式办公室工作,来自同一团队的四或六名同事共用一张办公桌。相比之下,在居家办公时,他们通常独自在公寓里工作,通常是在客厅或厨房。
实验样本的年龄一般在 35 岁左右。约三分之二为男性,全部拥有大学本科学历,近三分之一拥有研究生学历(通常为硕士学位)。此外,近一半的员工有子女。
我们通过双样本 t 检验确认了实验组和对照组的样本均衡性。例外情况是由于随机变异造成的,因为抽样是基于生日(包括月份与日期的生日)的奇偶数——对照组样本平均比实验组大0.5岁(P=0.06),这可能与该组员工子女数量多0.06%(P=0.02)和任职年限多0.4年(P=0.09)有关。
我们考察了员工自愿参与居家办公实验的决定。我们发现,自愿参与试验的管理人员更少(meannon-volunteer = 0.28,meanvolunteer = 0.17,t(1610)=-4.85,P<0.001),且他们的通勤时间较长(meannon-volunteer = 0.80,meanvolunteer = 0.89,t(1257)=3.68,P<0.001)。值得注意的是,我们没有发现自愿参与之前绩效成绩之间的关系(meannon-volunteer = 3.81,meanvolunteer = 3.81,t(1580)=-0.02,P=0.985),这表明至少在本例中,没有证据表明居家办公存在负面(或正面)选择效应。
我们注意到自愿参与者和非自愿参与者组居家办公(在周三与周五)参与率,展现了几个显著事实。首先,对于自愿参与者,整体参与率约为55%,对于非自愿参与者,整体参与率约为40%,表明两组员工通常每周只在家办公一天,通常是周五。在携程网,大型会议和产品发布活动通常发生在周中,因此周五被视为更适合居家办公的日子。其次,即使对于非自愿参与者,参与率也达到40%,这表明携程网怀疑许多员工因担心负面信号而不自愿参与是正确的,同时也凸显了像居家办公、假期、产假或陪产假这样的福利可能需要强制实施以确保合理的参与率。第三,在主要假期前,居家办公参与率激增。许多员工利用居家办公的机会回家乡过节,选择在人更少的周四晚上或周五早上出发。最后,2022年1月底上海总部出现新冠疫情后,实验组和对照组员工的参与率均激增。携程网随后允许所有员工居家办公,因此实验实际上在1月21日周五提前结束。员工每日居家办公参与率的计算排除了休假、病假或因极端恶劣天气(如台风)或公司内新冠爆发而无法到办公室的情况。
零假设结果
为解释主要的零假设结果无效结果,我们使用R语言中的双单边检验(two one-sided tests , TOST)程序进行零等价检验。该检验要求我们指定最小的相关效应大小(smallest effect size of interest , SESOI)。对于与绩效评审度量相关的结果,我们使用0.5作为SESOI,这对应于连续字母等级增加或减少的一半,因为我们已将绩效等级按1的增量分配数值,最低等级D为1,最高等级A为5。我们使用±0.5的等价界限对两样本Welch's t检验进行了等价性测试。在使用默认值 0.05 对 2021 年 7 月至 12 月的绩效指标进行等价上限和下限检验时,TOST 得出了显著结果(t(1504) = -10.20,P<0.001))、2022 年 1 月至 6 月(t(1353)= -10.57,P<0.001))、2022 年 7 月至 12 月(t(1299)= 10.34,P<0.001))和 2023 年 1 月至 6 月(t(1248)= -8.80,P<0.001))。因此,等价检验是显著的,这意味着我们可以拒绝处理对绩效的真实影响大于 0.5 或小于-0.5 的假设。因此,根据我们使用的 SESOI,我们认为实验对绩效的影响实际上是无效的,而不是没有证据表明绩效存在差异。
我们以 2 作为 SESOI,即晋升率相差±2 个百分点 (pp),对实验对晋升的影响进行了零假设等价结果分析。虽然我们可以拒绝实验对晋升的真实效应大于2个百分点或小于-2个百分点在2022年1月至6月(t(1376)=-2.22,P=0.013)和2022年7月至12月(t(1306)=1.33,P=0.092)的备择假设,但我们无法拒绝2021年7月至12月(t(1513)=0.83,P=0.203)和2023年1月至6月(t(1250)=0.98,P=0.163)的备择等价假设因此,我们将晋升结果解释为没有证据表明实验组和对照组员工的晋升结果存在差异。
我们还以每天 29 行代码作为 SESOI,对代码行数进行了等价检验,这相当于对照组平均代码行数的 10%。我们是根据以往研究结果的生产率效应四舍五入得出这一 SESOI 的。我们可以拒绝代码行数的等价零假设(t(92362) = -2.74 P = 0.003),因此我们将实验对代码行数的影响解释为无效。
数据可用性
重现本研究结果所需的数据可以在https://doi.org/10.7910/DVN/6X4ZZL 找到。这些数据已被匿名化并拆分为单独的文件,以确保无法识别任何个人身份。所有图形和表格都可以使用此数据进行复制。
代码可用性
重现本研究主要结果所需的代码可在 https://doi.org/10.7910/DVN/6X4ZZL 找到。
编译:施景耀 | 兰州大学
审校:逯宜蓉
排版:施景耀
审核:蔡佳峻 宋思涵
本平台分享的任何内容仅用于学术交流,旨在方便大家了解学界动态,在学术层面学习与批判。不代表本平台立场,仅供参考,勿作他用,特此声明。(如需转载或进入微信交流群,请联系“政治学评介”公众号,或者添加政评君官方微信,ID:Z-Pjun)
投稿、建议以及加入我们,请联系邮箱:zhengzhixuepingjie@126.com
及政评官方QQ群:
官方群1:271025519
官方群2:875400819
让每个人都能收获真正的政治学知识
力争给你专业、前沿、开阔的政治学视野
进一步了解我们,欢迎您关注
政治学评介公众号
说文解政公众号
其他平台官方账号
小红书
政治学评介
哔哩哔哩
政治学评介
微博
政治学评介