1波兰亚当·密茨凯维奇波兹南大学公共政策研究中心(CPPS)
2波兰波兹南亚当密茨凯维奇大学数学与计算机科学学院
Kwiek, M., Szymula, L. Quantifying attrition in science: a cohort-based, longitudinal study of scientists in 38 OECD countries. High Educ (2024). https://doi.org/10.1007/s10734-024-01284-0
徐浩天(北京大学教育学院博士生)摘译
在该研究中,波兰高等教育学学者、Higher education杂志副主编Marek Kwiek及其合作者Lukasz Szymula探讨了科学家离开学术界的趋势和规律,并分析了不同性别、学科以及时间维度上的学术人才流失现象(流失定义为停止发表学术文章)。研究采用了基于群体的纵向分析方法,通过追踪男性和女性科学家在特定时期内的发表情况来量化这一传统上称为“离开科学界”(leaving science)现象。研究数据来自全球范围内的Scopus出版物与引用文献的元数据,研究对象为来自38个OECD国家的科学家,分别是2000年开始发表的群体(共142,776人)和2010年开始发表的群体(共232,843人)。研究关注了STEMM学科(科学、技术、工程、数学和医学)中的16个学科,并追踪这两组科学家的学术产出直到2022年。
研究采用了生存分析(survival analysis)来比较男性和女性科学家的流失情况,结果显示,随着科学界女性人数的增加及其在各群体中的比例上升,性别对学术流失的影响正在逐渐减弱。在综合分析所有STEMM学科的总体变化之外,研究还发现,流失现象在不同学科和时间点上表现出显著差异。流失对不同学科的男性和女性科学家的影响不同,同时,不同群体的科学家进入学术劳动市场的时间也影响了其流失情况。此外,研究对全球性的文献计量数据库进行了检验,显示了利用大数据研究性别和学科差异的潜力,为未来深入探索学术流失问题提供了新的机遇。
该研究揭示了在不同性别、学科背景和时间维度下,科学家学术流失现象的复杂性和多样性,指出了流失现象不仅仅是简单的性别差异,还受到了学科文化、学术劳动力市场结构等多方面的影响。
理论背景
研究的理论背景集中探讨了性别与学术流失现象的关系,阐述了性别和学科如何在不同程度上影响科学家的流失。传统观点认为,女性在学术界面临“寒冷气候”(chilly climate)、工作与生活平衡困难等障碍,特别是在母职期间,女性难以兼顾学术工作。这些因素导致女性比男性更容易离开学术界。女性科学家在学术晋升、研究产出、研究经费获取及学术成就认可等方面往往处于劣势,特别是在以男性为主导的STEMM学科中。管道泄露(leaky pipeline)模型指出,女性在学术职业的每个阶段由于系统性障碍逐渐流失,寒冷气候假说则解释了女性因缺乏归属感或感受到排斥而退出学术领域。
研究借助“科学管道”(pipeline)和“科学路径”(pathways)两种理论框架,科学管道视角认为通过增加早期女性科学家的供给可以减少流失,而科学路径视角则强调组织结构和文化环境的作用,认为这些因素比个体特质对女性的职业进展影响更大。与管道模型不同,路径视角认为职业生涯的进展并非线性,而是充满复杂性,允许女性在任何阶段退出学术界。
此外,研究探讨了“寒冷气候”假说与学术部门文化的关系,指出女性在学术部门的社会环境和网络参与直接影响其职业满意度和流失意图。尽管文献计量数据无法深入探讨个体和组织特质,研究仍通过大规模数据集揭示了科学家在学术发表中的性别差异。
数据与方法
研究采用了Scopus数据库中的文献计量元数据,追踪科学家的学术发表活动,并将“离开科学界”操作性地定义为停止在学术期刊上发表论文。作者使用生存分析方法,将科学家的职业生涯视为从首次发表到最后一次发表的一系列事件,并通过Kaplan-Meier生存估计比较男性和女性科学家发表生涯的差异。
研究的样本来自2000年和2010年群体,共覆盖2,127,803名科学家。研究首先筛选出至少发表两篇论文或会议论文的科学家,确保其隶属于OECD国家,并限定在STEMM学科。科学家的性别通过NamSor工具推断,该工具基于名字、姓氏及主导国家推断性别。为确保学科分类的准确性,研究根据科学家引用最多的学科确定其主导学科,并将无法分配到明确学科或国家的科学家排除在样本之外。
对于退出发表年份的界定,研究选择科学家最后一次发表的年份的下一年作为退出年份,并视2019年后的退出为截尾观察,确保误差最小。最终,研究利用大规模数据集在时间和学科层面对科学家的职业生涯进行全面分析。
局限性
尽管研究利用了大规模数据集,并通过生存分析揭示了科学家离开学术界的性别差异,仍存在一些局限性。首先,研究仅考虑了发表记录的科学家,未包含未发表或发表量少的科学家群体。因此,研究仅限于发表活跃的科学家,而未涉及整个高等教育人员的流失现象。其次,定义“离开科学界”为停止发表忽略了其他学术角色的存在,如教学或行政管理,或非学术职业路径,如在企业或政府部门的工作。尽管这些职业可能仍需要科学家的研究经验,但这项研究无法通过文献计量数据捕捉这些职业变化。
此外,科学与非科学职业的边界并不清晰,存在渗透性。因此,将不再发表学术论文等同于离开科学界是一种简化的定义,未能全面反映科学家的职业生涯。尽管如此,研究假设不再发表等同于不再从事科学研究,这一简化有助于在全球范围内进行大规模数据分析。
结果
作者追踪了2000年群体的142,776名STEMM科学家,直至他们停止发表或截至2022年,并通过Kaplan–Meier生存曲线展示了科学家留在科学领域(持续发表)的比例变化。
图3 2000年科学家队列(N=142776)的Kaplan-Meier生存曲线(按性别)(所有学科合并)
总体发现:在2000年群体中,男女科学家的生存曲线在前四年出现了最大下降,这一阶段通常与博士学位的攻读时间相对应。从第四年起,性别差异开始变得显著,男性留在科学领域的比例始终高于女性。整体来看,约三分之一的科学家在五年后离开了科学界,十年后这一比例上升到约一半,19年研究期结束时,约三分之二的科学家离开了科学界。男性科学家在每个时间节点的留存比例都高于女性,表明男性在科学界的持续发表生涯更长。
性别差异:具体来看,女性在五年和十年后离开科学的可能性显著高于男性。五年后,女性离开的概率比男性高出12.54%,十年后这一差距为11.52%。到研究期结束时,女性的生存概率为29.4%,而男性则为33.6%,差距缩小到6.33%。这一趋势表明,尽管性别差异在职业生涯的早期较为显著,但随着时间的推移,性别间的差异有所减小。然而,女性科学家仍然更容易离开科学界,特别是在职业生涯的前十年。
图4 2000年队列科学家按学科和性别划分的Kaplan-Meier曲线
学科间的差异:将所有STEMM学科的结果综合起来可能会掩盖各学科的特定流失模式。通过按学科和性别划分的Kaplan–Meier曲线,研究揭示了不同学科内的性别流失模式存在显著差异。例如,在生物化学、遗传学和分子生物学(BIO)领域,女性的流失率远高于男性,且这种差距随着时间推移逐渐扩大。五年后,女性离开BIO领域的概率为37.2%,男性为30.8%;十年后,女性的流失率为58.3%,而男性为48.6%;在19年研究期结束时,女性的流失率高达76.6%,男性为67.3%。这些数据表明,女性在BIO领域的流失速度显著快于男性,且在科学生涯的各个阶段都面临更高的流失风险。
相反,在物理和天文学(PHYS)领域,男女科学家的生存曲线几乎重合,表明性别对该学科的流失影响较小。女性在PHYS领域五年后的离开概率为28.1%,男性为29.2%;十年后,女性的离开概率为47.9%,男性为46.9%;19年后,女性的离开概率为66.9%,而男性为66.5%。这些数据表明,PHYS领域的性别差异几乎不存在,男女科学家的流失模式基本一致。此外,在数学密集型学科如数学(MATH)、计算机科学(COMP)和PHYS中,尽管女性的数量较少,但男女科学家的生存曲线几乎重合,显示出性别差异并未对这些学科的长期留存构成显著障碍。
2010年群体和2000年群体的对比:研究发现2010年群体中性别流失的差异显著缩小。对于2010年群体,男女科学家的Kaplan–Meier生存曲线几乎相同,表明随着更多女性进入科学领域,科学流失不再明显性别化。在包括计算机科学(COMP)、工程(ENG)、数学(MATH)和物理(PHYS)在内的数学密集型学科中,男女生存曲线基本重合,性别差异几乎消失。详细的Kaplan–Meier估计显示,2010年群体的女性在进入科学领域9年后的留存概率为41.4%,男性为42.4%,差异非常小。这与2000年群体的显著性别差异形成鲜明对比,表明科学领域的性别差异随着时间的推移逐渐缩小。然而,在女性比例较高的学科,如医学(MED)和生物化学、遗传学和分子生物学(BIO)中,性别差异仍然显著。在BIO领域,2000年群体中女性的生存曲线显著低于男性,并且差异随着时间逐渐扩大。女性在BIO领域的流失率在五年后为37.2%,十年后为58.3%,19年后达到76.6%,而男性的流失率分别为30.8%、48.6%和67.3%。这些数据表明,女性在BIO领域面临的流失风险显著高于男性。相比之下,PHYS领域男女流失率几乎一致,性别差异较小。
图6 & 7 2000年队列科学家(左) 2010年队列科学家(右)
风险率和离开时间的分析:为了进一步理解科学家流失的动态变化,研究还分析了生存回归曲线、风险率曲线和核密度曲线。结果显示,对于2000年群体,男女科学家在发表生涯的早期阶段(前6至8年)流失风险最高,之后风险逐渐下降。女性的流失峰值出现在发表生涯的第四年,而男性的流失峰值则出现在第三年。风险率曲线表明,发表生涯的早期是科学家离开的高风险期,但随着时间推移,离开的风险显著降低。对于2010年群体,流失风险的峰值出现在第六年,然后逐渐降低。最重要的是,男女之间的风险率曲线几乎重合,表明性别对流失风险的影响已大幅减弱。核密度曲线显示,2000年群体中科学家离开的高峰期集中在发表生涯的第3至6年,而2010年群体的离开高峰期则集中在第2至5年。这些结果表明,随着时间推移,科学家在职业生涯早期的流失模式正在发生变化,性别差异逐渐缩小。
图9 COMP领域2000年科学家队列(N=6424)
计算机科学(COMP)的特殊案例:研究特别指出了计算机科学领域的特殊性。2000年和2010年群体的分析显示,在COMP领域,男女科学家的Kaplan–Meier生存曲线均无显著性别差异。风险率曲线表明,在大多数年份中,男性离开科学的可能性实际上高于女性。核密度曲线显示,离开者的分布峰值约在发表生涯的第4年。尽管COMP领域女性的代表性较低,但女性的发表和留存情况正在逐步改善,性别差异逐渐缩小。
总体结论:整体而言,研究显示,尽管传统观点认为女性比男性更容易离开科学领域,尤其是在2000年群体中,这一性别差异在2010年群体中显著缩小,甚至在某些学科中消失。这一发现对理解科学领域中的流失模式具有重要意义,表明随着时间的推移,科学领域的性别差异正在逐渐消退。研究表明,科学家在发表生涯的早期更容易离开科学界,特别是在前10年,但性别差异不再是决定流失的重要因素。这一趋势反映了全球科学领域的转型,并为未来研究性别和学科差异提供了新的启示。
讨论与结论
作者指出,科学领域的流失和留存是一个长期过程,研究这些现象需要大规模、多国的纵向数据集,以深入探讨不同学科和时间维度的变化。随着工作条件和专业环境的不断变化,“离开科学界”的现象正在显著转变(Milojevic et al., 2018)。
研究发现,不同学科在不同时间阶段表现出不同的流失强度。通过将“停止发表”概念化为“科学流失”的标准,作者发现流失现象对不同性别、学科和群体的科学家具有不同的影响。对于2000年群体,约三分之一的科学家在五年后离开科学界,女性的流失率始终高于男性,五年后高出12.54%,十年后高出11.52%,到研究期末高出6.33%。
然而,2010年进入科学领域的科学家在性别流失上的差异显著缩小。随着更多女性进入科学领域,科学流失不再明显性别化。对于2010年群体,性别差异基本消失,尽管总体趋势显示性别差异在缩小,但在不同学科中仍存在差异。例如,在生物化学、遗传学和分子生物学(BIO)中,女性的生存率显著低于男性,且差异随着时间推移加剧;而在物理和天文学(PHYS)中,男女生存率几乎相同。
研究还发现,在数学密集型学科(如数学、计算机科学和物理)中,男女科学家的流失率几乎没有差异,女性的留存比例与男性相同。尽管这些领域的女性数量较少,但她们展现了强大的专业成功,性别差异并未对她们的长期留存构成明显障碍。特别是在计算机科学(COMP)领域,女性的发表和留存情况随着时间的推移逐渐改善。
传统观点认为女性更早、更大比例地离开科学(Goulden et al., 2011;Preston, 2004;Shaw & Stanton, 2012;Wolfinger et al., 2008),这在2000年群体中得到验证。但对于更近期的2010年群体,性别流失率的差异已大幅减弱。女性和男性的流失率都很高,但性别差异显著缩小。
作者强调,过去三十年间女性在科学领域的参与发生了巨大变化。基于文献计量的纵向研究为全球性别差异和群体间的比较分析提供了新的机遇。在快速变化的科学环境中(Stephan, 2012;Wang & Barabási, 2021),传统关于男女科学家流失的假设可能需要重新审视。作者试图通过这项研究提供初步的答案,并为未来的深入研究指明可能的方向。