收稿日期:2024-03-02
修回日期:2024-04-20
终审日期:2024-04-21
录用日期:2024-04-30
网络首发:2024-05-20
博士生毕业因素的关联规则挖掘:群像特征与类型差异
王婷,东南大学研究生院助教
耿有权,东南大学教授,博士生导师
黄亚继,东南大学教授,博士生导师
摘 要:博士生教育以培养具有学术创新能力的高层次人才为目标,肩负着知识生产和促进经济社会发展的重任。大数据背景下,利用博士生培养过程教育数据,深度挖掘博士生毕业时间与培养各环节的关联规则,发现博士生延期毕业主要因素,探析不同时间毕业的博士生群体的特征,可为加强高校博士生培养管理、提高博士生毕业率提供客观可行的科学指导。基于某高校研究生管理大数据系统,获取学生入学信息、导师基础信息、综合素质表现、校园行为情况、科研学习情况五大类数据,处理整合数据,形成数据集,并进行特征提取和标签体系构建,采用FP-Growth算法进行所有标签与博士生毕业因素的关联规则挖掘,最终刻画出按期毕业、延期毕业和超期毕业三类博士生群体画像,并对比分析三类群像呈现的差异性特征。研究发现:博士生入学方式、课程成绩、开题情况、科研成果数量和完成时间、在读期间是否获得奖学金和荣誉表彰及毕业论文送审时间与博士生毕业时间存在强关联性;博士生入学年龄、入学前院校是否是“双一流”高校、导师年龄、导师任博导年限、导师指导学生人数、校园行为习惯与博士生毕业时间关联性不强;按期毕业和超期毕业博士生分别对应一类典型群体画像,延期毕业博士生包含三种典型画像;三类博士生群体画像在学术志趣、学术基础和学术能力三个方面呈现明显差异。为提升博士生培养质量,提高博士生毕业率,需打破刚性限制与隐性歧视,确保优秀生源选拔的有效性;强化过程监督与分流退出,确保培养过程管理的科学性;重视课程供给与基础培养,保障科研实践衔接的流畅性;呵护学术志趣和身心健康,保护科研创新探索的积极性。 关键词:数据挖掘;博士生毕业时间;关联规则;群体画像;延期毕业 基金项目:江苏省学位与研究生教育教学改革课题项目“大数据驱动下的研究生学位质量动态监测与风险预警研究”(JGKT23_C004) |
当前,中国社会正面临着向创新型社会转型的重要挑战,博士生作为我国创新体系中重要的生力军,博士生教育质量和培养数量对我国创新力和竞争力的提高尤为重要。我国从“研究生教育大国”向“研究生教育强国”转型的过程中,从国际发展经验和我国发展实际来看,进一步扩大我国博士生招生数量和培养体量仍然具有一定的必要性。教育部发布的“2023年全国教育事业发展基本情况”数据显示,2023年招收博士生15.33万人,比上年增长10.29%。然而,随着博士生招生规模的扩大,博士生延期毕业的现象也日趋严重,博士生入学后,顺利毕业成为博士生教育中不可忽视的问题。《中华人民共和国高等教育法》规定,“博士研究生教育的基本修业年限为三至四年”。目前各高校对博士生学制和最长学习年限的规定大体一致,学制一般为三至四年,最长学习年限为六年。在2017年的相关调查中,博士生延期毕业率为39.7%,据2021年“全国博士毕业生调查”数据显示,博士生延期毕业率近50%,这意味着每年入学的博士生中,仅有半数能够在高校规定的学习年限内顺利毕业,更严峻的是,延期毕业率存在潜在升高趋势。我国博士生教育逐步进入内涵式发展时期,高校更要聚焦博士生培养过程,直面延期博士生教育管理这一现实问题。
博士生科研过程和内容的开放性、挑战性和创新性,决定了博士生毕业时间的不确定性。博士生能否在学制内或在最长学习年限内毕业,需要从博士生入学起,持续关注整个培养周期,深入各培养环节,发现博士生培养过程中存在的问题和不足,找到毕业生延迟毕业的关键影响因素,进而找到相应的解决办法。纵观整个培养过程,究竟哪些因素、哪些环节在影响甚至阻碍博士生完成学业?不同时间节点毕业的博士生群体有怎样的特征?这些特征是否具有差异性?以上是本研究重点讨论和分析解决的问题。教育信息化2.0行动的实施使得高校博士生从入学到毕业全流程的管理数据更加全面,存储更为完整,为分析博士生教育管理规律提供了有力支撑,也为以上问题的解决带来了新的思路。
综合上述思考,本研究以某高校整个年级学术型博士生为研究对象,从用户画像研究视角出发,基于该年级完整培养流程大数据,采用数据挖掘方法,分析博士生培养过程与毕业时间的潜在关联规则,探究博士生延期毕业的影响因素,对按期毕业、延期毕业、超期毕业三类博士生群像进行刻画,并对不同时间毕业的博士生画像差异进行分析,以此为博士生培养过程提供辅助决策依据。
二、文献综述
(一)关于博士生毕业时间影响因素的研究
博士生毕业意味着完成了博士生教育的培养环节,达到了博士生培养目标。对学术型博士毕业生而言,应当具备知识、能力、品质和谐发展构成的“学者”的基本素质。因此,不同时间节点毕业的博士生的差异性,究其本质,实际上源于他们在学术基础、学术能力和学术志趣等基本素质的差别。但学术基础、学术能力和学术志趣难以客观量化,这为研究不同时间毕业博士生特征带来困难。据此,本文通过对博士生毕业时间影响因素的探究入手,进而对不同毕业时间博士生群体在素质特征方面所存在的差异进行探讨。
基于对博士生毕业时间影响因素的相关文献分析可知,博士生毕业时间最主要的影响因素集中在学生个体特征、导师指导情况、高校培养制度三个方面。学生个体特征是影响博士生延期的最主要原因,读博动机、科研能力、学习经历等都会对毕业时间产生影响。积极的、明确的读博动机有助于博士生顺利完成学业,学术动机的功利化和外化的倾向则对博士生的学业完成有着负面影响。在科研能力与学业精力上,积极的学业参与、明确的学业规划、较强的科研能力对毕业时间有显著的正向影响。在招生入学方式上,硕博连读博士生是否比普通攻读的博士生如期毕业率更高,并无统一的结论。但有研究指出,硕博阶段就读于同一学校的博士生延期率比硕博不同校的博士生更高。在其他学生个体特征中,诸如年龄偏大、家庭困扰、财务负担等因素,也会影响博士生毕业。在导师指导情况方面,导师指导博士生人数越少,导师指导经验越丰富,博士生延期概率越低。在高校制度要求方面,影响博士生毕业时间的直接因素是高质量学术论文发表数量,博士生发表高质量学术论文的难度大,耗时长,部分博士生难以在规定学习年限内完成,将不得已而延期。博士生中期考核等过程性监督机制的缺失或缺位,导致部分博士生降低自我约束,学习效率下降,进而也会导致延期结果的发生。延期毕业并非我国博士生教育的特有现象,20世纪80年代开始,美国、英国、加拿大等国高等教育界开始关注博士生修学时间延长的问题。根据美国国家科学基金会数据,在美国博士生毕业所需平均时间为7.5年,相较于1988年的8.7年虽略有下降,但整体上仍处在高位。在欧洲,约有40%至50%的博士生放弃学位。从国外高校经验来看,影响博士修业年限的因素主要包括在课程设计、经济资助、院系文化、论文选题、导师指导等方面,个人先赋性因素如年龄、性别、家庭等在博士生毕业时间的预测上是否有效,仍存在争议。
诚然,国内外已有研究成果为本研究提供了坚实的基础,但既有研究仍存在一定局限性,这也是本文尝试深化和突破的方面。一是研究视角多局限于博士生个体,目前尚未出现对整个年级博士生毕业情况的总体探讨;二是研究数据多来自问卷调研,获得的研究数据存在主观性和随机性;三是研究方法多采用回归分析,以各影响因素为自变量,延期毕业为因变量,但延期毕业是多种因素累积和交织影响的结果,缺乏过程性变量和多维度变量的关联关系的探讨。借助已有结果,本研究仍将博士生毕业时间影响因素的探究聚焦在个体特征、导师情况、培养过程三个方面,但区别于已有研究,采集某一年级的所有博士生在培养过程中的系统数据,采用数据挖掘方法中的关联规则分析,重点分析博士生培养全流程中涉及的因素与博士生延期毕业的关联规则。
(二)关于教育数据挖掘的研究
教育数据挖掘是一个学科交叉领域,它致力于从教育学领域中产生的独特教育性质的数据里发现隐藏规律,从而更好地分析理解学生的行为模式,寻找提升学生学习效果的方式与方法。
教育数据挖掘在美国高校中已广泛运用于预估学生入学、优化课程设置、吸引经费投入等方面。例如,加州大学两所分校通过对4.8万申请入学学生的来源地区、种族、语言等进行数据挖掘,并对预测入学概率40%以上的学生进行针对性宣传,使得该部分学生入学率从6.4%提升至21.9%。威斯康辛麦迪逊分校为筹集更多校友捐赠,深入分析了1982年以来的捐赠数据,构建校友捐赠预测模型对17万校友进行挖掘后分类宣传,成功募集到更多教育经费。在我国,教育数据挖掘主要应用在三个方面。第一,学生家庭经济困难判定,通过挖掘学生的校园消费信息和与之相关的其他校园行为数据,找到内在关联,进而更准确判定学生家庭真实经济情况,实现精准资助。第二,学生学业情况的掌握,主要是通过对学生学习行为、生活习惯、入学信息、在校表现等数据与学业数据进行分析,预测学生的学习成绩、毕业情况,为招生录取、管理培养、就业指导等提供决策依据。第三,学校管理和服务水平的提升,主要通过学生行为数据及后勤系统数据,发现学生行为规律从而提高管理服务质量,例如根据学生图书借阅行为来分析学生阅读习惯并进行图书文献精准推荐等。
自教育信息化2.0行动计划实施起,高校在不断优化信息化管理系统的同时,也已逐步形成庞大的学生培养和管理数据库。充分利用数据库探寻学生培养过程中留下的“碎片化”数据之间的潜在关系和规律,一方面可实现数据高效运用,另一方面能给高校教育管理带来客观真实的量化认识。为此,本研究为更好地发挥博士生教育管理数据的价值,发掘“碎片化”博士生培养过程数据之间的关联性,选择直接通过高校研究生管理系统数据,聚焦博士研究生培养过程关键特征因素与博士生毕业时间之间的关联规则挖掘,为博士生毕业“前置式”管理提供支持。
(三)关于学生画像的研究
对于教育数据挖掘结果如何直观清晰地呈现,以便于高校管理者和教育者理解数据与行为之间的关联这一问题,学生画像带来了新的解决思路。学生画像是用户画像在教育领域的应用,其方法是,通过分析学生学习相关的数据,对学生进行群体分类并描述,进而为有效的教与学提供数据支撑和服务。
目前部分学生画像研究主要基于学习环境,先采集学生的学习背景、成绩数据和平台交互行为数据,再根据学生的学习动机、学习风格、知识水平、学习参与度、学习积极性等特征对学生群体进行划分,以提供个性化指导,提升学习效率。例如有学者以图书情报硕士生为研究样本,利用学生论文发表数据,处理形成用户维度和行为维度的用户画像标签数据集,分析群体的潜在科研需求和发文偏好,提供差异化的科研发展策略。有研究通过收集无线网轨迹数据、智能卡和借阅数据等行为数据,构建学习成绩分类模型并进行用户画像,找到了成绩和各参数之间的规律,提高了学生学习效率。也有部分研究根据学生的基本属性、学习过程和学习结果数据构建画像模型,并基于画像结果设计学习路径规划框架建议。
结合大数据挖掘用户画像,最早且目前已广泛地应用于互联网公司基于用户浏览习惯的商品推荐。尚未有研究以博士生群体为目标对象,将用户画像与数据挖掘技术结合,对博士生毕业时间和博士生培养全过程进行关联分析和画像描绘。综上,本研究将从用户画像视角出发,根据博士生毕业时间,将其分为按期毕业、延期毕业和超期毕业三类,使用数据挖掘方法探讨博士生毕业时间与培养过程之间的潜在关系。
三、研究设计
(一)研究思路
研究从用户画像视角出发,聚焦按期毕业、延期毕业和超期毕业三类不同时间毕业博士生的群体画像刻画及呈像差异性分析,本质上是对博士生培养过程数据的整合、挖掘和表达。构建画像的基础是对研究对象特征的梳理和筛选,核心是从大量数据中提取研究对象的典型标签,对本研究而言即是通过数据挖掘的方法分析出博士生培养过程中哪些特征因素可能与其毕业时间存在强关联。
第一步是研究对象数据化,即集合形成以学生入学信息、导师基础信息、综合素质表现、校园行为数据和科研学习情况为一体的目标数据,通过从海量的博士生培养过程数据中提取有分析价值的数据,构建标签体系,形成研究数据集。第二步是研究对象特征化,即通过构建基于FP-Growth算法的博士生毕业关联规则挖掘模型,基于关联规则挖掘数据集中所有因素标签与博士生毕业时间的关联关系,实现强关联规则输出,并描绘三种不同时间节点毕业的博士生群体画像,最后通过对比分析不同群体画像之间的显著差异,提炼出具有实践意义的启示和建议,旨在为博士生培养提供有力的决策支持(如图1)。
图1 研究路线
(二)画像构建方法
对不同时间毕业博士生进行画像构建,是通过对不同类型博士生群体的基本信息和培养过程大数据进行群体共同特征提取,进而抽象出标签化的形象模型,即对典型群体的标签化和模型化。目前运用于画像构建的方法主要有三种,包括定性用户画像方法、基于定性研究的定量用户画像方法和经定量检验的定性用户画像方法。其中,定性画像的核心工作是为不同群体打标签,刻画并呈现其群体共性特征。因本研究采用的FP-Growth算法通过频繁项集直接输出相关性最高的静态、动态标签和各标签的强关联关系,故本研究选择采用定性用户画像方法对不同时间毕业的博士生进行画像构建。
(三)数据准备
1.样本选取
本文选取国内某“双一流”建设高校2017年入学的学术型博士生为研究对象,为确保样本间的可比性,将培养要求存在差异的直博生、专业学位博士生排除,最终纳入分析的样本量共计652人。根据该高校研究生学籍管理规定,博士生学制为4年,最长学习年限为6年,超过学制但未超过最长学习年限即为延期,超过最长学习年限即为超期。因此,本文以上述两个时间节点将研究对象分为三类群体,分别是:按期毕业博士生,占比24%;延期毕业博士生,占比56%;超期毕业博士生,占比20%。
2.数据预处理
基于已有研究,本文从学生个体特征、导师指导情况、学习培养过程三个维度讨论,从博士生招生录取、培养管理、学位申请的全过程选取学生入学信息、导师基础信息、学生在校综合素质表现、校园行为情况、科研学习情况共计5个方面15个因素进行数据收集(如图2)。该高校博士生培养过程所有数据均以信息系统形式存储,本研究的数据从该高校的研究生学籍管理系统、教务管理系统、毕业与学位管理系统、校园一卡通使用管理系统、校园门禁管理系统等信息系统直接获取。因涉及学生个人隐私,所有数据经过脱敏和匿名化处理。为提升数据质量、确保模型分析的效果,建模前本研究对所有数据均进行数据清理、数据集成和格式转化等数据预处理,所有数值型数据均进行归一化处理,经数据预处理后共计4万余条。
图2 影响因素
3.标签体系构建
表2 动态标签符号及其含义
(四)数据挖掘
1.挖掘算法选择
图3 基于FP-Growth算法的博士生毕业情况数据挖掘流程
2.关联规则挖掘
关联规则定义为X→Y形式的蕴涵表达式,其中X和Y是不相交的项集,即X∩Y=Æ。关联规则表示不同项目集合之间的相互依存性和关联性。关联规则的强度通过支持度、置信度和提升度来衡量。
支持度(support),表示某个项集在数据库中出现的概率,即X和Y同时出现的概率:
置信度(confidence),表示X和Y同时出现的概率占X出现概率的比值:
置信度用于衡量规则的强弱程度,置信度越高,说明X出现时Y出现的可能性越大。
提升度(lift),表示X出现的条件下出现Y的概率和没有条件X出现Y的概率:
提升度直接反映关联规则中的X与Y的相关性,提升度>1且越高表明正相关性越高,提升度<1且越低表明负相关性越高,提升度=1表明没有相关性。
研究时设置最小支持度和最小置信度阈值,最小支持度表示项集在统计意义上的最低重要性,最小置信度表示关联规则的最低可靠性。当某个关联规则提升度大于1,且满足最小支持度阈值和最小置信度阈值,则认为该关联规则有效且为强关联规则。
四、结果与讨论
(一)关联规则输出结果
在进行基于FP-Growth算法的数据挖掘之前,本文首先将不同毕业时间的博士生进行分类,再分别进行数据集的差异和相似分析。本研究最小支持度阈值和最小置信度阈值设置为0.2和0.3。根据支持度、置信度和提升度的计算,输出关联规则的支持度和置信度都大于阈值,且提升度大于1的关联规则,即三类博士生群体对应的毕业影响因素强关联规则如表3所示。
表3 博士生毕业时间强关联规则输出结果
表3结果表明:
第一,博士生入学方式(C)、博士在读期间是否获奖学金和荣誉表彰(F)、课程成绩(H1)、开题情况(H2)、科研成果发表的时间和数量(H3、H4)和毕业论文送审情况(H5)这7个因素与博士生毕业时间存在强关联性。
第二,博士生入学年龄(B)、入学前院校是否是“双一流”高校(D)、导师年龄(E1)、导师任博导年限(E2)、导师指导学生人数(E3)、校园行为习惯(G1、G2)共计8个因素与博士生毕业时间无强关联性。
第三,根据关联规则理论,每条强关联规则代表着一种典型的特征组合,即代表一种典型人群。按期毕业博士生和超期毕业博士生分别有一种典型群体,而延期毕业博士生则包含了三种不同典型群体。
(二)不同博士生群像特征分析
1.按期毕业博士生群像特征分析
按期毕业强关联规则代表的博士生是通过硕博连读方式入学,在学制内完成科研成果发表并完成毕业论文送审,科研成果数量超过毕业要求,在博士阶段获得过奖学金或荣誉表彰。此类博士生严格按照学校培养要求的时间节点完成每项培养计划,在学制内能按时完成科研成果发表、毕业论文送审等培养要求,具有明确的毕业目标倾向和完整的学业生涯规划。其次,他们在学制内能取得超出毕业基本要求的科研成果,获评奖学金或荣誉表彰,说明此类博士生学术能力较为突出,属于综合表现优异的博士生群体。此外,学制内毕业的博士生大多通过硕博连读方式入学,博士入学前已接受了较为系统的学术培训,具备一定的学术研究基础和能力,在学术能力、科研产出等方面均展现出硕博一体化培养的优势。综合看,这类博士生特征可概括为:硕博连读入学,学业规划明确,科研学术能力强,学术成果产出速度快、数量多,综合表现突出。
2.延期毕业博士生群像特征分析
相较按期毕业的博士生和超期毕业的博士生强关联规则的唯一性,延期毕业博士生强关联规则有三条,即延期毕业博士生包含三种不同群体。
第一种延期毕业强关联规则代表的博士生是通过硕博连读方式入学,在学制内完成毕业要求的科研成果,且科研成果数量超过毕业基本要求,获得过奖学金和荣誉,毕业论文送审时间超期。此类延期毕业博士生与按期毕业博士生入学方式相同,均为硕博连续入学。从硕士阶段转入博士阶段后,在学制规定时间内科研成果数量丰硕,证明了其较高的科研素质、较强的学术能力和有序的学业规划。博士在读期间获得奖学金和荣誉表彰,也是其学术能力优秀的表现。但该群体往往因毕业论文送审时间推迟导致了毕业延期。综合博士生培养实际过程和已有研究结果,分析此类博士生毕业论文延迟送审的原因有三种可能性。第一种可能是,到规定学制时间,此类博士生虽然已能满足毕业条件,但他们仍需要对已有学术成果进行更深入研究,花费了更长的时间在取得创造性、突破性的学术研究成果上,影响了毕业论文的送审时间;第二种可能是,在高年级时他们选择公派出国等联合培养项目,在开拓学术视野、增强国际眼界等方面花费了精力和时间,进而主动选择推迟毕业时间;第三种可能是,因突出的科研能力,这类博士生在课题组科研攻关中起到骨干作用,是导师项目的主力军,承担的科研任务的周期存在不确定性,无形中延长了博士生毕业的时间。不管源于哪种可能性,培养时间的延长使得此类博士生增加了理论知识积累,提升了科研能力水平,出现延期毕业是进一步深入学术研究的合理表现。综合看,这类博士生群体特征可概括为:硕博连读入学,学术兴趣强烈,科研能力强,学术成果产出速度快、数量多,综合表现突出。
第二种延期毕业强关联规则代表的博士生是课程规格化成绩高于规格化平均水平,博士阶段荣获奖学金和荣誉表彰,在学制内完成科研成果要求,毕业论文送审时间超过学制但在最长学习年限内。此类博士生从小的应试教育让他们非常顺利地度过课程学习阶段,甚至能取得优异的课程成绩。他们从课程学习到科研探索均是按照博士生培养计划各项培养要求进行的,取得的科研成果虽然数量不突出但学术论文的发表都在规定时间内,对自己博士阶段学业规划有整体性把握。他们综合表现良好,获得过奖学金和荣誉表彰。但是,博士毕业学位论文作为博士生学习和研究的最终成果,不是已有科研成果的拼凑,而是学科基础、科研能力、创新能力、掌握和运用知识能力以及书面表达等能力的综合体现,此类博士生在博士毕业论文研究后期,暴露出知识储备和科研能力不足,论文写作和送审出现停滞或滞后。综合看,这类博士生特征可概括为:课程成绩优异,学业规划明确,科研学术水平能达到毕业要求但不突出,毕业论文送审延迟。
第三种延期毕业强关联规则代表的博士生是以“申请-考核”方式入学,开题时间出现延迟,能在规定学习年限内完成规定科研成果,但成果数量刚达到毕业要求,在博士就读期间未获得过奖学金或荣誉表彰。此类博士生通过“申请-考核”入学,开题出现了延迟,培养初期就表现出了学术基础薄弱、科研能力不足等情况。但经过二至三年的学术训练后,他们在学术探索阶段科研水平得到提升,顺利打破了论文选题与科研能力失衡的现状,提升了自身科研能力阈限,在规定学习年限内发表了规定数量要求的科研成果,最终达到博士生毕业要求,顺利完成学业。综合看,这类博士生特征可概括为:“申请-考核”入学,基础薄弱,开题延迟,科研学术水平仅能达到基本毕业要求。
3.超期毕业博士生群像特征分析
超期毕业强关联规则代表的博士生是通过“申请-考核”方式入学,开题延期,科研成果发表数量不满足要求且发表时间超过最长学习年限,博士在读期间未获得过奖学金或荣誉表彰,毕业论文送审时间超过最长学习年限。超最长学习年限还未毕业的博士群体,入学后因为学术基础薄弱,普遍从开题环节就出现滞后,过渡适应阶段就出现了适应性障碍。随着培养时间的推进,科研成果发表、毕业论文完成时间也随之滞后,除课程学习外的其他培养环节,均无法按要求完成,最终导致无法在规定时间内毕业。此类博士生群体入学前已经存在学术基础差,学术能力弱的情况,步入博士培养阶段后,所具备的知识储备、科研技能与实际学术过程存在偏差,且容易在课题研究过程中出现畏难情绪和行为,丧失对学术研究的兴趣。在博士生评奖评优过程中,此类学生也较难获得奖学金或荣誉表彰。综合看,这类博士生特征可概括为:以“申请-考核”入学,从开题环节起每个培养环节都滞后,学术基础差,科研能力弱。
综上,三类博士生画像的主要特征概括如表4所示。
表4 三类博士生画像主要特征
(三)不同博士生呈像差异及讨论
本研究借鉴已有的学术型博士生培养目标认为,学术型博士毕业生应具有饱满的学术志趣、坚实的学术基础和卓越的学术能力三个基本素质。进一步分析群像特征发现,与博士生毕业时间强关联的7类因素通过作用于博士生的学术志趣、学术基础和学术能力进而影响博士生的毕业时间。其中,博士生入学方式的不同、课程成绩的好坏反映了博士生学术基础和学术能力的差异;博士生在读期间是否获奖学金和荣誉表彰、是否按期完成开题、科研成果发表时间和数量,以及毕业论文送审时间反映了博士生的学术志趣、学术基础和学术能力的差异。
1.饱满的学术志趣:克服困难的动力
学术志趣立足兴趣,着眼志向,引领博士生探索创新,引导博士生增强学业规划的自觉意识。博士生在入学时都充满“雄心壮志”,但当学术热情与科研实际之间产生偏差时,不同博士生的学术志趣将出现差异性转变。从画像特征看,按期毕业博士生和第一类延期毕业博士生,在博士就读期间学业规划明确,学术兴趣强烈且呈现加强的趋势,强烈的学术志趣支撑他们全身心投入科研学习中,严格按时完成每个培养环节要求。延期毕业的博士生中,大部分入学时有较明确的目标志向和浓烈的科研兴趣,且能在读博前期保持住,但学术志趣在学术成果发表、毕业论文撰写等不同时间节点出现减退,导致延期。延期仍未能毕业的博士生普遍从开题阶段就出现学术志趣消退的状态,且消极被动的学习状态和意志力的减弱很难支撑他们顺利完成学业。
2.坚实的学术基础:支撑探索的基石
学术基础是博士生开展博士阶段学术研究的基本依托,是形成和发展提出问题、分析问题和解决问题的能力的必要保障。博士生入学前如果自身专业基础薄弱,寄希望于入学后通过课程或科研训练快速养成是比较困难的。从按期毕业和延期毕业博士生群像看,硕博连读学生在学术基础方面呈现出一定优越性,他们因学术经历的连贯性,提前进入课题组,博士入学前积累了一定的相关课题的学术基础,博士培养阶段的科研道路相对顺利。但从超期毕业博士生群体入学后的表现来看,部分“申请-考核”入学的博士生暴露出了学术基础薄弱的问题。尤其是第二类延期毕业博士生,作为应试型学习者,他们虽具备一定的学科基础,但博士生培养要求在专业领域内掌握坚实宽广的基础理论和系统深入的专门知识,仅靠应试的知识和能力是远不够的。
3.卓越的学术能力:创新研究的核心
学术能力是衡量博士生培养质量的基本指标,指博士生在学习、研究、技术开发和社会实践的过程中形成的,并通过完成论文、承担课题等方式将之付诸实践的能力。从三类群体画像看,按期毕业博士生及第一类延期毕业博士生,在课题研究推进、学术成果产出、毕业论文撰写方面都有更为突出的表现,按期毕业是水到渠成之事。后两类延期毕业博士生,科研综合能力在入学时较弱,在后期的课题研究、论文发表等学术锻炼中,学术能力得到提升,最终顺利毕业。超期毕业博士生从入学时就暴露出学术能力欠缺的问题,从博士论文开题起各培养环节难以在规定时间内完成,而学术能力的明显缺陷在短时间内很难改善。
图5 五类群像的差异性显示
五、结论与建议
(一)研究结论
本研究对国内某“双一流”建设高校的2017年入学博士生的学生入学信息、导师基础信息、综合素质表现、校园行为情况、科研学习情况五大类数据进行数据挖掘和群像分析,得出以下主要结论:
本研究的15个影响因素中,博士生入学方式、课程成绩、开题情况、科研成果数量和完成时间、在读期间是否获得奖学金和荣誉表彰及毕业论文送审时间共计7个因素与博士生毕业时间存在强关联性,这一结论进一步说明,博士生毕业时间与博士生每个培养环节能否顺利通关的关联性最大,该结论在已有文献中可得到印证。博士生入学年龄、入学前院校是否是“双一流”高校、导师年龄、导师任博导年限、导师指导学生人数、校园行为习惯这8个因素与博士生毕业时间关联性不强,该研究结论与以往研究结论有所出入,这种差异可能源于研究方法和调查样本的不同,可在今后研究中进一步证实。
通过对不同博士生群体画像特征的分析发现,不同博士生群体间确实存在不同的典型群体画像特征,可以预测和识别出按期毕业、延期毕业甚至超期毕业博士生。经进一步对比看出,按期毕业博士生和延期毕业中第一类博士生群体,培养成长过程更加契合博士生培养规律和要求,这两类学生画像特征可为其他延期毕业情况的研究提供参考。后两类延期毕业博士生和超期毕业博士生,因为学业困难无法按期毕业甚至无法毕业,是高校应该重点关注和帮扶的学生群体。
综合三类博士生画像特征和不同画像呈现的差异性发现,按期毕业博士生、延期毕业博士生和超期毕业博士生之间在学术志趣、学术基础和学术能力三个方面存在较大差异。按期毕业博士生和第一类延期毕业博士生在学术志趣、学术基础和学术能力方面都显示出较强优势。相反,超期毕业博士生在三个方面均存在较大缺陷。延期毕业的另两类博士生不同画像之间存在差异,但未在三个方面同时存在短板。
(二)研究建议
1.打破刚性限制与隐性歧视,确保优秀生源选拔的有效性
对于博士生教育而言,生源质量的重要性不亚于培养质量。随着招生规模的不断扩大,如何在数量增加的同时保证质量的稳定与提升,无疑成为了博士招生的重要难题。本研究发现,博士生的院校出身与毕业时间并不具备明显关联性,“名校出生”不等于“优质生源”,在制定博士申请资格条件时,要摒弃唯出身论,客观评价每一位考生。其次,重点考察学生学术志趣,热烈且高远的学术志趣才是攻读博士学位最持久的内驱力,缺乏学术志趣的学生难以克服读博过程中巨大的科研困难和压力,学术志趣强烈的学生有更大的学术投入和抱负。本研究中,硕博连读博士生按期毕业率略高于“申请-考核”的博士生,这并非指哪种招生方式更好,而是提醒高校在博士招生过程中,更应注重对申请者学术基础和学术能力的考察,如果没有扎实的学科和专业功底,是难以胜任繁重且高深的学业要求和科研任务的。贯通式培养相比于阶段式培养具备一定优势,例如培养周期短,导师与学生经过硕士阶段的磨合后,能减少培养过程中导生矛盾,但博士生“申请-考核”制招生作为我国博士招生制度改革的重要探索,高校仍需继续探索如何设计科学合理的考核内容和考核形式,确保人才选拔的有效性。
2.强化过程监督与分流退出,确保培养过程管理的科学性
本研究样本中两成的博士生从入学起就出现了不同程度的培养环节滞后,加强博士生培养的过程性管理迫在眉睫。首先,要将管理重心前移,严把重点关卡。本研究中,按期开题的博士生,按期毕业的概率越大;反之,毕业论文送审延期,延期毕业概率更大。博士生按期毕业与成功“通关”在一定程度上存在关联,论文开题关通过意味着获得“施工许可证”,论文送审关通过是争取“验收合格证”,验收不通过将直接导致延期,开工延迟还有补救可能,因此导师应在开题时对选题、思路及进度安排重点把关。第二,要利用信息化手段,建立过程监督管理机制,这一机制需要面向博士生、导师和管理者,还要深入各个环节,确保在各项工作开始前进行预告,并且在出现异常时及时发出预警。同时,要畅通分流选择渠道,健全分流退出制度。国家层面早已明确了“分流退出制度”对于博士生教育制度化建设与体系化保障的重要作用,但效果却不尽如人意。延期毕业率的攀升,仅依靠时间的宽限而未及时止损,都会带来学校教育资源和导师指导精力的浪费,高校须完善分流退出制度,并强化分流退出制度的操作与执行。
3.重视课程供给与基础培养,保障科研实践衔接的流畅性
高质量课程学习可以强化研究生的科学方法训练和学术素养培养。但从现实情况来看,博士生课程是博士生培养过程中较为薄弱的环节,博士生们也并不认同课程教学的重要性。对比本研究的三类博士生,延期毕业博士生入学时学术基础薄弱,导致科研训练过程受阻,进而影响毕业。通过课程教学强化学术基础,是帮助博士生顺利衔接科研实践的重要方法。高校应重视博士生课程教学改革,在课程内容方面,结合科研实际,跟进学术前沿,加强科研技能、研究方法、实验操作、学术写作类实用性课程;在课程内容和授课方式的选择上,满足学生个性化需求,提高学生自主性,通过对课程教学进行从内容到形式的多元化、个性化改革,强化博士生知识积累,为博士生独立从事科研工作奠定坚实基础。从培养理念上,纠正重科研训练、轻课程教学的错误导向,让博士生和导师共同重视课程教学,强化博士生在学术基础方面的积累。
4.呵护学术志趣和身心健康,保护科研创新探索的积极性
社会高期望、毕业高压力、科研高强度等,交织形成巨大的压力网笼罩着博士生群体,必然导致博士生群体的学术志趣减弱,焦虑情绪增加。《Nature》杂志2019年对690名中国博士生调查结果发现,40%受访者曾因读博期间的抑郁和焦虑寻求过帮助,该数据比其他国家博士生高出4%。本研究及相关研究中,学术志趣积极的博士生能以更积极的方式感知学习过程,参与学术活动,进而提升学术表现和缩短毕业时间。高校应探索多元发展性教育质量评价,淡化论文发表数量的评价导向,避免形成“内卷”生态,保护博士生的学术兴趣和学术热情。导师作为博士生培养的第一责任人,主动关心博士生学习规划、学术进展、职业发展、人际关系、身心健康,主动营造有利于导生相处的课题组文化环境,形成开放包容、团结合作的课题组学术交流氛围,激发博士生学术兴趣。导师在指导博士生时,应坚持因材施教的原则,根据学生的学术志趣确定研究方向,根据学生的学术能力匹配研究课题,并在课题确定后,强化对学生的指导。对于存在指导工作不投入、大量博士生超期未能毕业的导师,视情节予以相应惩罚。