付玲毓，贾积有|基于教育数据挖掘的学习行为和学业成就分析——以北京大学某门慕课为例

文摘 2024-11-07 08:53 河北

本文刊载于2024年第5期

基于教育数据挖掘的

学习行为和学业成就分析

——以北京大学某门慕课为例

付玲毓1,2 贾积有3

（1. 中国矿业大学（北京）文法学院，北京100083；2. 北京大学对外汉语教育学院，北京100871；3. 北京大学教育学院，北京100871）

[摘要]采用数据挖掘技术，对北京大学在Coursera平台开设的某门慕课的学习者行为数据进行深入分析。研究发现：总体而言，学员对课程任务的参与度高于讨论区。学员可以聚类为“杰出型”“浏览型”“消极型”三簇特征群体。在线时长、小测成绩、浏览网页频次等是影响完课学员最终成绩的关键因素。基于此，针对慕课教学设计提出若干建议，如：设置奖励机制以增强课程互动性、提供个性化的课程设置、调整小测的频次和难度以发挥小测的促学作用、增加课程笔记等功能来提高学员浏览网页的频率和效果等。这些措施有助于提高学员的学习效果和满意度，进而优化慕课教学。

[关键词]教育数据挖掘；在线学习行为；学业成就；教育大数据；个性化教学

作者简介

通信作者简介：贾积有，北京大学教育学院教育技术系主任、教授、博士生导师，北京大学教育信息化国际研究中心主任。主要研究方向为教育技术学、人工智能教育应用、计算机辅助语言教学、教育决策支持系统等。主持和参与20多项国内外重要科研项目，包括国家重点科技攻关项目、国家社科基金、全国教育科学规划课题等。

作者简介：付玲毓，中国矿业大学（北京）文法学院讲师，北京大学对外汉语教育学院博士研究生。主要研究方向为计算机辅助语言教学。

慕课，全称“大规模开放在线课程”（Massive Open Online Course，MOOC），是一种通过互联网向全球大量学生提供在线教育课程的教学模式。以Coursera为代表的诸多慕课平台提供了丰富多样的课程内容，也吸引了世界各地数量众多的学习者。但是，慕课普遍存在的问题是低完成率和高流失率。鉴于此，有必要深入分析学习者的学习行为，了解造成低完课率的原因，从而有针对性地提升课程质量，增强学生持续学习的动力。

教育数据挖掘是数据挖掘技术在教育领域的应用。数据挖掘功能包括描述性和预测性两大类，描述性挖掘任务刻画目标数据中数据的一般性质，预测性挖掘任务在当前数据上进行归纳，以便做出预测。常见的描述性数据挖掘功能有聚类、关联规则挖掘、文本挖掘等；常见的预测性数据挖掘功能有分类与回归等。聚类将一个整体数据集分成多个类别，每一类中都包含相似的一簇数据，不同簇之间的相似度较低；分类主要处理分类型标记，根据数据特征将其归入不同的标签或类别；回归分析则是最常见的针对数值型变量的预测方法，通过建立回归模型，试图学习输入数据和输出之间的函数关系。

课题组选取了Coursera平台的一门大规模在线开放课程，借助数据挖掘技术，深入剖析了学生的在线学习行为数据。该课程的选课人数众多，学员来源广泛，具有代表性。其研究成果将对慕课教学的优化与提升产生深远影响，具有普遍的指导意义。课题组运用聚类分析方法，将学生划分为不同的学习群体，以便了解他们的学习特点和习惯；通过回归分析，课题组探究了影响学业成绩的关键因素。具体研究问题如下：（1）这门慕课的学员总体完课和参与情况怎样？（2）影响不同类型学习者的特征因素有哪些？（3）影响完课学员最终成绩的因素有哪些？

研究现状

随着网络技术在教育领域的广泛应用，学习者在线学习行为和学业成效的关系成为教育技术领域的研究热点之一。近些年来，国内外已积累了一些研究结果。

慕课学业成绩影响因素的研究，历来备受关注。预测慕课中学员成绩的研究主要集中在慕课活动的频率上。总体而言，慕课平台上的活跃用户展现出更为优异的学业表现。而关于学业成绩的相关指标，学者们普遍认为主要包括浏览观看的参与程度、任务完成的效率与质量，以及论坛讨论的活跃度3类。有研究发现：作为慕课学习的重要组成部分，视频观看与完课率呈正相关。除观看视频外，慕课通常要求学生完成测验和作业，才能取得最终成绩。学习者完成小测的次数与最终成绩正相关。相比浏览和作业，论坛活跃程度对成绩的预测作用则较弱且颇具争议。尽管有学者发现论坛发帖与慕课完成率正相关，但也有学者得出相反的结论。

随着研究的细化，学者们逐渐关注具体学科门类的慕课成绩影响因素。如Martín-Monje 等对一门语言类慕课的学习者行为数据进行分析后发现：定期提交自动评分任务是预测课程成绩的可靠指标。此外，大多数学习者是课程“观众”，他们更倾向于观看视频，较少完成其他课程任务，这也解释了慕课完课率普遍较低的原因。

国内慕课研究积极与国际接轨，也发表了数量可观的研究成果。魏顺平采用教育数据挖掘的方法，分析了Moodle平台某门在线学习课程的学习过程活动总体情况和特点，是国内较早的有关在线学习数据挖掘的研究。贾积有等以北京大学6门开设在Coursera平台的慕课为对象，分析了学员的上网行为及其对学业成绩的影响，是国内出现最早的针对慕课的数据挖掘研究。陈兰岚和宋海虹使用数据统计和数据挖掘的方式，分别分析了Canvas Network平台的238门慕课课程的学习过程和成绩数据，虽然样本量多、数据量大，但数据分析局限在以描述性统计为主的层面。沈欣忆等建立了在线学习行为与在线学习绩效评估模型，并通过抽样逐步回归，发现学生的作业完成比例、视频完成率等行为对学习效果产生重要的正面影响。此外，杨小丽和韩雷总结了近年来国外慕课研究的现状、特点和范式，并对国内相关研究提出了启示和建议。国外国内的预测研究目前主要依赖于统计方法，更为先进的工具和手段还有待尝试。

以上研究都表明，基于教育数据挖掘的用户行为分析，有助于发现影响用户学业成绩的潜在规律，从而优化学习过程，促进教学效果的提升。然而，以往的研究在将描述性和预测性数据挖掘技术相结合方面鲜有突破，未能既充分关注到不同类别学习者的特征，又全面探讨慕课成绩的影响因素。基于这样的背景，课题组以北京大学某门在Coursera平台上开设的慕课课程为例，从平台提供的学员行为数据入手，探究影响学习者课业成绩的因素。课题组着眼于慕课完课率低的现实问题，为了给各类学习者提供个性化的教学建议，首先采用了先进的聚类算法，将学员划分为多个具有不同特征的簇群。随后针对已成功完成课程的学员，整合了目前研究者广泛关注的3大类学业成绩影响因素，深入探究了影响不同类别学习者成绩的具体原因。课题组将教育数据挖掘技术与学习分析相结合，希望为慕课课程的设计改进和个性化教学提供依据，从而提升学习效果。

研究设计

2.1 数据来源

从方便取样的角度出发，课题组选取了北京大学在Coursera平台开设的一门课程的数据作为分析样本。这门课程由北京大学一位经验丰富、深受欢迎的专家型教师主讲，注册学员人数众多且来源广泛，课程采用线上教学模式。经任课教师允许，课题组从Coursera平台获取了课程数据，主要包括：15 168名学员的人口统计数据（如年龄、性别、国籍等）、论坛数据（如发帖、回复、投票等）、成绩数据（小测成绩、课业最终成绩）、进度数据（学习者接触某一课程内容时刻的事件数据）等。出于研究伦理的考虑，课题组在提及课程时，不公布具体课程名称，而是以“某门慕课课程”来代替。

2.2 数据分析

课题组对原始数据进行了清洗和筛选预处理，删除了缺失值和异常值，并参考沈欣忆等的研究，将该课程数据划分为学员基本信息、浏览信息、论坛参与、评估评价4部分。其中学员基本信息包含15 168名学员的注册时间、开始学习时间、在线时长。浏览信息包含观看视频频次、浏览网页频次、浏览讲义频次。论坛参与情况包含发帖和回帖次数、发帖和回帖得票、论坛声望指数等。评估评价则包含平时小测成绩及课业最终成绩。

数据分析首先使用SPSS（26.0）对数据进行描述性统计，计算每项学习活动指标的人均均值、标准差、获得该项指标的人数，以及其在所有学员中所占比例，描述各项指标的总体情况。然后使用WEKA（3.8.6）对全体学员数据进行聚类分析。WEKA是怀卡托智能分析环境（Waikato Environment for Knowledge Analysis）的简称，是一个JAVA环境下开源机器学习和数据挖掘软件，提供了一系列的算法和工具，可以用于数据预处理、分类、回归、聚类、关联规则挖掘等任务。聚类分析采用同类研究中广泛使用的K-means算法，seed参数设为10，并调整K值直至SSE趋于稳定。最后，为探究影响学员最终成绩的因素，课题组按有无最终成绩将学员分成两类，先用SPSS软件对全体学员和完课学员的行为数据分别进行相关分析，再用WEKA 软件对完课学员的最终成绩进行预测分析。在预测分析阶段，先使用特征选择功能对特征进行排序，后采用回归算法构建在线学习成就评估模型，最后用神经网络算法验证特征选择和回归算法的结果。其中回归模型如下所示：

y=α+x1β1+x2β2+…+xiβi+ε

式中，α表示截距，x表示自变量，β表示自变量的参数，ε表示误差。

结果与讨论

3.1 学员总体完课和参与情况

课题组首先对各项学习活动指标进行了描述性统计分析，结果见表1。选修这门课程的学生共有15 168人，其中最后取得学业成绩的有1 620人，完课率为10.68%。课题组参考常规考试，将60分作为及格成绩的阈值，那么在完课学员中，有581人取得高于（含）60分的学业成绩，及格率为35.86%。及格学员占全体学员的比例为3.83%。

该门慕课行为数据的描述性统计情况如表1所示。由于该平台日志仅记录了用户的登录时间，而缺乏退出行为记录，并且用户关闭浏览器时并不会自动记录退出时间，因此系统无法准确捕捉到用户在线学习的时间长度。鉴于此，课题组借鉴前人的做法，参考常规教学时间来定义用户的在线学习时间，将最后一次登录课程网站的时间与注册时间之差视为在线时长。本课程的学员平均在线时长为29.13天。平时小测是检验学员阶段性学习效果的方式，约有四分之一的学员获得了小测成绩。浏览网页、观看视频、浏览讲义可帮助学生获取课程知识和重要信息，大部分学生都参与了这三类学习活动。Coursera还设置了课程讨论区，创设了师生交流互动的机会，学生可以通过发帖和回帖参与讨论，也可以对讨论区内的帖子进行投票，但学生在课程讨论区的参与度总体较低。

表1 慕课课程学生各项学习活动指标

3.2 学员特征聚类

聚类分析是把相似的数据进行聚合处理，每个分类聚群成为一簇。为识别和描述不同学业成就慕课学习者的特征，并为预测最终成绩的分析提供参考依据，课题组使用WEKA软件对学习者行为数据进行聚类分析：选取在线时长等11项指标，采用K-means算法，将seed参数设为10。当K值设定为大于等于3时，SSE趋于稳定。因此，将学员聚类为3簇，误差平方和为573.72，最终聚类效果较好。聚类分析结果有助于区分完课学员、高分学员和低分学员，为个性化教学建议提供坚实的基础。同时，鉴于课题组重点关注的是学业成绩影响因素，因此，在可视化分析阶段，课题组将特别关注学员最终成绩与聚类结果之间的相互关系。

聚类分析的结果见表2。每个聚类的中心点的坐标值表示该类的数据对象在每个属性上的平均值，这些值有助于理解每类学习者的特征和区别。“杰出型”学习者的在线时长、小测成绩、浏览网页、观看视频、浏览讲义、最终成绩方面都明显高于其他类型学习者。这意味着这类学习者在这门课中投入度很高，付出很多时间精力和努力，从而取得较高的课业成绩，大多在及格分数以上。“浏览型”学习者的在线时长、观看视频、浏览讲义、小测成绩等指标都比较接近群体学员的均值。这可能表明这类学习者在慕课中的学习活动以浏览视频和讲义为主，对完成课程任务的兴趣不大，最终很可能并未取得课业成绩，或者只获得较低的分数。“消极型”学习者的在线时长、小测成绩、浏览网页、观看视频、浏览讲义、最终成绩等各项指标都低于全体学习者的均值。这说明“消极型”学习者在该门慕课中整体投入度较低，并未付出足够多的努力，最终很可能并未完成本课程全部学习内容，也并未取得课业成绩。这一点与前人研究结论相似，大多数的学习者是课程的“观众”，取得成绩并非其进行慕课学习的核心目标。

表2 全体学员聚类结果

为了更直观地探究聚类结果中三簇学员最终成绩与学习行为的关系，课题组分别以每项行为指标为X轴，最终成绩为Y轴，对学习行为因素和最终成绩的关系进行可视化分析。横向比较可视化聚类结果后发现：在线时长和小测成绩是区分不同类型学习者最为明显的指标，浏览信息相关指标具有一定的区分作用，而论坛参与相关指标在各簇学员之间的区别并不明显。

如图1所示，“杰出型”学员在线学习时长多数集中在100天以上，普遍长于其他两类学员，这簇学员的最终成绩也普遍较高，集中在及格分数以上。“浏览型”学员的在线时长虽然大多长于45天，但时长分布较为分散，他们的成绩也普遍处在及格分数以下。“消极型”学员的在线时长在三簇学员中处于最低，课业成绩也低于其他两类学员，大多数人并未获得学业成绩。这说明学员在Coursera平台的学习时长是区分不同类型学员的关键因素，学员在平台进行课程学习花费的时间越多，就越有可能坚持学习直至完课，并取得高分成绩。

如图2所示，“杰出型”学员小测成绩集中在180~290分；“浏览型”学员小测成绩相对比较分散，在40~180分之间都有广泛的分布；“消极型”学员的小测成绩则更低，大量集中在20分以下。可视化结果非常直观地呈现了小测成绩和期末成绩的正相关性：如果学员平时小测成绩较高，那么其最终期末成绩也较高。这说明慕课的小测任务在促进学习者的理解和记忆、检验学习成效、提高学习动力和自律性等方面都有着不可或缺的作用。积极参与小测验的学习者往往能够更有效地提升学习效果，取得良好的课业成绩。这一发现与前人研究有相似之处。

对三类浏览信息行为（浏览网页、观看视频、浏览讲义）与最终成绩分别进行聚类可视化分析，结果都表明：“杰出型”学员的浏览行为频次相对比较分散。虽然“杰出型”学员的浏览行为普遍高于其他两簇学员，但是确实存在一部分学员，其浏览行为频次较低，却也取得了较高的最终成绩，也有一部分学员虽然浏览行为频次较高，但最终成绩并未集中分布在高分段。这说明，慕课学习者通过浏览课程网页、观看视频、浏览讲义，可以获取更多的信息和知识，也能够很好地理解和掌握课程内容，取得较高的成绩。但是，学员的学习目标和习惯确实存在较大的个体差异：如果学员以取得高分为首要目标，他们可能会更加有选择性地观看与考试直接相关的内容，以提高学习效率；而某些学员则类似于传统课堂中的“旁听者”，其在线学习的主要目标是通过学习课程内容来获取专业知识，并没有把获取较高的最终成绩分数当作学习的核心目标。

课题组将论坛相关指标（发帖数量、发帖得票、回帖数量、回帖得票、论坛声誉）与最终成绩进行聚类可视化分析，均未呈现出明显的内部相似性或者聚集趋势。这一现象的出现很可能是因为，参与论坛讨论的学生们的积极性普遍不高，导致实际的互动行为较少。因此，不同类型的学生们在论坛表现上的数据与其最终成绩之间不存在显著差异。这表明，对于这门课程而言，论坛的这些指标可能并不具备预测学生最终成绩的能力。课题组将在下文中进一步结合预测分析的结果，对此进行深入探讨。

图1 在线时长与最终成绩聚类可视化结果

图2 小测成绩与最终成绩聚类可视化结果

3.3 影响最终成绩的因素

为进一步探索影响本门慕课学员最终成绩的关键因素，课题组采用了预测性数据挖掘的方法。其核心在于学习样本数据的输入与输出之间的关联，并据此构建一个预测模型。模型旨在发现数据中的隐含模式和趋势，并利用这些模式对未来的事件或结果进行预测。预测分析主要包括分类和回归两大类，分类适用于处理离散型的类别数据，而回归则用于处理连续型的数值型数据。本研究中慕课的最终成绩为数值型数据，适用于回归预测，回归分析也是预测模型中常用的方法。

课题组按有无最终成绩将学员分成两类，用SPSS软件对全体学员和完课学员的行为数据进行相关分析，用WEKA 软件对完课学员的最终成绩进行回归预测分析。在WEKA软件中，预测功能主要通过“分类（classify）”模块下的多种算法实现，其中回归和神经网络算法便是代表性的例子。此外，WEKA还提供了“特征选择（select attributes）”这一特征选择工具，协助用户从大量数据中筛选出最为关键的属性特征。

相关分析常常在分类和回归之前进行，用于识别与分类或回归过程显著相关的属性。课题组将全体学员和完课学员的学业成绩与各项学习活动指标进行相关分析，结果显示：对全体学员来说，除发帖得票、回帖得票和论坛声誉外，在线时长、小测成绩、浏览网页、观看视频、浏览讲义、发帖数量、回帖数量等各个指标与最终成绩均在0.01水平达到显著相关。对取得成绩的完课学员而言，在线时长、小测成绩、浏览网页、观看视频、浏览讲义、发帖数量等各个指标与最终成绩均在0.01水平达到显著相关，回帖数量与最终成绩在0.05水平显著相关，而发帖得票、回帖得票、论坛声誉与最终成绩没有显著相关。

为探究影响完课学员慕课最终成绩高低的关键因素，课题组使用WEKA 软件对1 620名完课学员的最终成绩进行预测分析。首先使用SPSS软件进行多重共线性检验，计算自变量之间的方差膨胀因子，删除造成严重多重共线性的指标“论坛声誉”；然后使用WEKA的特征选择功能，从数据集中筛选出排名前6位的特征：小测成绩、在线时长、浏览网页、浏览讲义、观看视频、发帖数量；再使用WEKA预测功能中的线性回归算法，建立预测模型；最后使用神经网络算法，验证预测模型。

线性回归模型方程如下：

学习成绩=0.011 7×在线时长+0.304 5×小测成绩+0.003 9×浏览网页-0.010 3×浏览讲义-0.281 2×发帖数量+0.746 4

该模型相关系数为0.987 7，平均绝对误差为3.853 9，根均方误差为5.812 2，相对绝对误差为11.122 4%，根相对平方误差为15.595 8%。综合来看，模型的相关系数很高，说明模型对数据拟合度很好。平均绝对误差和根均方误差较小，具有较强预测能力。线性回归和特征选择的结果几乎一致，但是特征选择结果中的“浏览视频”指标并未出现在WEKA线性回归结果中。这可能是由于完课学员的视频浏览行为相对比较分散，因而无法成为预测最终成绩的关键因素。

为进一步验证线性回归模型的结果，课题组使用神经网络模型中的多层感知器算法，将特征选择和回归模型选择出的上述5个特征纳入分类器模型，得到分类统计模型表。该模型相关系数为0.987 2，平均绝对误差为4.134 9，根均方误差为5.951 8，相对绝对误差为11.933 3%，根相对平方误差为15.970 4%。综合来看，模型的相关系数很高，说明该模型数据拟合度很好。平均绝对误差和根均方误差较小，具有较强预测能力。结合前文的线性回归模型评估结果，两个模型各个评估指标都比较好。

线性回归模型和神经网络模型的结果都表明：在线时长、小测成绩、浏览网页、浏览讲义、发帖数量这5项指标，对学员的最终成绩有较强的预测作用。其中，在线时长、小测成绩、浏览网页对最终成绩有正向影响；浏览讲义、发帖数量则会负向影响最终成绩。预测慕课成绩的正向影响因素与一些学者的研究结论一致。浏览讲义对成绩的负面影响可以用Anderson等人的观点来解释，有一部分学员可能是课程资料收集者，热衷于在慕课平台下载课程资料，而对获取较高的课业成绩兴趣不大。虽然有研究表明：在线互动是促进高水平知识建构、发展学习者能力和取得出色学业成就的重要策略，但本研究的数据分析结果并不能佐证这样的结论。一个可能的解释是学习者的论坛发帖不太可能增加学习者的认知投入，也不太可能产生多少真正有意义的内容。

结论与建议

课题组使用SPSS和WEKA软件工具对北京大学某门慕课的学员行为数据进行数据挖掘。分析结果显示：和大部分慕课类似，本课程完课率也较低。大部分学员都积极参与课程相关的学习任务，而在讨论区讨论的积极性不高。学员可以被聚类为“杰出型”“浏览型”“消极型”三簇特征群体，在线时长和小测成绩是区分不同类型学习者最为明显的指标。影响完课学员的最终成绩高低的关键因素为：在线时长、小测成绩、浏览网页、浏览讲义、发帖数量。

根据以上结果，课题组对慕课课程设计提出如下建议。

（1）针对学员积极参与课程学习任务却在课程讨论区讨论的积极性不高的问题，建议在课程设计中增加课程讨论区的互动性，鼓励学员积极参与讨论和交流。如可以采用设置奖励机制、评选优秀发言或增加互动环节等方式来提高学员的参与度和积极性。此外，还可以组织在线互动活动，如直播讲座、在线答疑等，以增强师生互动和学员参与感。

（2）根据学员被聚类为“杰出型”“浏览型”“消极型”三簇特征群体的结果，建议课程“注重慕课教学的个性化”，根据学员的学习特点和行为习惯，为其推荐适合的课程内容和学习方式，以满足不同学员的学习需求，提高学员的学习积极性和学习效果。如可提供更深入复杂的学习内容、更具挑战性的学习任务，以满足“杰出型”学习者的需求。还可以鼓励他们参与高水平的讨论和互动，促进其学术交流、挖掘思维深度。还可通过在平台增加学习过程监测手段，如学习活动指数，引导“浏览型”学员制定系统的学习计划，避免只停留在表面浏览的学习方式。此外，可提供更直观、更易理解的学习资源，帮助“消极型”学员更好地理解和消化知识。设立更为明确的学习目标和激励机制，激发“浏览型”和“消极型”学员的学习兴趣和积极性等。

（3）为提高完课学员的最终成绩，建议课程强化在线课程资源的使用，提高学员在线时长、充分发挥小测的以考促学作用、提供浏览网页的支持。比如，通过提供更为丰富的教学资源、增强课程互动性、设置奖励机制等方式来提高学员的参与度和在线时长；通过调整小测的频率、难度等方式来提高学员参与小测的积极性；通过提供在线阅读器、增加课程笔记等功能来提高学员浏览网页的频率和效果。这些措施可以有效提升课程浏览和评估评价功能对学员成绩的正面影响，从而帮助学员取得更好的学习成果。

本研究存在一定的局限性。首先，课题组未考虑学习者个体因素。虽然Coursera平台记录了学习者的人口统计学信息，但课题组并未将这些变量纳入分析。未来研究可以对不同背景的学员进行分类讨论，深入分析不同学员群体的学习行为特征。其次，课题组并未访谈任课教师。教师访谈可帮助研究者更深入地理解课程设置的目标，从而给出更有针对性的教学建议。未来，研究可结合教师访谈深入开展。

（参考文献略）

编辑｜刘冰

审核｜孙菊

终审｜刘鑫刚

教学研究杂志

推广《教学研究》期刊，传播教育教学知识，报道最新学术资讯。编辑部电话：0335-8047551QQ：2214348579网址：http://jxyj.ysu.edu.cn/