用数据分析提升教育质量——卡方拟合优度检验与教育教学

文摘   2024-09-08 16:02   河南  

构思“教育学人Education 201” 时,“用数据分析提升教育质量”是一个我很感兴趣的选题:互联网、云计算、大数据等现代信息技术深刻改变着人类的思维、生产、生活、学习方式。而我无论做教育研究还是做教学实践,仍欠缺信息素养——根源是数学功底太差。但是这些年学习、使用人工智能的经验使我萌生了再次挑战数学的勇气——如果不让AI教我,那么万一有一天它骗我呢

成年人学习,要有一种”要往何处去,就从那处开始“的实用精神,那就从“用数据分析提升教育质量”吧。

关于数字化提升教育发展质量,人民日报曾指出:

建设“人人皆学、处处能学、时时可学”的学习型社会,培养大批创新人才,是教育工作者面临的重大课题。

数据分析能力虽然只是数字化中极小的一部分,但确是每一个教育工作者都能做,每一个教师都能学的。从大了说,数据分析能够帮助教育者更好地理解学生的学习需求,提供个性化的教学支持;从小了说,数据分析能够帮老师看清教学问题,拨开云雾见太阳

面向未来,数据分析也是“学习分析技术(Learning Analytics)”的基本功,测量、收集、分析和报告有关学习者及其学习环境的数据、理解和优化学习过程以及学习发生的环境、利用数据分析来揭示学习者的学习模式、学习策略和学习成果,以及评估教学策略和教育政策的实施效果

“卡方拟合优度检验”是一个简单的数据分析方法,本篇用一个简单的例子来说明、讲解、演示、延伸其在教育教学中的作用。

  实战案例:学校男女比例是不是 1:1?

某中学新教师小王在新教师培训会上听到校长说,“本年度实验班招生具体数字为男生 55 人,女生 45 人, 符合男女比例1:1 的招生预期…”心里非常疑惑:“这 55:45,一看就不是 1:1 呀,怎么校长说得这么理所当然呢”,于是他向自己的老朋友小李询问。

小李说:这个 55:45,到底是不是符合1:1 的招生预期,还得做个卡方拟合优度检验。

“不是,这一眼就能看出来不对的事,还要做个什么什么检验吗?”

想解决上述问题,首先要在 Excel 建立一个表格,共100 个学生,其中 55 个男性,45 个女性,输入到 SPSS 数据分析软件之后,描述统计结果为:

描述统计就是直观测量的数据描述,并不能反映与预期或声明之间的统计学意义。“小王”被校长的话搞迷糊,就是因为没看出这一层。

卡方拟合优度检验(Goodness-of-Fit Chi-Square Test)是一种统计学上的假设检验方法,用于确定观测数据与某一理论分布是否具有显著差异。在本案例中,其目的就是检验学校实际的男女比例 55:45 和校长声称的 1:1 之间的差异是否有统计学意义。

SPSS 的卡方拟合优度检验给出的结果如下:

  AI让数据说话

接下来非常关键的一步来了:数据分析之所以不是大众技能,是因为结果不直观,只有少数人能看懂,甚至说分析者本人都看不懂。“专家”们可能会做些数据可视化:

可是可视化以后仍然看不懂,干脆就问 AI 好了,反正有了这些 chisq 、p 的值,它到底什么意思?

问了 AI 后它给出这样的解释:

AI 告诉我:

在这个例子中,p值为0.317,通常在统计学中,如果p值大于某个显著性水平(如0.05),我们就没有足够的证据拒绝零假设。这意味着观察到的数据与校长所说的1:1男女比例没有显著差异,因此不能断定男女比例不符合1:1的预期。换句话说,实验班的男女招生比例在统计学上是符合校长所说的1:1预期的

 “卡方拟合优度检验”详解

卡方优度拟合检验(Goodness-of-Fit Chi-Square Test)是一种统计学上的假设检验方法,用于确定观测数据与某一理论分布是否具有显著差异。这种检验通常用于分类数据,以判断样本数据是否符合某种预期分布。

进行卡方优度拟合检验时,首先需要建立一个零假设(H0),即假设数据遵循特定的理论分布 (如:上述案例中假设的“观察到的男女比例符合预期比例 1:1)。然后,根据这个理论分布计算每个类别的期望频数。接下来,将观测到的频数与期望频数进行比较,计算每个类别的卡方值,并将所有类别的卡方值累加得到总的卡方统计量。

最后,将计算得到的卡方统计量与卡方分布的相应临界值进行比较,以确定是否拒绝零假设。如果卡方统计量大于临界值,或者计算出的p值小于预定的显著性水平(如0.05),则拒绝零假设,认为观测数据与理论分布存在显著差异。

“卡方拟合优度检验”这个名词可以拆分为三个部分,每个部分都有其特定的含义:
  1. 卡方(Chi-Square)
  • 卡方是一个统计量,用于度量两个变量之间的相关性或一个变量的观测分布与理论分布之间的差异。
  • 它基于卡方分布,这是一种概率分布,用于描述在多次独立实验中成功的次数与期望次数之间的偏差。
  • 在统计检验中,卡方值是通过计算观测频数与期望频数之间的差异,并对其进行加权求和得到的。
  • 拟合(Goodness-of-Fit)
    • 拟合在这里指的是观测数据与某种理论模型或预期分布的匹配程度。
    • 在统计学中,拟合优度检验用于评估一组观测数据是否与某个理论分布相吻合,或者说是否能够被该理论模型所“拟合”。
    • 它帮助研究者判断实际收集的数据是否符合特定的预期模式或假设。
  • 检验(Test)
    • 检验是指一种统计方法,用于基于样本数据对某个科学假设进行验证。
    • 在统计学中,检验通常涉及计算一个统计量,并将其与某个分布(如卡方分布)的临界值进行比较,以决定是否拒绝零假设。
    • 卡方拟合优度检验是一种特定的检验方法,它使用卡方统计量来评估观测数据与理论数据之间的差异是否具有统计学意义。
    综合来看,“卡方拟合优度检验”是一种统计检验方法,它使用卡方统计量来评估观测数据集是否符合某个理论分布的预期,从而帮助研究者或数据分析人员判断实际数据与理论模型之间的一致性。
     “卡方拟合优度检验”的应用场景

    卡方拟合优度检验(Goodness of Fit Test)是统计学中的一种假设检验方法,用于评估一组观察值与某个理论分布的一致性程度。在教育教学领域,卡方拟合优度检验被广泛应用于多个方面,包括但不限于学生成绩分析、教学方法评估、教育公平性研究等。下面我们将详细探讨卡方拟合优度检验在教育教学中的具体应用场景。

    学生成绩分析

    在教育教学中,教师和学生都关心学生的成绩分布情况。卡方拟合优度检验可以用来判断学生的成绩是否符合正态分布,这是教育评估中的一个重要组成部分。例如,通过对学生的考试成绩进行卡方拟合优度检验,可以判断学生的成绩分布是否均衡,是否存在异常分数聚集的现象,这对于制定后续的教学计划和提高教学质量都有重要意义。

    教学方法评估

    教学方法的有效性评估也是卡方拟合优度检验的一个重要应用。通过检验学生在不同教学方法下的成绩分布,教师可以判断哪种教学方法更受学生欢迎,哪一种方法更能促进学生的学习进步。例如,如果一种教学方法导致学生的成绩分布更加集中在中等和高分段,这可能表明该方法更有利于提升学生的学术表现。

    教育公平性研究

    教育公平性是现代教育体系的核心价值之一。卡方拟合优度检验可以用来评估不同群体(如不同性别、不同家庭背景的学生)在教育资源获取和教育成果上的差异。通过比较不同群体的成绩分布,可以揭示潜在的教育不公平现象,并为改进教育政策提供数据支持。


     教育学人说:
    文中的案例纯属虚构,但表格、图表和数据分析均是根据虚构场景下做的真实值分析。再次强调,AI 可以在做数据分析时给出建议,对分析结果给出解释,但分析过程不能保证合理性和可信度。这也是我选择要学习、分享该话题的原因,希望和大家共同进步。


    教育学人AIED
    课程与教学研究与分享,包括但不限于教育概念辨析,教育观念批判。
     最新文章