25年来,概率与统计的知识内容大幅度增加,考察方法不断创新,逐渐形成了中国特色。遗憾的是,单就统计学模块而言,绝大多数高中教师都未能向学生正确、清晰地展示数学与统计学的本质区别,缺乏对其思想方法、研究范式的介绍,导致大量中学生甚至大学生认为中学统计模块是可有可无的应试累赘。
现行人教版数学课本将统计学模块分为以下三个部分:
参数估值(人教A版必修二9.1-9.3,人教B版必修二5.1-5.2);
假设检验(人教A版选择性必修三8.3,人教B版选择性必修二4.3.2);
相关与回归分析(人教A版选择性必修三8.1-8.2,人教B版选择性必修二4.3.1).
文末的参考文献是我使用的教材与资料的基本信息,如果你手边也有这些资料,可以和我一起翻到对应的页码。
⚠️警告⚠️
在阅读正文之前,请先确保你已掌握了人教版数学课本上有关列联表与独立性检验的全部知识,试着口答例1中的16个问题,否则你可能会在后续的题目中寸步难行!
以上问题的答案与方法均可在人教版数学课本中找到,这里不提供参考答案,不会就快去看数学课本吧~
在中学统计概率部分的教学中,比较容易出现重视做题忽视概念教学的情况,更加侧重对各种题型的解法技巧训练,而忽略了对基本概念的理解。但对于知识的灵活运用和迁移,往往建立在熟练掌握概念,理解其本质的基础之上……高考作为高校选拔新生的学业水平测试,应该加强基本概念考察,发挥积极的引导作用。同时,随学生水平的提高,也为加强概念考察创造了条件。
(赵轩,任子朝,2019)
本题将列联表与不等式相结合,正确选项可以借助不等式的性质证明,错误选项可以借助特殊值法排除,难度不大,但颇有新意。
本题答案如下:
在新课程标准后的高考中,加强了对统计知识内容的考察. 试题体现四个特点:1.模型化;2.生活化;3.直观化;4.综合化。统计与概率的产生和发展源于实际生活,大多数概念的提出都直接源于日常生活,因此命制的试题往往具有现实意义,其背景贴近生活……在命制试题时还应当注意到统计与概率与其他部分知识内容的有机结合……解决统计与概率问题的过程就是将具体问题抽象化,通过数学建模最终解决问题。
(陈昂,任子朝,2013)
在模拟卷中,列联表与独立性检验很容易沦为硬代公式的套路题,例2将列联表与不等式相结合,在知识的考查上有所创新。事实上,早在2018年教育部组织的针对粤鲁浙三省高三生的抽样测试中,列联表就与分布列、数学期望相结合,2022年新高考全国I卷中,列联表与条件概率、参数估值相结合,均能体现“统计与概率与其他部分知识内容的有机结合”这一命题特点。
今后应进一步创新试题选材与设计方式,打破机械刷题的套路和常规,强调理论联系实际,重视基本概念与主干知识的考察,与数学建模有机结合;还应体现出数学学科内部知识内容的有机融合,以及数学和其他学科的 紧密联系。
(赵轩,任子朝,2019)
那么,如何命制有关列联表与独立性检验的新定义问题呢?我们一起来看一道课本上的好题:
假设检验是统计学的核心内容,但在列联表的课堂教学中,教师往往会忽视该思想的重要性。假设检验的步骤如下:
第一步:建立总体没有显著差别的原假设(例如两总体大小无显著差异、总体服从正态分布、两总体独立等)并主观设定显著性水平(例如0.01,0.05等);
第二步:计算原假设成立条件下得到实际观察结果及更极端结果的概率(即相伴概率);
第三步:比较相伴概率与显著性水平的大小,若相伴概率小于显著性水平,就意味着观测到了一个原假设成立条件下不太应该发生的情况,从而拒绝原假设,否则就接受原假设;列联表的检验规则比较特殊,其比较的并不是相伴概率与显著性水平的大小,而是计算值与临界值的大小(计算值大于临界值等价于相伴概率小于显著性水平,从而拒绝原假设,否则接受原假设)。
本题答案如下:
本题难度较大,将课本上“等高堆积条形图”的几何直观对比转化为代数形式的统计学检验规则。其检验目标与方法显然与卡方独立性检验类似,因此可以选取同卡方独立性检验类似形式的规则。此外,数学课本针对“用样本频率差异比较总体差异”这一方法的评价并不深刻,仅指出其“未考虑样本随机性”。本题在此基础上更进一步,指出该方法相比卡方独立性检验,虽然更加直观同时也可以建立假设检验的规则,但其临界值是关于列联表4个频数数据的函数,查表检验时会有诸多不便,另外其临界值仍与卡方独立性检验的临界值有关,因此该方法不如卡方独立性检验。
数学与统计学的主要区别是,统计学在处理问题时不像数学那么严格,有点像是数据与模型之间的对话。
(Moore and Cobb,G. W.,2000)
统计学关心更多的是好与不好,而中小学传统数学关心更多的是对与错。
(史宁中,孔凡泰,秦德生,杨述春,2005)
相信本题可以很好地帮助读者理解假设检验的思维本质,从而掌握原假设与对立假设、显著性水平、临界值等重要概念。
本题的难点在于第(3)问应当如何设计列联表。在2007年人教A版选修2-3的习题3.2(p98)中有这样一道有趣的实验题,事实上给出了第(3)问列联表设计的关键思路——
本题答案如下:
当然,从统计学的视角看,本题不止一种方法。第(3)问的目标是比较两非对应总体的大小,统计学中有专门的参数方法(t-检验)与非参数方法(Mann-Whitney U检验,随机化检验等)。此外,若能将小白鼠的体重增量数据设计为成对数据(即先将20只小白鼠饲养在正常环境中,记录其体重增量;再将这20只小白鼠饲养在臭氧环境中,继续记录其体重增量),两对应总体的大小比较也许可以获得更高的检验功效,统计学中也有专门的参数方法(成对数据t-检验)与非参数方法(Wilcoxon加符秩检验,成对数据随机化检验等)。上述非参数方法其实并不像列联表的独立性检验一样晦涩难懂,非常适合对统计学感兴趣的高中生入门,开拓眼界。
最后,我们一起来看一下教育部的数学专家们的观点。
近几年的高考概率统计题中,愈发明显地突出理论联系实际的导向。创设符合实际的生产、生活和科研情境,利用更加灵活多变的情境设置展现概率统计知识广泛的应用范围,将概率统计知识与生活和其他学科联系起来,培养学生的应用意识,提升学生解决实际问题的能力。
高考中多采用应用题的形式对统计知识进行考察,让考生对给定数据进行整理、提炼、分析,进而得出结论……试题考察的重心放在整理数据,利用统计知识分析推断信息之中。
概率类题目的答案往往比较明确,一个题目只有一个正确答案;但统计类题目有时会存在开放性,对同一个问题也可以从不同角度来分析和解释,有时由于分析方法不同也可能有不同的答案。
(赵轩,任子朝,2019)
回看2017年全国I卷第19题、2018年全国I卷理科第20题、2018年全国II卷理科第18题、2019年全国I卷理科第21题、2021年新高考全国II卷第21题、2022年新高考全国I卷第20题、2023年四省联考第20题、2023年新高考全国I卷第21题、2023年新高考全国II卷第19题、2024年新高考全国II卷第18题……你是否不再觉得中学的概率与统计模块是可有可无的应试累赘了呢?
参考文献
陈昂, 任子朝. 课改后统计与概率内容考查研究[J]. 数学通报, 2013, 52(02): 13-16+24.
National Research Council. Everybody Count. Washington DC: National Academy Press, 1989.
魏宗舒. 关于中学数学中讲概率的一些意见[J]. 数学教学, 1979: 4-5.
赵轩, 任子朝. 高考概率统计试题考查目标的沿革与实现[J]. 数学通报, 2019, 58(10): 39-43.
张德然, 茆诗松. 高中概率统计教学中关于随机性数学思维的培养[J]. 课程·教材·教法, 2003(9): 39-42.
Moore and Cobb, G. W. Statistics and mathematics: Tension and cooperation[J]. The American Mathematical Monthly, 2000, 107(7):615-630.
史宁中,孔凡泰,秦德生,杨述春. 中小学统计与其课程教学设计——数学教育热点问题系列访谈之二[J]. 课程·教材·教法,2005,6.
人民教育出版社课程教材研究所, 中学数学课程教材实验研究组. 普通高中课程标准实验教科书B版:数学选修2-3[M]. 第2版. 北京:人民教育出版社, 2007: 77-82.
人民教育出版社课程教材研究所, 中学数学课程教材研究开发中心. 普通高中课程标准实验教科书A版:数学选修2-3[M]. 第2版. 北京:人民教育出版社, 2009: 91-98.
人民教育出版社课程教材研究所, 中学数学课程教材研究开发中心. 普通高中教科书A版:数学选择性必修(第三册)[M/OL]. 124-136. https://jc.pep.com.cn [最后访问日期:2024年9月11日]
人民教育出版社课程教材研究所, 中学数学课程教材实验研究组. 普通高中教科书B版:数学选择性必修(第二册)[M/OL]. 116-122. https://jc.pep.com.cn [最后访问日期:2024年9月11日]