问题30
数据分类的方法有哪些?在教学中如何把握?
《课标2022》在统计与概率领域中特别强调了“数据分类”。在统计的全过程中,数据分类是基础。对学生而言,了解数据分类的方法有哪些类型、如何在具体情境中选用不同的方法是最重要的。
一、数据分类的方法
“数据分类”的方法一般有两类:第一类是对分类结果进行数字化处理,即把事物的不同属性用数据赋值;第二类是对收集的数据进行分类,即先把调查收集到的所有数据按照一定的标准进行分类,再根据数据所蕴含的信息进行预测、决策等。
下面以案例的方式展示在“数据分类”中进行数据分段、数据分组、数据抽样的方法。
1.“数据分段”方法案例解读
学校要为2年级学生定制校服,为了让每个学生都能穿上合身的校服,以班级为单位进行调查。师生交流要调查收集哪些数据、如何为学生选定合适的校服等问题。
第一步:将思路聚焦到调查身高信息,并收集每个学生的身高数据。
第二步:得到学生身高数据后,通过询问“把这些身高数据直接送到服装厂可以吗?你有什么想法”来启发学生思考和交流。
在交流中学生产生了分类整理数据的需求。
第三步:按照标准进行分类。
教师先出示“服装尺码参照表”。然后引导学生根据“服装尺码参照表”,将原始数据按照“80~99厘米、100~109厘米、110~119厘米……"进行分类,也就是对数据进行分段整理和统计,制作如下统计表。
第四步:根据分段结果作出判断,核对统计结果。
通过对“服装尺码参照表”进行数据分段整理,让每个学生都能选择到合适的校服,从中感受到“数据分类”来源于需求,它的本质是对信息的分类,这样可以更好地帮助人们作出更加合理的选择和判断。
2.“数据分组”方法案例解读
2022年北京冬季奥运会共设7个大项,分别是滑雪、滑冰、冰球、冰壹、雪车、雪橇、冬季两项。另设15个分项和109个小项,其中滑雪又分为跳台滑雪、自由滑雪、单板滑雪、越野滑雪等。
国际举重联合会对各国(地区)参赛人数有限制,规定各参赛国(地区)参赛人数为女子4人、男子6人。各国(地区)可以根据自身情况,派出同级别或不同级别的规定人数参赛。奥运会举重比赛使用的杠铃是经国际举重联合会认可的标准杠铃。男子杠铃杆重25公斤(加上两端卡箍);女子杠铃杆重20公斤。两种杆不但重量、长度、粗细程度有区别,而且颜色也有区别。
上述例子中都是不同的数据分组,也是数据分类的方法之一。
3.“数据抽样”方法案例解读
要想知道某小学4年级女生立定跳远的成绩怎样,怎么办?学生交流情况如下:
生1:我们4年级有12个班,女生395人。让这395名女生每人跳一次,然后记录成绩进行统计。
生2:这样比较麻烦,而且一次的成绩不一定能代表真实水平。
生3:我们可以从12个班中的每个班随机抽取10名女生,然后让120名女生每人跳一次,对数据进行记录。
生4:我觉得每人跳三次,把三次的平均成绩作为收集的数据比较合适,能代表每个人的真实水平。
学生经过讨论与交流,最后决定用120名女生的成绩推知全校4年级女生立定跳远的成绩。这就是应用平均数的代表性,通过刻画一组数据的集中程度表达总体的集体状况,也就是我们常说的用小样本推知整体。
二、数据分类的教学建议
掌握了数据分类的方法,在经历统计的过程中,还有以下四点教学建议。
1.做好数据分类的准备
调查之前要做好规划和各种准备,如收集什么数据、什么时间去收集、怎么收集、小组如何分工、需要准备什么工具等。
例如,为了缓解早晚交通堵塞,让学生在较短的时间内快速、有序地进校,需要调试学校门口的红绿灯设置时间。“校门口红绿灯到底设置多长时间合适”这样一个真实的问题,引发了学生调查研究收集数据的需要。通过现场观察、收集数据,发现了问题:东西方向和南北方向红绿灯的时长相同,但南北方向车多,往往车辆还没过完就变灯了,容易造成交通拥堵,而东西方向的车辆却寥寥无几。如何使东西方向和南北方向的车辆都能快速、有序地通过学校门口,让学生在有限时间内安全进学校?如何设置十字路口不同方向红绿灯的时长?这是急需解决的问题。该怎么解决呢?
去现场调查。调查之前要做好规划,如:
(1)收集不同时段(如早晨7:30-8:00,中午12:00-12:30,下午5:30-6:00)车流量的数据;
(2)收集不同方向车流量(东西方向、南北方向)的数据;
(3)收集不同类型(小轿车、面包车、客车、货车等)车辆的数据;
把收集的数据进行整理和分析,为合理设置红绿灯时长的决策提供依据。把收集的数据以统计表的方式呈现出来,这样可以清楚地了解数据中的信息,进一步感悟从不同维度收集数据,也体现了数据分类的价值和意义,提高学生用数学语言记录生活事件,以统计思维处理数据、整理数据、分析数据的能力。
2.数据分类要体现逻辑性
例如,要给居民区中的车辆进行分类,该如何分类呢?
首先可以按照车轮的数量分类:自行车(2个)、三轮车(3个)、小轿车(4个)和运货物的卡车(大于4个)。然后进行第二层的分类,根据所归属的性质,可以把自行车再分为私家车和共享单车两类;根据小轿车所用动力的不同,再分为燃油车和电车两类……在制定标准时,要让学生体会到分类是有标准和层次的,分类时要体现逻辑性,更重要的是感受分类时要做到“不重不漏”。
3.数据分类要体现合理性
对调查的数据进行排序、“分段”整理,或者求最大值、最小值、平均数等获得信息。这些信息是数据“自带”的,只需要描述出来,不需要进行推断、估计等思维活动。这类数据最重要的加工方式是对数据“合理分类”。比如,对调研获得的全班学生身高数据进行“合理分段”非常重要,分段前要制定标准,每段“多长(区间长度)”、所分“段数”是多少等都要合理。学会基于“标准”做判断是重要的数学思维。
4.数据分类要体现具体问题具体分析
有这样一则消息:2021年12月11日,北京市第一届小学生篮球比赛在某体育馆开赛;本次比赛设有男子组和女子组,每组12支队伍参赛,由此我们想到了各种体育赛事,在男子组和女子组分类的基础上,有的是按照年龄分为少儿组、青年组和成人组,有的是根据所在省市参加全国联赛,有的是根据体重去确定参赛的级别(举重),还有的是根据所在位置的功能进行分类。所以调查时要考虑具体情况,从性别、身高、籍贯、体重等多个角度进行数据的收集,再根据标准进行数据的分类,从而确定符合条件的候选人。
数据是统计的基本要素,数据收集与整理是统计的开始。统计教学要培育学生收集数据的自觉,让学生知道要想解决问题,首先得进行调查研究,学会收集数据、整理数据、分析数据,并能根据数据背后隐藏的信息分析问题,作出合理决策。
(执笔人:张秋爽)
END
极深研几
扫码关注更多精彩
编 辑:牛 静
内容来源:本文摘至马云鹏 吴正宪等编著的《义务教育数学课程标准(2022年版)50问(小学)》,华东师范大学出版社。