综合评价(指向学生时也称“综合素质评价”) 是破除“唯分数论”的重点,也是卡点。
前几日,在北京教育督导评估院参加“综合评价”相关主题的研讨会议,对此有些新的思考,遂撰文字整理下来与诸君分享。倘若有单位能认同并落实一二,想来更是令人欣慰。
如何健全综合评价?回答这个问题,我从“综合评价不是什么”说起。
01
综合评价不是什么
第一、综合评价不是学科知识点拼凑
上世纪80年代,我们引进了布鲁姆的教育目标分类学及掌握学习法。
当时我是教研员,尝试用双向细目表来架构命题框架,改进考试命题。那个年代能够这样做,被认为是先进的,因为双向细目表保证了命题的覆盖面、不超纲。
但这不是我们所说的综合评价,因为今天强调的核心素养导向不是知识点过关,不限于认知范畴。
素养=(知识+能力)×态度,它强调态度价值维度。态度为正,是正能量;态度为负,是负能量。
双向细目表限于认知维度,跟素养导向的综合评价不相符。最为重要的素养并非仅凭评纸笔测验就能看出来。
第二、综合评价不是五育观测点的相加
现行综合评价把学生的综合素质分成了思想品德、学业水平、身心健康、审美素质、劳动与综合实践五个方面,每个方面再分解成三级指标。比如,审美素养被分解为美育实践、美感表达、艺术特长三个指标,每个指标对应4-5个观测点。整体而言,综合评价就细分成了五六十个观测点。
综合评价关注学生德智体美劳五个方面的发展是对的。这套体系还关注到分数之外的东西,如劳动与综合实践,相对于双向细目表的考试来说有进步。
但在如何关注五个方面的发展呢?逐一细分下去的方式有问题:
第一,把对一个人各方面的印象加起来并不等于整体的人。不断分解的点状考评下,人的思想、魂灵、活力不见了,整体的精神风貌不见了(剩下一个抽象的分数、等级及其排序)。综合评价原本强调对人的素质的综合把握,把德智体美劳五个方面结合起来,而不是机械分解,简单相加。
第二,在这套评价指标体系中,课程被狭隘地理解为智育,具体指学业考试成绩;在学业成绩之外,另列德育、体育、美育、劳动教育指标,窄化了课程的育人功能。
在我国,学生的综合素质是由一套相对完整的课程体系保障的,这套课程体系本来就不限于语文、数学、科学等学术性科目,还包括体验与健康、艺术、劳动与综合实践活动等科目。与此相适应,综合评价应注重从课程学习中看德智体美劳全面发展情况,健全课程落实机制,而不是在课程之外另搞一套德育、体育、美育和劳动教育评价体系。
第三、综合评价不是全时空的跟踪监控
当下学校比较时髦的是“数字画像”,即依靠摄像头或穿戴设备,对每个学生的行踪进行全天候跟踪,数字化处理,在此基础上得到学生画像。一款覆盖3000万学生的教育类App记录着学生在校的几乎全部行为表现,并通过加减分给学生排名:不午睡,扣分;坐姿不正确,扣分;周一不穿礼服,扣分……一些学校还将App上的评分排名与加入少先队、评选三好学生等挂钩。
数字画像有两个好处,一是便利,可以通过大数据的实时记录、自动汇集、连接,形成庞大的“数据自我”;二是比较客观可靠,不再是凭主观印象进行评价。但随之而来的问题也不少:
第一,数据是随机采集的,缺乏必要的结构;
第二,被记录的只是某些行为及其模式,难以反映极为重要的动机、情感、态度及高阶思维能力。
第三,无所不至的“强制性透明”会摧毁人的生动多样的表达,人可能变成完全透明的机器。全时空的追踪把所有东西都记录下来,产生庞大的数据,无论是暴露在自己面前还是在别人面前,都会让人感到非常吃惊。面对这样的数字“暴力”,我们应该说“不”。
02
综合评价是什么
接下来,我想尝试着正面回答“综合评价是什么”。
回答“是什么”通常比回答“不是什么”要困难。
第一、“综合”是调动多样化心理社会资源应对挑战、完成任务的过程
下面是两个综合学习的例子:
示例1:六年级数学任务设计。规划一次出游:教师介绍主题,激活学生以前规划出游的知识。引导学生讨论:讨论内容为以前学校或家庭到哪里出游过或其他外出情况。绘制一个图表,通过列出学生的首选清单,展示全班的优先选择,然后对他们最想出游的地方投票,全班讨论最优选择。
学生的任务是:
基于他们对班级投票情况的分析,建议他们班可以去哪里出游
基于图表显示的每个地点的距离、门票价格和公交车费,计算每个学生三个不同地点的出游费用;
使用成本图表中呈现的信息,评价学生要去动物园的提议;
基于对所有信息的分析,给教师写一个短信,对班级应该选择哪个地点出游给出建议和佐证。
示例2:高中语文任务设计:编辑一个在线电子版文集《人工智能与劳动世界》,具体任务是为文集准备前言,做如下事情:
决定以什么顺序选取哪些文本(至少包含6个文本),这些文本至少体现两种以上的观点和文本形式;
甄别和讨论文本所体现出来的关于两者关系的不同看法;
为每个文本写一个段话,阐明选取的理由及与其他文本的关联性;
提出一系列问题,让读者集中思考文本中的观点。
上述两个任务有什么特点?
一是真实性:反映真实的生活或工作需求,学生学习有着明确的社会角色和受众。
二是开放性:有充分的自主空间,不同于在考场上有明确的时空资源制约和应答方式限制。
三是迭代性:有关任务的完成往往需要不断尝试,作品不断迭代生成,并不是一次性完成。
在现实任务完成中,学生的知识、技能、价值观自然而然发生了整合,这个过程叫综合,也即知识、技能、价值观的综合表现。
按照OECD的定义,素养不只是知识与技能,它是特定情境中通过利用和调动心理社会资源(包括技能和态度)满足复杂需要的意愿和能力。素养与综合是孪生关系。
第二、综合评价包括两个方面:
一是从挑战性任务完成过程中看重要素养的发展情况。如从示例2中能看到多方面的素养,包括学生组织安排及阐释、推介文本、满足读者需求的意识和能力;多渠道阅读获取信息、梳理探究与书面表达能力;对技术世界与劳动世界的基本态度等。综合评价不是评价“今天学会了吗”“今天作业交了没有”“今天晚自习上了没有”,而是关注学校课程着力培育的、纸笔测验难以考查的重要素养,借以引导教育教学的方向。
二是把各方面的情况结合起来看个性潜能和倾向,注重对个性的把握。具体来说,它要求把“抽象的人”还原为现实生活中的具体个人,并放在一定处境中去理解,解释他为什么会这样,他的行为意味着什么。它是对发展可能性作出前瞻性评估,对个人潜质与课程目标、院校培养目标的匹配度做出判断,借以引导后续学业、生涯规划。
第三、基于作品的评价
作品是面对挑战性任务时典型表现的凝聚,是素养孕育、生成、发展轨迹的关键证据。作品集中展示了学生的理解和行动:选择做什么,表明他的价值取向;怎么做的,反映他的思考和行为方式;做到什么程度,表明了他的潜能和个性品质。
同时,作品具有整合性质,可涵盖重要素养的发展情况,而不限于标准化考试所能反映的内容。
有学校将学生作品分成四类:
一是阅读笔记,侧重指致力于掌握给定的学科材料,做整理、归纳、比较、阐释和评论。
二是研究成果,即围绕某个问题(最为重要的研究问题通常不是别人给定的)进行观察、调查、实验等,获得规律性的认识。
三是创意表达,即围绕感兴趣的话题,运用多种媒介方法技艺,进行个性化地创作、设计制作、表演表达等。
四是实践报告,即走向社会、挑战自我,完成特定目标任务过程的报告,注重改变世界。如学生的志愿服务报告便是学生是否具有一定的责任担当,能否运用所学去完成任务、接受挑战的重要证据。
第四、综合评价是学生自我期许的兑现说明
唯有内驱力的自我激发才是有意义的。不少研究表明,外在的直接考评无论来自老师还是家长,都有可能造成学生内驱力的丧失;同时过多的外在考评直接摧毁了良好教育赖以发生的信任关系。
学生的自我激发过程是这样的:
基于外在目标(学科学业质量标准、跨学科素养通用量规)及自身志趣的许愿,规划自己的学习活动,选择并接受挑战性任务;
用自己的“明星作品”(感到最自豪的)证明自己理解了,做到了什么,如何兑现自己的许愿;
用自己的“进阶作品”(感到不太满意的)说明自己在目标实现方面遇到了什么挑战,为什么会这样,下一步自己的愿望是什么,希望老师和家长对自己给予什么样的支持和帮助,以进一步激发内在的愿望和动力。
在这样一个自我激发过程中,坦诚态度和公开机制最为重要。
成人要做的是:
提供清晰可选的目标进阶及学习规划、记录、陈述的工具,特别是具体定义什么才是好的;在与学生的对话中帮助学生选择并澄清自己的目标、愿景,提供给必要的时空和开放安全的应用场景、设施,以及宽容、鼓励和等待;建立展示交流、公开对话的平台、机制,如此而已。
其中,清晰的目标界定是灯塔,是召唤。如果方向错了,或者目标模糊,再多的努力也只是徒劳。与问题相比较,目标导向更具有意义,行为以重要且清晰的目标为导向,而不是纠缠枝节问题,才能创造持久价值,促进核心素养的生成。
维特根斯坦说:思想的本质,即逻辑,呈现了一种秩序,即世界的先天秩序,也就是世界和思想必定共同具有的种种可能性的秩序。然而这种秩序看起来必须是最为简单的。它先于一切经验,它必定贯穿一切经验,它本身不可沾染经验的浑浊或不确定性。——相反,它一定是最纯粹的晶体。但这种晶体看起来又不像是一种抽象的东西,而像是某种具体的东西,甚至像是某种最具体的、可以说是坚硬的东西。
从学生角度看,评价就是自我期许的兑现说明。看似说明给别人听,其实是在说给自己听,不断澄清着:
我是谁?
凭什么说我就是我,而不是他或它?
我还可以用什么界定我是谁?
我还可以为他人、为社会做些什么?
……
原创文字,转载请联络并获得许可;
图片源于网络,如侵权请联络删除。
转自丨柳浪文英
编辑丨周利
审核丨蔡榕
声明:此文系转载,仅作为分享用。如内容在版权上存在争议,请与我们联系。