点击蓝字 关注我们
参考文献
评价是什么,评价和测试的区别又是什么?
教师的评价素养内涵是什么?
我是一名知道如何运用评价的合格教师吗?
评价的根本目的不是为了筛选学生而是?
语言测试的要遵循什么基本原理?
语言测试的对象具体是什么?
干扰项哪里找?
核心素养如何评价?
教学评价的定义
评价≠测试
测试命题能力只是评价素养中的一部分。在我们国家,英语学科比较全面地进入科学化、专业化评价阶段,也不过课程改革启动后的事。以前的评价与测试基本上是教师凭经验做的,考试内容也是以语言知识为主。课程改革启动后,大批教师,特别是年龄偏大的教师,无论是在教学中还是在面对新的测试与评价方式和内容上,都感到很不适应。因为科学化、专业化的评价测试需要教师有与之相匹配的评价素养。测试素养还基本上局限于测试领域,评价素养包括测试素养,但更强调其他方式的评价和评价对教学的作用。
“评价从根本上讲,是收集、分析、解释与特定事情或兴趣点相关的信息。另一方面,评估则是确定某事往往是某种方案是否值得做、有多大价值、重要性如何、效果怎么样。”(Secolsky&Denison,2012:Pxvili)“教学评价给教师们提供探索他们教学的本质、结构和成果的机会。会成为一种为教学提供信息的反思性活动。”(Graue,1993:285)。具体到语言教学评价,有这样的解释:“收集信息的行为,对语言学习者理解语言、运用语言的能力的判断。” (Chapelle&Brindley,2002:267)。评价涉及许多方面,对于教师来说,通常有对学生的总体评价,对学生学习成绩的评价,对学生具体行为的评价,对教学效果、教学方法、课堂的评价,等等。
教学评价的目的
评价有三大目的:促进学生英语学科核心素养的发展;提高教师英语教育水平;学校完善英语课程。对于大多数教师来讲,目的就是前两项。再看看国外学者的论述:“尽管进行评价有各种不同的目的(如形成性或终结性评价),其主要目的仍然是支持学生学习,支持学生在进行如下活动时发生的学习:思考、解决问题、建构、改变、调查、分析、选择、组织、决定、解释、谈论或交流、分享、表现、预测、诠释、评价、反思、担责、探索、提问、回答、记录、获取新知识并把该知识用于新环境。”(Al-Mahrooqi,2017)。这也同《课程标准》的第一点是一致的,也是评价的核心目标。
在具体的评价过程中,Lambert和Lines(2000:117)认为合格的教师在评价上应当做到:评价(教学)在多大程度上达到了目标,并把这种评价用于教学的具体方面;对学生的课堂作业和课外作业进行评分和监督,口头或书面提出建设性的反馈意见,为学生的进步设定目标,系统地评价和记录每位学生的进步,包括重点观察、提问、评分,并运用这些记录达到如下目的:(1)确保学生理解和完成安排的任务;(2)监测学生的优势与不足,运用这些信息对学生的学习做出有目的的调整;(3)安排教学计划;(4)确保学生在知识与技能的习得和主题理解方面获得明显的进步;(5)根据不同的目的合理地采用不同的评价方式。
周文叶、周淑琪(2013)归纳了中国、澳大利亚、英国、新西兰的教师专业标准的评价内容,主要包括以下几个方面:(1)选择并运用恰当的评价方法及策略;(2)对学生的表现进行观察,并做出判断;(3)向学生提供及时、有效的反馈信息,促进学生的学习;(4)利用评价结果信息调整教学;(5)向评价相关人员报告并沟通评价信息。
评价素养
对于评价素养,以前的研究基本集中在:①教师运用评价方法和技能方面的知识和能力;②用评价结果支持和指导实践的知识和能力。因此,评价素养涉及方法/技能和应用两个层面。(xu,2017)。
评价素养涉及多个方面:基本的知识理念和技能、具体的操作方法、课堂内外的评价、测试命题的技能、对测试结果的分析解释等。
教师的评价素养可以提供知识和必要的工具,帮助他们理解按照具体的目标要评价什么、怎么评价、需要做什么样的决定才能有效评价学习者井优化他们的学习。具有良好评价素养的教师知道可靠与不可靠评价之间的差别,在进入评价领域时知道自己要评价什么,为什么要评,怎样评价相关的知识和技能才能达到最好效果,如何生成良好的学生表现案例;知道评价可能会出现什么错误以及如何防止这些错误;知道糟糕的、不准确的评价的潜在消极后果。对知识的评价是最基础的,评价素养在实践方面的重要性更需要引起注意。
然而,这些都需要学习与评价相关的教学知识作支撑,因此教师应该充分了解情况,根据实际情况做决定,针对特定的课堂、特殊的学生做出不同的决定。评价质量在很大程度上是由评价者的评价知识和技能,或者说是评价素养所决定的。
语言评价素养是外语教师所具备的对语言学习者的学习过程与结果、语言课程、语言教学项目等语言教学相关项进行评价的知识、技能、能力、态度的综合体。综合各方面观点,结合我国基础外语教育的实际情况,我们把语言评价素养分为三个维度:基础知识、认识理念和操作技能。
基础知识包括:语言的基本知识(语言的基本特性、目的语的基本特征、语言知识);语言测试的基本知识(测试的效度、信度、真实性、交互性、反拨效应、难度、区分度等基本要素,测试的基本类型和特点);教学评价的基本知识。
认识理念包括:对英语学习规律的认识理念;对语言能力的认识;对教育评价与语言测试原则、规律、伦理道德的认识;对语言测试与评价研究新发展的认识。
操作技能包括:课堂评价技能、命题技能、分析测试所获得信息的技能、解释测试结果的技能、运用测试结果促进教学的技能。
在这三个维度中,认识理念是最关键的内容,因为认识与理念决定评价的基本方向、方法、内容,以及怎样解释与应用测试结果。语言评价素养的高低在于对语言和语言学习与教学本质的认识程度,对评价目标、评价原则、评价标准和方法的把握程度,解释评价结果的科学性,运用测试结果促进学生学习的有效性,评价意识、敏感性的高低程度等。素养是综合性的,涉及多个方面,许多组成成分是难以讲明的;素养是内化在教师日常点滴教学评价的行为之中的。
教师要提高评价素养,首先得弄清楚评价素养的内涵。
素养是养成的,语言评价素养的提高需要教师自身具备相关意识,把所学理论与实践相结合,在实践中反复应用理论,并持之以恒地学习,了解新的研究成果,在各种实践活动中用心观察、经常性地反思和总结。
教学评价之课堂测试
课堂测试是教学评价的主要一环,是课堂评价的重要组成部分。课堂测试的主要目的通常有两个:发现学生在学习中存在的问题和巩固学生所学内容。
一般来说,课堂测试属于非正式、小规模的测试。课堂测试应该做到方式灵活、题型多样、交互性强,“以测促学”。测试内容既可以是单项的,比如听写单词、句子、短文,也可以是包含几种题型的小型综合体。课堂测试是形成性评价的重要组成部分。一方面,课堂测试中,测试分数的推测和运用的重点在于学生在多大程度上达到了学习目标。我们要用测试分数说明学生知道什么,能做什么。我们需要讲清楚学生的课程目标达成度,测试就是为了提供证据支撑这些说法。
教师开展课堂测试之前,应该思考和确定几个要点:(1)测试的总体目标是什么?(2)测试的具体目标是什么?具体测试哪些能力?(3)是分层还是分组测试?(4)采用哪些题型安排?(5)采用什么样的评分方式给学生什么反馈?另一方面,教师以课堂测试的方式强调学习重点,加深学生对主要内容的印象和感受,促进他们对重要内容的掌握。
语言测试基本原理
我们可以从两个方面分析语言测试的基本原理。一个方面是:语言测试的目标是学生的语言水平和语言能力。他们的水平有多高?能力有多强?能否用目的语完成需要他们完成的任务?语言水平和能力是看不见模不着的东西,我们不可能像测量一个人的身高体重那样直接检测到,只能通过设计一些需要通过语言完成的任务让考生去做,根据他们的表现和完成情况再推断他们的语言水平和能力。因此,从这个方面讲,语言测试的一个基本原理是推测。即设计语言任务引出考生的行为,根据其行为结果推测出他们的能力和水平。
第二个方面是典型语言行为抽样。因为语言行为太多,面太广,而测试的时间非常有限,一项测试通常无法对所有内容进行考查,因此只能从某一领域中抽取一些样本,而且是一些典型的、有代表性的样本,然后依据学生在样本上的表现推测其发展状况,做出相关解释与决策。
语言测试考察对象
技能 vs 能力
联合国教科文组织出版的一书中对技能(skills)和能力(competencies)进行了这样的解释:尽管技能和能力两个术语常常交互使用,两者却有清晰的差异。能力的范畴更广,指在具体的情境中和在满足需求时运用知识的能力。这里的知识广泛地指全方位信息、理解、技能、价值、态度。(UNE5C0,2015:40)
王蔷和胡亚琳(2017)指出:能力的实质是个体对于活动进程和方式直接起稳定的调节控制作用的心理特性,而这种特性经过不断地系统化和概括化最终形成网格型的经验结构,其形成过程即经验的类化过程。学科能力作为学生能力与特定学科的有机结合,是学生成功解决特定的学科问题或完成学科任务的个性特征。
识记能力的测评重点关注学生能否识别和回忆所学的事实性知识、概念性知识或程序性知识,其测评方式主要包括听写、默写、背诵、匹配题、选择题、填空题等题型。虽然题型相对简单,但需要注意试题与情境的嵌入度。在情境弱嵌入的情形下,呈现给学生的是孤立的知识:在情境强嵌入的情形下,可以给学生提供几条线索以供学生选择。嵌入度高低直接影响着学生对信息的提取。听力、问读试题部首先考查理解能力。
对理解能力的考查,主要关注新信息、新知识与原有因式和认知框架能否很好地整合,其测评方式主要包括问答题、选择题、类比试题、举异试题、对应、推理、问题诊断、重新设计和推断等。理解能力测评中提供的信息形式应该与原信息不同,否则可能测评到的就是识记能力而不是理解能力。因此,阅读理解题中的答案选项一般不用原句。
运用能力和程序性知识紧密相关,往往表现为学生按照程序去完成任务或解决问题,语言活动所需要的就是程序性知识.或者说话言技能。其测评方式主要包括选择题、口头说明或论述、读写结合、应用型写作等。运用能力既受学生识记与理解能力的影响,也与对任务熟悉程度有关。如果提供给学生的任务是学生比较熟悉的.给学生选择程序提供了足够的线索.这种测评的关注点就落在操作应用层面.测试效果就应该好.效度也就高;如果提供的任务学生不熟悉,则会影响其语言水平的发挥,进而会影响测试效废。
创新与迁移能力的测评方式主要包括问答题、探究题、写作等。创新不一定所有成分和内容都是新的,把已有的几个要素按照新的目的或要求重新组合,成为一个新颖的、与自己先前的知识相关的结构也是创新。英语是语言学科,测评的重点是语言能力,其他都是围绕语言能力展开的。对创新与迁移能力的测评自然是在语言的基础上进行,主要是通过对语言产出(即说和写)在一定程度上体现。
从测试的角度来说,试题应该覆盖所有层次。传统的测试是以知识为主,往往把知识作为重点。这种测试,主要考查受试者的知识拥有量。而现在,社会己进入信息化的智能时代,在知识记忆、存储和简单理解方面,人类已被人工智能超越,依靠知识记忆为主的教学培养出来的学生会越来越不能适应这个时代的要求。现代语言测试把知识看作基础,融入其他层次思维过程,而不是测试的直接目标。语言测试的重点应该在理解(理解语言意义)的基础上应用(应用语言达到交际目的)、分析(分析语篇各组成部分的关系)、评价(评价语篇中的人物、事件或作者的意图、态度等)。至于创造,按AndeMon(2001284—85)等的解释,“把组成成分合在一起,形成连贯的功能整体”,“形成新的模式或结构”,语言表达本身也就是一种创新。
选择题干扰项的主要来源
干扰项的主要来源
(1)教材上的语言或真理性的措辞。教材上的语言或真理性的措辞内容一般都是学生比较熟悉的,他们一般不会怀疑其正确性,但其能否与试题情境相一致,则需要学生在充分理解答题要求的基础上认真思考。这些教材语言或真理性的措辞往往会迷惑没有真正掌握知识的学生。
(2)误解或错误联想。如果考生没有掌握这个短语,进行了错误联想,望文生义,就无法正确作答。
(3)学生在学习中常犯的典型错误。用学生的典型错误来制作迷惑项,既可以使选项与题干保持较紧密的逻辑联系,对学生的心理结构或能力做出有效的推测,又有利于纠正学生的错误。但这要求命题教师对学生群体的学习情况了解得比较透彻。
核心素养的评价
核心素养作为教育目标,对其科学评价自然是非常重要的。核心素养的本质特征决定了对其评价的复杂性:核心素养本质上是个体的内在品质特征,是抽象的,具有内隐性、综合性、情境性的特点。因此,要实现对学习者的核心素养测评,需要做到三点:一是把测评对象落实到具体的任务中;二是任务应该是既有综合性,又有相对不同的侧重点;三是要设置相对真实的、可操作的实现任务的情景。把评价对象落实到具体任务中,才能根据观察到的他们在实际任务中的具体行为表现,对其素养进行推测。而要实现这种推测,必须建立测评的核心素养与学习者在具体任务上的实际表现之间的关联.任务要确实体现出考生的核心素养,不同的素养水平要对应着个体在各种具体任务中的各种不同的反应或表现。综合性的任务需要考生用到整体的素养才能完成,但从评价的角度来说,需要把整体的素养适当分解,以便实现不同的任务中的观察。
一方面,我们要思考这些任务怎样组合才能够尽量全面地测评核心素养;另一方面,我们要思考通过哪些不同的任务才能体现出学习者的核心素养的不同方面。但是,对核心素养的分解并不是越细致、越具体越好。要避免将素养缩减为碎片化的任务,因而影响教师的教学和测评的实施。如果将核心素养过分具体化,也不符合核心素养整体性、情境性和综合性的特点。过分具体化的学习内容不仅会给教学和测评带来干扰,还有可能破坏核心素养的整合性。怎样把握好这个度是一个很有挑战的问题。设置任务情境也是极具挑战性的难题。情境要相对真实,是现实生活、工作或学习中的情境;同时,该情境要有可行性,能够用于测评。
英语学科的核心素养虽然是由四个部分组成,但不是分离的四个部分,而是一个有机的整体。对它们之间关系的一种描述是:“语言能力是学科基础,文化意识是价值取向,思维品质是心智特征,学习能力是发展条件。”(梅德明等,2018:25)。从测评的角度讲,语言能力是核心,是依托,文化意识、思维品质和学习能力都只能通过语言能力体现出来。对文化意识和思维能力的检测指标也只能通过语言形式呈现。因此,不可能对四个部分进行分类、分别检测。再有,“由于核心素养的内容非常丰富,并不是每一条素养或者每一条素养的具体方面都可以通过考试来检查的”(梅德明等2018:130)。但是,英语教师不能因为考试不能考,就放松教学过程中对学生核心素养的培养。我们应牢牢记住,考试只是教学的一部分。在教学过程中,应尽可能多使用综合性题型、开放性题型。这类题型如果设计得好,对学生的学习能力和思维发展是有作用的,是能够促进学生核心素养发展的。我们也不能把核心素养评价庸俗化、应试化,搞出什么“核心素养天天练”“核心素养月月考”“核心素养过关题”等违背教育规律的乱七八糟的东西。