大学教育评价改革向何方突围?

科技   2024-10-31 21:30   安徽  

导读:教育评价事关教育发展方向,有什么样的评价指挥棒,就有什么样的办学导向。习近平总书记强调,教育评价事关教育发展方向,事关教育强国成败。那么,在不断深化教育评价改革的路上,我们该如何进行有效教育评价体系改革建设,以回应教育强国战略的需要?今天,与您共读本文,文章不仅深入探讨‍‍‍‍‍‍‍‍‍当前教育评价体系下的桎梏,更提供了具有深刻洞见的解决方案,对未来教育评价改革方向提供了新思路。

作者简介:刘振天,吉林榆树人,教育学博士,厦门大学高等教育发展研究中心主任,厦门大学教育研究院教授、博士生导师,主要从事高等教育理论、质量管理与评价研究
· 摘 编·

文章深入探讨了中国大学教育评价体系的改革方向,指出教育评价改革对于国家教育发展方向和教育强国建设具有决定性影响。

文章回顾了“五唯”评价体系的历史背景和作用,指出其在特定时期对高等教育的积极影响,同时也不避讳地指出了其带来的问题,如评价方式的僵化和对质量的忽视。

而后,进一步探讨了多维评价作为“五唯”评价的补充和改进,分析了多维评价在科学性和合理性上的进步,同时也指出了其复杂性和实施难度。刘振天教授认为,尽管多维评价在某些方面超越了“五唯”,但它仍然不是教育评价改革的最终答案。

文章最后提出大学教育评价只有转向从根本上体现学校、学者及学术主导的“自为”评价,即自我评价,才可能真正走出“五唯”评价怪圈,有效建立符合教育规律和评价规律的、具有中国特色和世界水平的大学教育评价体系,助推高等教育强国建设。

以下是文章全文——

“教育评价事关教育发展方向,事关教育强国成败。”[1]这是习近平总书记2023年在中共中央政治局第五次集体学习时发表的重要讲话中给教育评价改革作出的最新指向和定位,凸显了教育评价改革的重要性和紧迫性。事实上,早在2016年,教育评价改革就已提升到国家重大政策层面,纳入中央议事日程。2020年,中共中央、国务院正式发布了《深化新时代教育评价改革总体方案》(以下简称《总体方案》),最高决策部门专门为教育评价改革出台文件,在我国还是第一次。《总体方案》整体设计了以建设教育强国为根本目标,以立德树人为根本任务,以破“五唯”为关键内容,以分类评价为主要方法,以政府、学校、社会、师生为多元主体,以系统集成、政策协同、破立结合为基本原则的教育评价改革大思路大框架,致力于构建具有中国特色、世界水平的教育评价体系。按照官方的说法,《总体方案》颁布三年多来,在各方共同努力下,教育评价改革取得了明显进展,破“五唯”日益成为广泛共识和行动,政府层面配套改革的政策体系逐步健全,各地各校涌现出一批好经验好做法,部分领域教育功利化倾向得到有效遏制[2]。然而,正如有学者指出的,“教育评价改革是世界性难题”[3],错综复杂,方方面面利益相互缠绕,牵一发动全身,不能指望立竿见影和一蹴而就,既要下定决心、坚定信心,又要从长计议、久久为功。就大学教育评价而言,破“五唯”已现端倪和缺口,“五唯”之外增添了多维评价。不过,“五唯”与多维二者是何种关系?多维对“五唯”是取代还是仅为修补?多维评价是不是最佳的或最后的方案?在笔者看来,从“五唯”到多维,无疑是教育评价改革的一大进步,但多维并不能完全替代“五唯”,多维也并非最佳和最后的改革选项。只有从“五唯”到多维再转向从根本上体现学校、学者及学术自我主导的“自为”评价,或者以“自为”评价为核心,充分汲取“五唯”评价的合理成分,充分利用多维评价,才能真正破解“五唯”评价怪圈,实现教育评价改革突围,从而有效建立具有中国特色和世界水平的教育评价体系,助推实现高等教育强国建设目标。

01

“五唯”评价的功与过
“五唯”有着不同层面的所指:在《总体方案》里,主要是指“唯分数、唯文凭、唯升学、唯论文和唯帽子”,针对的是大、中、小、幼,党政、学校、师生、社会用人部门全口径教育评价问题;在高等教育领域,则经历了逐步演变及明晰化和确切化的过程。最早在2016年3月,中共中央出台《关于深化人才发展体制机制改革的意见》(中发[2016]9号),提出克服“三唯”,即唯学历、唯职称和唯论文;2018年7月,中共中央办公厅、国务院办公厅出台《关于深化项目评审、人才评价、机构评估改革的意见》(中办发[2018]37号),提出克服“四唯”,增加了唯奖项;同年11月13日,教育部针对高等学校专门发布《关于清理“唯论文、唯帽子、唯职称、唯学历、唯奖项”专项行动的通知》(教技厅函[2018]110号)提出要清理“五唯”,多了唯帽子[4]。大学教育评价破“五唯”,最突出和最核心的,也是最关键要害的,当属“唯论文”,因为唯职称、唯帽子和唯奖项等,都是唯论文的副产品,是以唯论文为基础的,唯论文与其他“四唯”,主要是皮和毛之间的关系。

“五唯”的产生和发展并非偶然,有着特定的时代背景与客观要求。具体说来,它是与人们对现代大学本质、职能和规律的认识不断深入,高等教育在应对现代经济社会发展和国际激烈竞争挑战中地位不断提升、作用不断彰显紧密相关的。众所周知,我国现代高等教育制度的确立仅仅是近一百年间的事。清末之前的两千多年里,也有所谓的“大学”教育,如太学、国子学、书院等,但实际上它们只是教书或是道德教化的场所,却不知“研究”和“服务”为何物。即使在民国时期号称“研究高深学问”的北京大学、清华大学、中央大学以及后来的西南联合大学等高校,也没有突出强调过“研究”。例如,当时这几所大学的校长聘请了若干名年轻才俊当教授,甚至任命其为学长,这些人中,有的没有大学文凭,有的没有著作文章。这种不拘一格选才用人的做法,被后人传为佳话。不过,这也说明,那时大学的人才评价,往积极处看,比较自由,注重综合素质和发展潜力,不以科研论文、文凭以及奖项论短长;往消极里说,人才评价存在着很大的随意性,不规范,缺乏科学标准和方法。

新中国成立后,党和政府接过了国民党政府留下的极为薄弱的高等教育穷家底,并开始对其进行全面改造。同时,为了缩短与西方高等教育的差距,发挥新制度集中力量办大事的政治优势,从20世纪50年代初期开始,党和政府即分期分批选择若干有条件的高校,将其确定为国家重点大学予以重点建设。直到80年代末,全国重点大学数量接近百所。但是,长期以来,包括重点大学在内的高校,其职能以教学为主。所谓重点大学,其“重点”集中体现在它的教学或人才培养方面为其他高校做出示范和提供经验,而科研、学科建设以及论文发表等,在当时远未被人们予以重点关注。

“文化大革命”结束后,邓小平同志复出并亲自抓教育,做了两件载入史册的大事:一是恢复高考,二是落实知识分子政策,要求大学要搞研究,要评职称,并且教授和副教授内部还要分不同级别[5]224。1977年7月,他在听取教育部工作汇报时指出,“要抓一批重点大学,重点大学既要办成教育的中心,又要办成科研的中心”[5]50。此后,他又在多个场合强调重点大学的“两个中心”。“两个中心”在当时也引起了知识界和教育界的热烈讨论。有人认为,“高等学校‘两个中心’的规定和确立,深刻地揭示了高等教育同科学研究相互依赖、相互促进的辩证关系,准确地概括了国内外搞好高等教育,发展科学技术的成功经验。按‘两个中心’的要求办好重点大学,做到多出人才、快出人才、出好人才,多出成果、快出成果,是我们面临的重大任务”[6]。“两个中心”的要求深刻阐明了高等学校的本质规律[7]。当然,也有不少人对“两个中心”提出不同意见,认为科研中心会削弱教学工作,“学院维持教学都有困难,哪有条件搞科研”[8]。

邓小平同志于党的十一届三中全会前的中央工作会议上提出,解放思想、实事求是,使科学迎来了发展的春天。邓小平同志敏锐地分析和把握世界科技革命发展大势,适时提出了科学技术是第一生产力的科学论断,号召科技界和教育界要向科学进军。1983年,邓小平同志为北京景山学校题词,“教育要面向现代化,面向世界,面向未来”,为教育改革发展指明了方向。1985年,我国颁布了具有划时代意义的《中共中央关于教育体制改革的决定》,指出:“有计划地建设一批重点学科。重点学科比较集中的学校,将自然形成既是教育中心,又是科学研究中心。”[9]自此,“两个中心”正式成为国家重大政策决定,科学研究、学科建设、创新人才培养被前所未有地提上日程。

“两个中心”指向之下,科学研究的地位迅速提升,如何衡量评价科研成果水平成为摆在人们面前的一道难题。受“文化大革命”影响,包括高校在内的科研评价处于盲目无序状态,既缺乏科学标准,又缺乏公正性与权威性,很多情况下主要看领导的喜好或者关系,人治色彩浓厚,严重打击了知识分子从事科研的积极性与主动性。直至20世纪80年代中后期,历史选择了南京大学,该校以“敢为人先”的精神和“第一个吃螃蟹的人”的勇气,成为教育评价领域的探路者和播火者。南京大学提出,搞基础研究一定要到国际舞台上去竞争,论文要在国际性学术刊物上发表,要以SCI论文作为衡量教师科研成果水平的标准。今天,人们对SCI已觉平常,不再新奇,但在当时,这一举措却十分崇高而神圣。SCI(《科学引文索引》)创办于1957年,本来是国际上通用的科技文献检索工具,可在当时的中国却成为权威性的衡量论文水平的国际性硬通货。南京大学首先制造了标准,当然也受益于标准。从1992年起到1998年,该校师生发表的SCI论文在中国大陆所有高校中连续8年雄居榜首,而所发表的SCI论文的被引用数,使该校从1994年起到1998年,连续5年成为全国高校的“领头羊”,力压清华、北大等一干重点大学[10]。从1987年开始,国家科学技术委员会(后更名为科学技术部)和教育部也将SCI作为衡量基础研究的一项指标,由中国科学技术信息研究所每年年底公布上一年的统计数据,每年编制《中国科技论文统计报告》,人们称它为中国大陆的“学术榜”[11]。80年代后,中国的SCI论文发表数逐渐呈现指数增长态势,SCI在中国学术领域的地位更是“直上云霄”。当年,学者发表一篇SCI论文,不亚于今天在国际三大顶级刊物Nature、Science和Cell上发表文章,甚至出现百万重奖的场面。在其带动下,评职称、搞奖励、争项目、引人才、评院士、大学评估及学科排名等,无不看论文数量、影响因子和刊物级别,由此逐渐演化成“五唯”评价。

如今,“五唯”已从过去的神圣殿堂滑落到被破除的地步,给人的感觉似乎一无是处。然而,我们应以历史的观点和态度,以辩证的方法对其做出一分为二的评价和判定。必须承认,“五唯”对我国科研工作、学科建设以及高校人才培养产生过积极影响与推动作用。

其一,适应形势需要,拓展了高等学校的职能。党的十一届三中全会确立了党和国家工作重心必须转移到以经济建设为中心、全面依靠科技进步和提高劳动者素质轨道上来的正确路线,《中共中央关于教育体制改革的决定》也明确提出,教育必须为社会主义建设服务,社会主义建设必须依靠教育。这就要求教育不仅要多出人才、出好人才,还要多生产新知识和新技术。高校从以往单纯传授知识和开展教育教学工作,转变为教学与研究结合并重,成为发展和创新知识的重要力量。

其二,显著激发了高校间的竞争氛围,扩大了知识生产规模和数量。围绕着论文、项目、经费、成果、奖励以及人才称号,高校之间和个体之间,乃至地方政府之间均展开了激烈的竞争,“五唯”成了高校办学水平、管理能力、事业发展、社会贡献的重要标志,大学排名、资源分配、人才流动、职称评审、绩效考核等,无不与“五唯”挂钩,切实激发了高校办学活力,扩大了知识生产规模与数量。单就SCI论文产出而言,20世纪90年代之前,我国所有高校全部论文产出数不及美国哈佛大学一所高校多,但到2010年已发展到仅次于美国,成为世界第二位论文产出大国[12]。

其三,加快了我国高等教育国际化步伐。“五唯”评价,尤其是SCI论文评价,为高校找到了知识生产的国际可比参照系,从而使广大科技工作者按照国际论文范式、标准与程序从事科研工作,促进了高校教育教学与科研领域的国际交流与合作。

其四,促进了高校人才梯队建设及人事劳动制度规范化建设。“五唯”评价造就了一支数量庞大的高校科研大军,尤其是形成了一支为数可观的高层次人才梯队,同时改变了以往计划经济时代高校管理上的平均主义和“大锅饭”现象。多劳多得、优劳多得、按绩效取酬成为新的劳动和人事分配政策。高校拨款、项目申报、岗位聘任、薪金待遇、职务晋升、人才引进、津贴奖励等,无不以“五唯”为重要评价尺度,高校事业单位管理展现出工程化和企业化趋势。

然而,“五唯”评价也导致了严重问题,最明显的表现,就是评价方式简单粗暴、模式僵化,人们心态上急功近利,重研究轻教学,重数量轻质量,重结果轻过程,重短线轻长线,重模仿轻创新。这在很大程度上违背了高校办学规律、知识生产规律和人才成长规律,破坏了学术生态环境,不利于学术健康发展,尤其是偏离高校立德树人根本目标,不利于国家科教兴国、教育强国长远战略的顺利推进。这恰恰是上至政府、下至高校和社会决心将“五唯”加以破除的根本原由。


02

从“五唯”到多维:修补抑或超越?

“五唯”评价及其弊端,早已引起人们的关注和警惕。其中,最先受到批评的是唯学历和唯文凭。“文化大革命”结束后,从濒临崩溃边缘走出来的中国,百废待举,开始拨乱反正、正本清源。恢复高考、落实知识分子政策和提高知识分子待遇,实现了干部知识化、专业化和年轻化等一系列目标,社会上很快扭转了读书无用论的不良风气,展现出尊重知识和尊重人才的喜人景象,但同时也出现了过分强调学历的问题:不仅看学历,还要看是本土学历还是外国学历,洋学历更被重视。这种现象引起了人们的批评和反对,认为在职称评定和人才使用上,要重学历但不能“唯学历”,要坚决摒弃只看学历不看能力的“唯学历”现象[13],土和洋应不拘一格,一视同仁[14]。此后多年间,人们对片面强调学历问题没有停止过批评。随着高等教育大众化进程的加快,适龄人口入学机会越来越多,升学越来越容易,学历问题受到的关注度开始下降。然而,由于职场竞争的加剧,唯学历又转换为唯高学历和名校学历,新的不公平现象依然存在。

唯学历之后便是对唯职称和唯论文的批评。高校是专业性的学术组织,职称是知识化、专业化的要求,也是高校教师学术水平和业务能力的反映。但改革开放后一段时期,受“文化大革命”影响,学术一片空白,职称评定不规范,存在着论资排辈和靠关系现象,影响了教师教学科研积极性、创造性。于是,打破这种现象,让人才尽快成长就成为高校职称评定制度改革的首要任务。唯论文就是针对以往弊端提出的应对之策:不比年龄和资历,只比论文产量、质量与影响,或者只以论文论英雄。这时,SCI评价标准便应运而生,相应地,论文刊物级别、影响因子也成为评价的重要标尺。然而,唯论文的不合理问题,也引起了人们的批评。如早在2006年,就有人呼吁高校人才评价切莫唯论文,要尽快建立科学公正的人才评价机制,鼓励具有创新精神、作出突出贡献的人得到应有的待遇[15]。十多年前,破除唯论文的呼声开始高涨,人们认为一流大学不应以论文数量论短长[16],“唯论文论”该休矣[17]。而实践中,许多地方也为破除“唯论文论”开了个好头[18],对科研人员评价不再唯论文是举[19],人们越发认识到唯论文的局限和弊端,认为唯论文危害之大超乎想象[20],甚至有人提到唯论文养活了庞大的产业,形成了利益链,论文被利益绑架,严重偏离了学术轨道。

唯论文、唯职称、唯学历以及唯帽子等现象,引起了中央高度重视。2012年党的十八大刚结束,习近平总书记即指示有关部门调查研究教育评价问题,特别是大学排名和职称评审问题,要求拿出行之有效的解决办法。2016年之后,习近平总书记在多个场合反复强调要破除唯学历、唯文凭和唯论文。从这时开始,破“五唯”也上升到国家政策,政府先后出台了一系列配套文件,采取了一系列配套措施,各地各校积极贯彻落实,在实践中探索出许多新的评价方式,最突出地表现在以下几方面。

一是以立德树人为根本任务,整体设计教育评价体系。我国高等教育评价起步于改革开放时期,经过40余年的探索实践,基本形成了较为完整的高等教育评价和质量保障体系。无论什么评价,都需要以立德树人为根本标准,以师德师风为第一标准,把立德树人从软指标变为硬指标,从虚指标变为实指标,以思想政治教育为统领,建立大思政评价体系,实现三全育人全覆盖,培养德智体美劳全面发展的社会主义建设者和接班人。

二是探索分类评价新形式。“五唯”评价虽然包括文凭、职称、论文、奖项和帽子等多种形式,但实质上是唯数量和影响因子同一化的外在指标,不符合事物多样化发展实际。因此,破除“五唯”,必然要求分类评价。目前,我国高校根据地区、服务面向、学科专业等不同目标定位以及人才和教师工作性质、任务、岗位差异,设置不同的评价体系和标准,实行分类评价。如高校分为学术研究型、应用型和技能型,教师分为教学型、科研型、服务型等,不同类型评价各有侧重,强调突出实际业绩与贡献。在实践中,越来越多的高校设置了多种评价赛道,如单独设置了教学型职称。有的教师因为教学效果好、得到学生好评,或者获得国家级教学改革立项课题、得到政府教学成果奖而破格提升职称;有的教师虽然按一般标准达不到晋升要求,但因为指导学生参加高级别比赛获奖、单项科研成果突出、带来的经济或社会效益显著,也得到了破格晋升。

三是注重包容性、发展性、综合性和增值性评价。即不以论文产出等一时成果论英雄,进而着重考察评价长期发展潜力和综合发展状况。一些地方和高校在人才任期考核、职称评定中,综合教学态度、教学投入、教学效果、教学改革、学生评价、科研潜质、成果前景、同行评议、社会效益等,给人才发展留出弹性空间,有利于激励人才潜心向学,鼓励真才实学。

上述改革措施带来的最明显的变化,就是变“五唯”为多维。从整体上来看,多维评价取得了初步成效。然而必须承认,破除“五唯”评价依然艰难,一些地方和高校仍在继续强化论文、项目、奖项、帽子等,即使已经实施了多维评价,也多停留在表面形式。而实质上,多维变相成了“五唯+”,多维评价中的“五唯”依旧居于主导与核心地位,增加的其他各维度评价仅扮演着配角。不仅如此,一些高校反映,多维比“五唯”更加烦琐,更耗用时间和精力,并且评价过程中的人为因素难以控制,又产生新的不公平现象。

为什么“五唯”很难破除?原因自然有传统惯习等路径依赖因素的影响,但更多的则在于“五唯”评价本身蕴含着一定的合理性。

其一,“五唯”评价具有在思维上将事物多质性抽象为单质性的特点。无论是大学排名、学科专业排名,还是教师职称评聘,或者是人才引进和任期考核,在具体评价中,会面临着来自不同方面的要素和信息,这些要素和信息在来源上纷繁复杂,在程度上千差万别,在形态上多种多样,缺乏一致性口径,对其质量和水平基本无法直接加以比较。在这种情况下,评价者必须善于从各种要素和信息中抽象出某种共同的东西。“五唯”评价恰恰满足了这样的条件,它排除了众多评价物中各自差异化的特质,而从中提取出具有共性、高相关性的一般标准,这些共性的一般标准可以形式化和计量化,便于直观评价和对比。仅以论文评价为例,不管哪门学科、哪种形式的论文,评价者可以完全撇开论文所涉及的具体内容、观点、方法或结论建议,只需要考虑或计算一定时期内作者的论文产量、引用率、影响因子、获奖级别、刊物级别等相关因素,并赋予相应权重,便可得到质量或水平指数。其他各类教育评价,均可按上述方式如法炮制。

其二,“五唯”评价具有简约化、高效化和低成本化的优势。评价是一种管理,管理的本质总是与提高效率这种理性主义、功利主义和工具主义倾向联系在一起的。在教育评价中,无论是评价主体还是评价客体,其背景、条件、思想、观点、利益、需要、兴趣、个性等不尽相同,要实现评价和比较的目的,就必须尽可能舍弃或消除有关人与事物的差异性一面,找出人们可以接受的最大公约数和共同点,即抓住事物的主要矛盾、关键和共性,以此为基础设计评价指标和标准。如对领导干部的评价,在具体工作中便可分离出德、能、勤、绩、廉等指标;对高校人才培养质量进行评价,可分为师资队伍、教学投入、教学管理、教学效果等指标;同样,对高校人才进行评价,也可分为育人、教学、科研、社会贡献等指标。分类评价的过程,既是分化过程,也是归类过程,前者强化了指标的多样性和针对性,后者则舍弃了事物杂多的成分。任何评价指标体系,无论多么细致,都不可能细化到每一个个体、每一个方面和每一项工作,否则不仅会无限制地增加管理成本,甚至可能消除评价的可行性。要知道,人们面对的世界,已是经他们头脑分析之后形成的分门别类的图解化世界,或者说是观念化世界,不再是作为混沌整体存在的自然世界本身。语言和话语即是例证,任何一个事物被人们说出来或用概念表达出来时,便脱离了原来事物自身,成为那个被舍弃掉杂多的事物的抽象语词。客观的教育实践与我们研究和评价的教育实践并不同一。在西方管理界有“奥卡姆剃刀”的隐喻,说的是管理行为中,对那些无效的、无用的、多余的部分能够删减的要尽量删减,变成一种单质化或形式化的东西。“五唯”评价即舍弃了具体复杂的质料,留下的是可以分类、统计和计算的客观形式,由此教育评价才能顺利推进下去。这也是其他评价,如多维评价中的过程评价、综合评价、增值评价等复杂性和主观性评价所无法相比的。这也就解释了多维评价依然无法取代并且依然依赖“五唯”评价的深层原因。

其三,“五唯”评价在价值上具有协调不同群体利益诉求,进而实现评价的相对公平与合理化的功能。众所周知,组织越庞大,内部就越复杂,这种复杂既源于各主体先天秉赋,如出身、条件、关系等社会资本和文化资本的差异,也源于思想观念、价值目标和利益追求的不同,还有后天环境因素导致的区别。这些多维因素聚合到一起,往往使得教育评价难以把握和控制,因而评价中容易出现不公平现象。比如评价中可能受到人情面子、权钱交易等不正之风影响,而且即使没有此类影响,对不同学科的学术成果,或者相同学科的不同成果,要做出恰如其分的评价也是十分困难的,很多情况下甚至是不可行的。这也是同行评议制度常被人怀疑和指责的原因。而“五唯”则突出和侧重于量化评价,只计算数量或尽可能将相关因素转换为量化形式,避免了许多人情因素和质性因素的干扰。这种评价虽然问题不少,但人们仍然认为其最客观公正。在这一点上,“五唯”评价与高考问题如出一辙。

其四,实事求是地说,“五唯”评价也抓住了大学评价的核心与关键要素。大学办学复杂多样,就其职能任务而言,有教学或人才培养、科研、社会服务、国内外交流合作以及学生、党团工青妇、后勤等方方面面的工作,但所有这些工作,无论如何千头万绪,都是围绕人才培养、发展学术、服务社会等最基本职能展开的,它们构成了学校的主干。“五唯”评价中,不管是论文和职称,还是奖项、课题和帽子,恰恰突出体现了学校工作的核心所在。因此,“五唯”评价才得以长期延续,即使在国家层面已经提出要破除“五唯”,但严格说来,人们至今并未找到替代“五唯”评价的最佳方案,尚未实现对“五唯”评价的超越。

03

走向自为:大学评价改革突围之路
“五唯”评价的本质是“一唯”,从“五唯”到多维,是评价进步的表现,也说明教育评价正在逐渐打破“五唯”一统的僵化局面,朝着教育评价本来面目的方向回归。虽然目前多维评价还在探索之中,尚只起着补苴罅漏作用,无法实现对“五唯”的超越,然而,从“五唯”转变到多维,实施多元化评价,显著拓展了评价维度,是教育评价改革大势所趋。

与“五唯”评价相比,多维评价或多元评价显然更为科学,也更加合理,因为多维评价并不意味着抛弃“五唯”评价中相关核心指标、标准及其计算方法,而只是在“五唯”之外开辟了更多的评价形式及其内容,尤其是扭转了“五唯”评价中长期以来忽视立德树人、全面发展和特色发展这一根本方向的局面。当然,相对于“五唯”评价,多维评价更复杂,难度也更高。如果说“五唯”评价侧重的是评价人的智力活动及其结果,具有客观性、可测性、可控性、可比性、高区分度和高稳定性,那么,多维评价则侧重于评价人的非智力因素及其结果,如人的世界观、人生观、价值观、政治思想、道德情操、审美素养、综合能力、创新意识与实践能力等。这些非智力因素主观性强、差异性大、区分度与可比性低、复杂性高,数据零碎,缺乏连续性和统一性,无形中增加了评价的时间、精力、财力与心理等成本。如何提高对人的非智力因素及其结果评价的科学性与合理性,是需要解决的大问题。在传统的物理性时空下,教育评价者和被评价者直接交往的场所和机会总是有限的,由此,评价者所获得的有效信息、数量和质量也是受限的,要全面客观准确地了解与把握被评价者,就要不断增加双方交往的频率和强度,这显然是不现实的。这也是多维评价难以深入推展的主要原因。

当代已进入信息技术时代,借助现代信息技术手段,可以大大提高多维评价的可靠性。现代信息技术革命性甚至颠覆性地突破了传统教育下人们生活和交往的边界,不仅极大拓展了教育的物理时空,更开辟出无边界的教育信息时空。在大时空之下,评价者获得所需要的信息数据不再只靠教室、图书馆、实验室、阅览室等有限的物理场合,也不再只靠人际交往中耳闻目睹等有限的感性印象以及平面媒体单一渠道,而是充分利用互联网和大数据等现代信息技术装备(如全方位监测系统、通讯系统、神经网络系统、人脸识别系统、可穿戴系统、虚拟仿真系统等),通过云计算、区块链等先进的算法与强大的算力来收集有关现象或事物无限丰富和海量的信息,快速和精准地对其进行透视成像。这不仅极大地提高了评价效率,也减少了信息缺乏或失真导致的评价误判以及由此造成的不公。现代信息技术可以实现不间断地观察、记录、收集和整理被评价者日常生活、学习和工作等自然状态下呈现出来的任何行为数据,相对全面客观准确地推断被评价者的思想、道德、知识、能力和素质,进而成为教育评价的有效工具。

现代信息技术与人工智能为多维评价开辟了广阔前景,但目前大数据、人工智能还处在初步发展之中,本身尚不完善,上述的论述只是就理想目标而言的。同时,大数据和人工智能也不是万能的。一方面,智能化机器所收集的数据尽管海量,但也仅是人的外显的行为化信息,这样的数据能否完全真实地揭示人的内心世界,如人的道德、价值与情感,值得怀疑;另一方面,人工智能技术再发达也不能侵犯人的私域生活,不可能更不应该全天候无死角地观察和记录被评价者在任何场所的任何行为。事实上,大数据和人工智能伦理问题已经引起人们的高度警惕。

大数据和人工智能为多维教育评价的科学性和有效性创造了有利条件。但教育评价改革从“五唯”到多维并不是终点。如果说“五唯”评价所遵循和体现的是科学主义和工具主义信仰、实证主义原则、定量数理统计方法,导致了评价中见物不见人、平均主义、简单化、急功近利以及行政化弊端,进而造成“五唯”评价陷入危机困境的话,那么,多维评价确实在相当程度上克服了上述缺陷,体现了评价的人文性、主体性、实践性和生活性[21]。然而,不管是“五唯”评价抑或是多维评价,从根本上而言,它们仍属于外部评价,即由被评价者自身之外的组织所实施的评价。外部评价者可以是政府、专业机构、独立第三方(如媒体)、基金会,也可以是学校、学术团体或自然人。不论是政府、学术团体还是自然人,只要是外部评价,都会形成“评与被评”双方对立性的紧张关系。虽然在理论上或者政策宣传上经常讲“评价不是为了证明,而是为了改进”[22],但现实中的外部评价总是证明多改进少,因为外部评价的主要功能在于检查、督促、监测、问责、评比,而这些功能又必然通过结果来证明。并且,外部评价总会左右和干预被评价者的行为取向,尤其是评价结果关系到被评价者的地位、声誉、资源等切身利益,容易导致评价形式化、短期化和功利化,进而导致评价失真和变形。

教育学中有一句至理名言,即“教是为了不教”。教育的最终目的在于养成学习者自我教育和终身成长发展的能力。同样,我们也可以说,评是为了不评。教育评价的最终目的在于形成人们自我评价和反思的能力,形成良好的评价文化。外部评价形成的是评与被评“主客”二元对立关系,内部自我评价形成的则是我与自身“主主”一元统合关系。这里,“我”既是评价者,又是被评价者,二元对立关系在“我”“我”关系下消失和融合了,“我”把“我”的活动及其结果作为“我”的反思和评判对象,从而自我做出调整、改进和完善。进一步说,自我评价将以往的主客关系属性,改变为自我主体。主体性和能动性是自我评价的本质特性,从“五唯”到多维再到自为,评价的主体性转向了教育活动者自身。

内部自我评价的主体,既可以是组织,也可以是个人。政府、高校、团体便是组织形态,管理人员、教师、学生、学者便是个人。政府、高校、团体等,仍然可以开展内部自我评价,但这时的评价,不再是或主要不是评价别人,而是评价自己。如果政府要评价自己制定的政策是否达到了预期目标,执行状况如何,具体管理活动是否有成效,还有哪些方面需要改进,当然可以通过其政策落实者或执行者,如高校、科研院所的教育教学、科研、服务以及相关活动的效果来验证。验证少不了向高校或科研院所收集相关信息,但其作用不是对高校或科研院所作评价。同样,高校自我评价也是如此,它也不直接涉及高校内部院系和个人的评价,依此类推,最终是师生或学者个体的自我反思性评价。政府、高校、院系、个人自我评价应该成为常态。如果这种反思性内部自我评价形成了,即表明建立了良好的评价文化。

由上可知,从“五唯”评价到多维评价,再到自为评价(即自我评价),是教育评价改革的方向,也是破除“五唯”顽疾的突围之路。自我评价也是一种终极意义上的理想评价。那么,大学为什么要提倡自我评价?为什么把自我评价看作教育评价的最后形式?自我评价是否过于理想而不可行?这一系列问题,需要我们认真回答。

首先说终极性的必然性。马克思曾经说过,人类社会将从必然王国走向自由王国。其意思是说,随着人类的发展进步,人们对自然界、人类社会以及思维本身的认识越来越深入,直到真正揭示和把握了世界的本质规律,这时的外部世界将变成“为我”的世界,人既合规律又合目的地从事实践活动,从此也就真正摆脱了外部世界附加于人类身上的各种限制。这说明迈向和实现自由自主是人类的终极目标,人类需要不断朝着这个方向努力奋斗。康德在“三大批判”中强调,个体的发展,包括道德发展,总体趋势是从他律走向自律的过程,他律只是外在的手段和辅助工具,只有自律才是人的真正目的和意义。同时,自律不是对他律、教化和规训的简单接受、认同、习惯化或自动化,而是主体价值的超越和实现。康德认为,启蒙主义不是自上而下的教导、灌输和强制,从来不存在一个万能的上帝[23]。马克思也批判传统的启蒙主义,认为传统启蒙主义思想和行动必然把人分成两部分,其中一部分高高在上扮演着真理发现者和“教师爷”的角色。而人在改造客观世界的实践中,也在改造着自身,教育者需要受教育。“环境的改变和人的活动或自我改变的一致,只能被看作是并合理地理解为革命的实践。”[24]真正的启蒙是主体之间的平等对话,是主体在实践交往中的自我反思和自我教育。将这一基本原理和最终走向运用到教育评价实践中,我们不难得出类似的结论:教育评价必将从外部评价走向内部自我评价。

其次现实性的必要性。大学是高度专业化和创新性的学术组织,自由、自主、自治是专业化和创新性的前提与保证。所谓的自由、自主、自治,就是说作为知识生产单位,生产什么和怎样生产,什么知识最值得生产,只有学校、学院和学者自己才最清楚、最了解。外部评价者,尤其是行政机构和市场没有能力替代大学,尽管现代条件下政府和社会也日益专业化。有人可能还会说,当下行政机构开展的外部评价也早已不是外部的了,而是行政部门借助专家进行的评价,是专业性的评价行为,如众所周知的本科教学评估、学科评估、专业认证之类。而且从程序上看,评价方案、评价指标和标准、评价方法与技术,都是专家研制的,评价过程是专家亲自操作的,评价结果是专家作出的。但必须看到,专家背后的真正主体、组织者和操控者是行政部门,评价目的方针、评价标准、评价导向、评价结果及其运用,体现的是政府的意志和意图,专家仅仅是专业化的形式化与外在化表现,况且政府依靠专家,专家已变身为行政机构的代理人,体现和执行的是行政官员角色。外部评价具有强制性、规训性和权威性,评价结果合理不合理、准确不准确,评价程序公正不公正,对高校办学有直接且重要的影响。因此,必须尽可能减少外部评价及其对被评价者的干预。

对于师生和学者个体的外部评价,如“五唯”评价等,也应该加以破除,还给他们自主评价的权利。学术研究少不了外在支持,特别是在当代知识发展不平衡和竞争不断加剧的情况下,各国政府为了发展本国学术,保持学术领先地位或者实现快速追赶目标,普遍加大了知识生产和人才培养的力度,投入巨资开展有组织科研;企业部门也不断寻求与大学合作,显著扩大了知识生产规模,提高了知识生产效率和知识转化效益,促进了大学的发展和繁荣。不过,与之相伴随,也出现了学术资本主义倾向,知识的中立性、真理性和专业性受到影响,学校变成了资本和谋利的工具,大学和知识分子的公器作用正在不断下降。

“五唯”评价中的唯论文、唯职称、唯帽子等,单从形式上看,是学者或学术组织自我评价或内部评价的表现。专业论文一般都发表在本专业领域的专业期刊上,编辑人员也多是业内人士,何况期刊还要将论文送给同行专家盲审。职称同样经过同行专家的评审。看似学术同行评议行为,却同样不能代替自我评价。在这里,同行评议的目的并不在于平等地开展学术交流,而在于论文发表和职务晋级,偏离了学术自身,何况刊物、课题、奖项设立部门的级别变相成了衡量论文成果水平和质量的标准。论文发表和职称晋升中的各种不端行为,恰恰说明了这类评审的实质是地道的外部评价。

最后再说自我评价的可行性。从“评是为了不评”的终极目的看,理想的评价是学者或学术部门、学术同行的自我评价。这种评价不是为了职称、发表、荣誉、地位等外在目的,而是纯粹为了学术交流和分享,为了知识自身的发展、进步和创新,为了师生发展和成长。事实上,每一位学者和科学家,都有一颗虔诚对待学术之心,他们都渴望在学术生涯和知识探索中作出一番贡献:或者是新的知识发现,或者是新技术发明,或者是新概念提出,或者是表达新的观点和见解。他们在从事知识生产或者教育教学活动中,对自我学术基础、学术积累、学术水平、学术成果创见、学术良知,对学术同行的水平、能力和学术道德的判断,实际上是最清楚的;对其研究推进到了哪一步,取得了何种成效,也是心知肚明的。因此,只有他们自己才能够作出较为客观准确的评价,尽管在这个过程中也难免存在着文人相轻或自视清高的心理,但不影响内部评价或自我评价的合理性与准确性。自我评价如果受到外部评价左右,那么,每一个人都会成为争夺利益的理性算计者,都会不由自主地夸大自身工作的重要性和学术贡献,造成学术浮夸和泡沫。基于此,我们说,从“五唯”评价到多维评价再到自为评价,是真正回归学术本身,是大学教育评价要追求的最高境界。

参考文献

[1] 新华社记者.以教育之强夯实国家富强之基[N].人民日 报,2023-05-31(1).

[2] 教育部.2024年教育评价改革研讨班举办[EB/OL].(2024-05-29)[2024-06-19].http://www.moe.gov.cn/jyb_zjg/huodong/202405/t20240529_1133070.html.

[3] 潘懋元,刘振天,王洪才,等.要勇敢面对一流本科教育这个世界性难题(笔谈)[J].教育科学,2019(5):1-16.

[4] 付八军.高校“五唯”:实质、缘起与治理[J].浙江社会科学,2020(2):90-94,108.

[5] 邓小平.邓小平文选:第二卷[M].北京:人民出版社,1994.

[6] 唐敖庆.怎样把重点大学办成“两个中心”[J].高教战线,1985(3):5-7.

[7] 曾俊期.“两个中心”统一于培养人才的根本任务[J].中国高等教育,1987(Z1):21-24.

[8] 唐仁洪,李富明.把高等学校办成“两个中心”势在必行[J].辽宁大学学报(哲学社会科学版),1981(2):21-25.

[9] 中共中央.中共中央关于教育体制改革的决定[J].中华人民共和国国务院公报,1985(15):467-477.

[10] 赵英淑,兰亚明.南京大学SCI论文引用数高校八连冠[N]. 科技日报,2002-12-17(04).

[11] 中国科协.学术榜:中国科协各类学会的科学计量指标的排序[J].学会,1988(1):36.

[12] 龚放,曲铭峰.南京大学个案:SCI引入评价体系对中国大陆大学基础研究的影响[J].高等理科教育,2010(3):4-17.

[13] 王炳业.“学历社会”与“唯学历”现象[J].青年探索, 1984(1):38-39.

[14] 高明晨,谢忠钧.不拘一格与职务评聘[J].中国人才,1989(1):8.

[15] 廖君.副省长呼吁高校切莫唯“论文”论[N].新华每日电讯,2006-01-15(2).

[16] 英名校校长认为一流大学不唯论文数量论英雄[J].语文教学与研究,2011(29):3.

[17] 刘英团.“唯论文论”该休矣[J].四川党的建设(城市版), 2015(3):13.

[18] 廖水南.破除“唯论文论”开了个好头[N].重庆商报, 2015-02-10(A06).

[19] 王微. 科研人员评价将不再唯论文是举[ J ].科技导报, 2016 (7):9.

[20] 吴月辉,刘诗瑶.评价“唯论文”,危害有多大[N].人民日 报,2016-09-09(19).

[21] 李永全,胡钦晓.从“五唯”到“五维”:学术评价范式的转换[J].江苏高教,2023(1):25-34.

[22] 吴钢.美国教育评价理论的产生和发展原因的探析[J].外国中小学教育,1993(3):24-27.

[23] 尤西林.康德“自主启蒙”与现代社会互动机制[J].中国社会科学,2024(2):143-154.

[24] 中共中央编译局编.马克思恩格斯选集:第4卷[M].北京:人民出版社,2012:219,17.

原文刊载于《大学教育科学》2024年第5期P10-18


作者 | 刘振天

来源 | 一读EDU

编辑 | Jessica

更多精彩,请关注我们

里瑟琦科教观察
最独立的科技与教育评论
 最新文章