王战军 李旖旎:数智时代我国高等教育评估体系的转型与重构

文摘   2024-06-13 09:02   湖北  






数智时代我国高等教育评估体系的转型与重构


王战军 李旖旎


作者简介:王战军,河北邯郸人,管理学博士,北京理工大学研究生教育研究中心主任,人文与社会科学学院特聘教授,博士生导师,主要从事高等教育管理与评估、教育发展战略等研究;李旖旎(通信作者),北京理工大学人文与社会科学学院助理研究员,博士后研究人员。北京,100081。

(原文载于《大学教育科学》2024年第2期P106-117)

 

摘要:数智时代我国高等教育的转型呼唤高等教育评估的变革。从内涵维度透视,高等教育评估的目的由单一价值判断转向多元智能优化,评估的尺度由单视域及时反馈转向多视域实时呈现,评估的模式由数据集中密集转向区块互联分布。从功能维度透视,全息评估支撑多元主体从认识价值上升为“共创价值”,人工智能驱动主管部门从被动应对决策上升为主动“预警预测”,人机互动牵引教育教学质量从持续改进上升为“提质增强”。建构新型高等教育评估体系须秉持“以评促强、争创一流”的发展理念,探索“平台化”协同慧治的治理模式,创造“教育评估智能体”的超级生态,持续系统提升高等教育质量,服务于教育强国建设。

关键词:高等教育评估;数智时代;教育强国;教育评估智能体

 

一、引言

自改革开放以来,我国高等教育评估已走过40多年历程,高等教育评估体制机制日臻完善,高等教育评估的价值取向实现了由“保障高等学校质量”到“提高人才培养质量”,再到“建设高等教育强国”的“三级跳”[1],为2035年如期建成教育强国、科技强国、人才强国提供了有力支撑。1978年,党的十一届三中全会开创了社会主义现代化建设新局面,随着高校数量和招生规模的快速增长,教育评估活动成为高等教育领域的焦点。1985年5月发布的《中共中央关于教育体制改革的决定》,首次提出对高等学校办学水平进行评估,推动我国高等教育评估进入有组织、有计划的实践探索阶段[2]。2004年3月,国务院正式批转《2003-2007年教育振兴行动计划》,提出实行五年一轮次的高等学校教学质量周期性评估制度,并建立高等学校教学质量评估和咨询机构[3],标志着我国高等教育评估步入规范化、专业化发展阶段。2011年发布的《教育部关于普通高等学校本科教学评估工作的意见》,首次提出建立“五位一体”高等教育评估制度体系[4],推动高等教育评估进入内涵式发展阶段,为全面提高教学水平和人才培养质量奠定了基础。

近年来,5G通信、区块链、人工智能、移动互联网、虚拟现实等前沿技术的快速迭代和应用,特别是美国OpenAI公司发布的ChatGPT4.0 Turbo产品对人工智能领域的技术革命,使得传统社会生产方式和生产关系发生深刻改变,科技变革与产业变革积蓄的巨大能量进一步释放,推动人类社会迈入“数智时代”[5]。随着数智时代的到来,高等教育领域也正在经历一场“大变局”。在教学端,“远程教学”成为高等教育领域新常态,课上课下、校内校外、区域之间的时空界限被打破[6],线上与线下教学实现无缝衔接。在学习端,在线教学拓宽了大学生的学习方式,养成了大学生“碎片化”学习习惯,增强了大学生掌握学习时间的灵活度和学习内容的针对性,满足了大学生的个性化知识需求。高等教育逐步与移动互联网的深度联结,推动了高等教育的主体内容数字化、交互形式网络化、课堂界限模糊化、保障资源智能化。

数智时代高等教育的转型同样助推高等教育评估的变革。2020年10月,中共中央、国务院印发的《深化新时代教育评价改革总体方案》,提出坚持科学有效,创新评价工具,充分利用人工智能、大数据等现代信息技术,提高教育评价的科学性、专业性、客观性的新要求[7]。2023年5月,教育部印发《关于深化新时代高等学校评估改革方案》,再次强调评估方法创新的重要性,提出综合运用现代信息技术开展智慧评估[8]。因此,如何运用一系列数智技术赋能高等教育评估已成为备受关注的核心议题。鹿星南等认为,新型教育评估体系应树立“人工智能与教育双向赋能”的理念,采用物联网、大数据、学习分析、机器学习等智能技术,旨在对个体综合素质水平进行数字画像构建、精准评估和可视化诊断,为评估对象提供个性化教育干预服务[9]。刘邦奇等认为,数智赋能教育评估是指在智能时代背景下,充分利用智能技术优势,改进传统教育评估过程和方法,提升教育评估数字化、智能化水平,实现科学客观和高效的评估与反馈,促进教育事业的改革与发展[10]。杨现民等从“以人为本”和“技术驱动”两种视角,重新解释了数智赋能教育评估,即旨在利用技术手段和方法,驱动教育评估从经验主义走向数据主义,实现对教育活动的智慧判断[11]

综上可知,现有研究多聚焦整体性教育评估,重点关注数智技术对教育评估方法和手段的影响,却忽视了未来教育评估的思维变革,对高等教育评估数智化转型支撑有限。因此,站在数智时代的起点上,探析新时期高等教育评估的内涵、功能和体系重构,对于顺应时代发展变化、把握历史机遇,依托高等教育评估变革牵引高等教育在育人方式、办学模式、管理体制、保障机制等方面的综合改革具有重要意义,也可为中国式现代化背景下教育强国建设“筑基铺路”。

二、数智时代高等教育评估的新内涵

我国开展高等教育评估40余年来,各相关方经过长期的实践与探索,对高等教育评估的内涵逐步形成基本共识:以高等教育为对象,依据一定的评估标准,利用科学、客观的评价技术和手段,系统收集评估信息,通过定性和定量的分析,对评估对象给予价值判断的过程[12]。进入数智时代,5G通信、区块链、移动互联网、人工智能等前沿技术持续推动高等教育评估的改进和迭代,在根本目的、状态监测和基本模式等方面为高等教育评估注入新的内涵。

(一)高等教育评估根本目的:单一价值判断转向多元智能优化

20世纪80年代,我国高等教育管理引入全面质量管理理念,通过综合运用现代管理技术和方法,对培养对象和学校的全面工作进行全过程、系统性管理,推动高等教育评估进入了“标准化”阶段。20世纪90年代,国家教育委员会发布《普通高等学校教育评估暂行规定》等文件,初步明确了我国高等教育的评估程序、评估机构、评估方式等[13]。此时,高等教育评估的基本任务是:根据一定的教育目标和标准,通过系统地搜集学校教育的主要信息,准确地了解实际情况,对学校办学水平和教育质量进行科学分析并做出评价,为学校改进工作、开展教育改革和教育管理部门改善宏观管理提供依据。可见,这个阶段的评估目的是为高等教育改进、改革和改善提供依据。

21世纪初,教育部先后发布《普通高等学校本科教学工作水平评估方案》《普通高等学校本科教学工作水平评估专家组工作规范》等文件,对全面提高教学质量和办学效益提供了有力指导[14]。2003—2008年间,教育部对全国589所高校进行了本科教学水平评估,通过制定统一的指标体系将评估结果分为优秀、良好、合格、不合格4个等级。在此阶段,高等教育评估的基本任务是:提升质量意识,改善办学条件,强化教学管理,以确保教学质量的提高。很明显,这个阶段高等教育评估目的在于把高校教学和人才培养工作变得可测量、可判断、可比较[15]。不过,当时单一化的评估标准使得高校无可避免地逐渐卷入排名“漩涡”,导致教育评估初心的迷失与背离。

在系统总结首轮高校教学评估经验和教训基础上,教育部自2010年开始着手制定新的评估方案,先后出台《关于普通高等学校本科教学评估工作的意见》《普通高等学校本科教育教学审核评估实施方案》等文件,明确将“教学基本状态数据常态监测”作为本科教学评估的主要内容和基本形式[16]。在国家层面,教育部建立了全国高等学校本科教学基本状态数据平台,常态监测到的状态数据在政府监控高等教育质量、社会监督高等学校人才培养和本科教学评估过程中发挥了重要作用。在高校层面,各学校利用信息技术采集反映状态的基本数据,建立了教学基本状态数据平台,并对数据平台数据及时更新,及时分析本科教学状况,形成了本科教学工作及其质量常态监测机制。这一时期的高等教育评估任务为:首先,促进高等学校全面贯彻党的教育方针,推进教学改革,提高人才培养质量,增强本科教学主动服务经济社会发展需要和人的全面发展需求的能力;其次,促进政府对高等学校实施宏观管理和分类指导,引导高等学校合理定位、办出水平、办出特色;再次,促进社会参与高等学校人才培养和评价,监督高等学校本科教学质量。因此,这个阶段高等教育评估的根本目的可归纳为利用信息化手段对高等教育进行价值判断,评价、监督、保障和提高教育教学质量。

进入数智时代,在人才培养需求变化和各项前沿技术发展的双向助推下,高等教育将逐渐呈现知识迭代快速化、课程更新频繁化、教学资源海量化、培养方案动态化、学习模式自主化等特点。传统高等教育评估的单一维度价值判断结果将难以满足数智时代高等教育变革和人才素质提升的快节奏发展需求。与此同时,将大数据、区块链、人工智能、辅助决策、专家系统、高性能计算、数字孪生等数智技术赋能高等教育评估,可实现在“优”“良”“合格”等传统单一评价维度的基础上,更进一步在“教学内容”“教学方式”“知识资源”“培养方案”等多元维度上自适应生成若干优化方案,通过在虚拟空间进行多方案平行数值模拟,快速迭代计算出最优的评估量化结果,并提出可行的优化方案或组合方案建议,直接供评估主体和评估对象遴选与决策,从而支撑高等教育质量持续系统提升。因此,数智时代高等教育评估的根本目的必将从单一的价值判断转向多元的自适应智能优化。

(二)高等教育监测评估尺度转型:单视域及时反馈转向多视域实时呈现

状态监测评估是高等教育评估的重要组成部分,是对专家经验评估的有益补充。专家经验驱动的传统评估具有周期长、成本高、效率低、主观性强等局限性[17],难以适应现代高等教育系统的复杂性变革和利益相关者的多元化需求。同时,现代信息技术的发展带来评估思维方式和评估方法论的转变,促使数据驱动的状态监测评估成为高等教育质量保障的新类型[18]。高等教育系统的状态可通过数据来进行表征,其测度的标尺称为尺度,主要包括时间尺度和空间尺度。

时间尺度用以表征高等教育系统状态变化过程的时间分布和周期[19],一般以年、季度、月、周、天、时等为计量单位。21世纪初期,高等教育状态监测通常依靠定期统计,监测数据在时间尺度上是离散的,且数据采集频率较低,中间往往存在一年或几年的间隔期。在这一间隔期,高等教育系统发生的变化,状态监测是无法捕捉到的,这时的状态监测评估主要是监测“年”“十年”甚至更大时间尺度上高等教育状态的变化过程。随着科技的发展,诸如互联网、高速通信、大数据处理等技术在各领域的成功实践,国家也适时出台《国家中长期教育改革和发展规划纲要(2010-2020年)》[20],通过政策牵引推动了高等教育常态监控体系建立,初步构建了全国高等学校本科教学基本状态数据库,实现了对本科教学状况的及时分析。这时期的高等教育常态监控体系的监测数据在时间尺度上是接近连续的,数据采集频率较高,可达到“及时反馈”的程度,主要是监测“月”“周”“日”等时间尺度上高等教育状态的变化过程。数智时代,随着5G通信技术、人工智能、数字孪生等技术的发展,状态监测从理论上可实现“实时呈现”,可将各高校教育教学的实际状态“镜像孪生”[21],并通过人工智能自我学习提前预测发展趋势,且可采用多目标优化算法得出最优结果,最终将信息反馈至实体端以支撑高校的相关决策。因此,数智时代的状态监测评估可实现“时”“分”甚至达到“秒”的时间尺度。

空间尺度用以表征高等教育系统要素及其结构的空间分布和延展,直接反映监测对象的“分辨率”[19],与评估需求密切相关:当关注国际、国家、区域等宏观维度的状态时,一般是主要监测总体指标;当关注院校、学科等微观维度的状态时,一般监测系统指标;当关注教师、学生、课程等介观维度的状态时,则是重点监测细节指标。由于宏观维度、微观维度和介观维度的颗粒度差距较大,各个尺度下所包含的信息体量和复杂程度有较大不同,对信息传输速度、数据解析能力、性能计算资源的需求也有所不同。在互联网发展的早期阶段,由于通信带宽、传输效率、信息流架构、高性能计算等技术不足的限制,高等教育评估主体不得不对监测对象的空间尺度进行降维解耦处理,评估人员仅能根据评估需求选取宏观、微观或介观中的某一维度进行监测。因此,这个阶段的高等教育状态监测评估的空间尺度呈现“单一分辨率视域”的特点。

随着高等教育数字化转型,以及区块链、5G网络通信、移动互联网、人工智能等前沿技术的深入应用,各维度间多尺度耦合的技术门槛降低,“多尺度耦合视域”成为数智时代状态监测技术未来的发展方向之一。宏观维度的评估可通过对国家人才、科技、就业、区域等与高等教育相关的公开数据进行数据深度挖掘和整合来实现;微观维度的评估可通过对高校、院系的实时监测动态数据来实现;介观维度的评估可通过对MOOC、线上课堂、网络会议等与师生强捆绑的移动APP的动态数据来实现。而且,各维度的监测数据能够共用共享、深度融合,评估者对个体APP数据进行“积分”处理就可以支撑宏观趋势判断,对宏观数据进行“微分”处理便能支撑微观和介观的机理分析。因此,数智时代高等教育状态监测评估的空间尺度将呈现“多尺度耦合视域”的趋势,使状态监测具备根据评估需求进行空间尺度“变焦”的能力,如图1所示。

(三)高等教育评估基本模式转型:数据密集集中转向区块互联分布

我国自20世纪80年代高等教育评估萌芽开始至今,随着有关政策的颁布与执行,以及科学技术的发展与应用,高等教育评估模式大体可划分为三个阶段:从1985年至2010年为第一阶段,形成了“经验驱动”评估模式;从2011年至2019年为第二阶段,形成了“数据密集集中”评估模式;2020年之后开始进入第三阶段的数智时代,有望形成“区块互联分布”评估模式。三个阶段评估模式的显著特点和变化可以从信息域、数据域、技术域等层面来呈现,如表1所示。

从信息域上看,第一阶段的评估信息流为“点对点单向离散式”,信息流架构呈现多维度多层级递阶特点。一般按照评估计划,每年或定期以统计的形式,将有限的评估信息自下而上逐级人工传递。该阶段评估信息覆盖不全,信息传递效率低,各高校、各层级之间信息隔离,且信息只在教育管理部门或第三方评估机构内部呈现,仅能初步反映高等教育的整体状态,难以快速反映整体状态的短期内变化,对评估工作的支撑力度有限。第二阶段的评估信息流为“中心集中单向连续式”,信息流架构呈现扁平化“行星状”特点。评估信息采集一般通过定期统计,或依托动态监测数据平台对高校教育状态进行半自动化信息获取。该阶段评估信息覆盖较为全面,信息层级得到压缩,可基本反映高校教育教学的多维度状态。在4G网络通信和扁平化集中信息流架构的支持下,这一阶段的信息传递效率大幅度提升,但各高校之间信息仍然隔离,评估信息也只能做到局部公开。在数智时代的第三阶段,评估信息流为“区块分布双向平行式”,信息流架构呈现“区块互联分布”特点,动态监测数据平台对高校教育状态进行全自动化的信息获取,信息数据可双向传递,各节点之间信息互联互通,5G通信和区块链的分布式架构使信息传递效率进一步提升,评估信息全面跨域共享,各高校教育状态信息实时呈现,可全面支撑高等教育评估,并可实现各高校间的相互促进与交叉借鉴。

从数据域来看,第一阶段获取的评估数据属于“专家驱动的小样本数据”,一般由教育管理部门或第三方评估机构定期组织评估专家赴高校现场,通过调查问卷、资料查阅、手动录入等方式进行数据的搜集与整理[22]77-78,以专家的理性、知识、经验对高校教育教学状态进行主观判断。在此阶段,评估数据形式较为单一、体量较小,这些数据仅作为专家判断的有限支撑,专家仍是评估的主导。第二阶段获取的评估数据属于“模型驱动的密集型数据”。该阶段在定期专家评估的基础上增设了教学工作质量常态监测机制,通过远程技术定期采集各高校教育教学的状态数据,然后从获得的大数据中探索数据内部隐含的特征、关系和模式,以获取更为密集的数据,最后利用评估模型对高校教育教学状态作出客观判断。此阶段的评估数据形式较为丰富、体量较大,对以小数据佐证的专家判断进行了借鉴和补充,数据成为评估的主导。在数智时代的第三阶段,获取的评估数据属于“人工智能驱动的海量数据”。该阶段在密集型数据的基础上,通过数据的自我学习、自我生成和自我反演,得到时间维度和空间维度更多未知状态点的海量预测数据,“自适应”建立起更为精细的评估模型,并通过与各高校实际教育教学状态信息进行多轮迭代比对验证,数据与模型持续优化,依托先进算法对高校教育教学状态作出更为精准的客观判断与趋势预测,科学指导高等教育管理决策。此阶段评估数据形式多样、体量巨大,可基本替代传统的专家判断模式,数据与智能成为评估的主导。

从技术域来看,第一阶段高等教育评估的支撑技术较为基础且单一,主要依靠现场调研、人工采集、传统评估等方式。进入第二阶段,“互联网+”理念的兴起与普及使高等教育状态常态监测成为可能,4G通信技术进一步为信息的远程高效传递提供支撑,并通过大数据等技术实现对数据的清洗、整理、提取与分析,推动该阶段形成了“数据密集集中”的高等教育评估模式。在数智时代的第三阶段,去中心化的区块链技术广泛应用为分布式互联的信息流架构提供了理念借鉴;5G通信技术支撑更高效的数据传递和更海量数据的跨域互联;人工智能技术推动数据的不断自我学习;高性能计算技术使得对海量数据的分析处理与复杂运算得以实现;多目标优化技术可通过反复迭代得出最优的改进方案;健康管理技术可以更好地监测各高校教育教学状态信息;数字孪生技术促进评估对象数据信息实时平行传递的实现;辅助决策、运行支持及智能运维等技术则可以为高等教育评估不断优化提供坚实基础。这些先进技术的深度融合塑造了数智时代高等教育评估的“区块互联分布”新模式。

三、数智时代高等教育评估的功能转型

2022年11月,教育部召开“深化新时代教育评价改革工作推进会”,怀进鹏部长在会上指出,要“以教育评价改革牵引教育领域综合改革,为加快建设教育强国、科技强国、人才强国增添动力和活力”[23]。会议赋予了教育评估新使命、新任务,体现了教育评估对教育强国建设的重要导向作用。立足新时代,高等教育评估的重心已由“针对”评估对象转向“服务”评估对象,评估的功能迫切需要随之优化升级。数智时代高等教育评估在功能定位上更加追求多元主体“价值共创”、主管部门“预警—预测—决策”一体化,以及教育教学质量的“提质增强”。

(一)全息评估支撑多元主体从“认识价值”上升为“共创价值”

马克思在《关于费尔巴哈的提纲》中指出:“哲学家们只是用不同的方式去解释世界,而关键在于改造世界。”[24]在传统高等教育评估中,评估主体扮演着“局中人”角色,对评估对象的考察主要通过统一的评估标准进行简单化衡量,这就使得高等教育评估被框定在“认识价值”的层面上。数智时代,先进技术有望推动高等教育“全息评估”的实现,使得多元评估主体从“局中人”转向“当事人”,进而为“创造价值”提供支撑。

高等教育数据的类型非常复杂且差异很大[25],准确完整的数据获取是高等教育评估的关键。传统的高等教育评估信息获取途径主要包括自我评估、专家评估和社会评估[22]75。虽然这三种信息获取途径各具优势,但由于均属人工抽样收集方式,获取的高等教育数据资源无论是在客观性和全面性上都具有一定局限。例如,被评估单位在自我评估中可能夸大或缩小某些数据[22]75,同行评审专家大多给予正面积极的评估等问题[26]。数智时代,前沿技术的飞速发展和广泛应用,重塑高等教育评估数据获取的空间格局,推动物理、社会、数字三类空间的融合互联,使得获取的数据更多样、更全面、更立体,呈现出高度的集中化。通过物联感知技术、可穿戴设备技术、视频监控技术等智能技术[10],可以无间断地对高等教育评估数据进行全方位、全过程的伴随式采集,从而构成“全样本数据”。

数智时代的高等教育评估将呈现系统性的特征。虚拟与现实空间的交叠引起多源、异构、海量数据的汇聚,消除了基于“小样本数据”的传统高等教育评估数据采集分析所面临的量与质难以兼顾的技术瓶颈。数智技术带来的“高涵盖性”评估数据进一步提升了高等教育评估环境的透明度,使数据来源不再局限于高等教育系统内部,加强了高等教育数据与国际、区域、行业需求等数据的结合、交换和共建共享,从而催生更多数量和种类的新型高等教育数据,有助于多元评估主体对高等教育发展现状进行全面把握。对评估主体而言,只有把握评估过程的全要素,充分释放评估数据“生产力”,才能兼顾“局中人”和“当事人”的双重身份,才能以系统思维和战略眼光谋划高等教育发展之路,将马克思所说的“解释世界”和“改造世界”有机统一起来,推动高等教育评估的多元主体在协调互动过程中实现价值共创。

(二)人工智能驱动教育主管部门从被动“应对决策”上升为主动“预警预测”

从治理的角度看,教育评估是提高教育决策科学性的重要手段。高等教育决策的科学性体现为促使高等教育活动达到合规律性与合目的性的统一[27]。合规律性是指高等教育决策要遵循教育自身的发展规律,合目的性是指高等教育决策要凸显教育对人和社会的价值。合规律性是为了合目的性,高等教育评估主体不仅要探索教育规律,更要揭示教育价值,体现高等教育对人和社会的意义。

由于评估手段和数据可得性的限制,传统的高等教育评估多采用“专家驱动”评估模式,主要凭借专家的知识经验,结合票决、回避、公开等方式对评估结果进行判定[19]。这种从专家判断出发的评估模式必然存在主观随意性。为保证高等教育评估结果的科学性,基于“公共效率”视角的高等教育评估开始流行。这一视角吸纳了企业的经营管理模式,主要指向“投入”与“产出”两个客观要素之间的效率关系,强调对高校设定目标完成情况的“精细化的量化考核”[28],但“公共效率”视角对高等教育活动本身的实际过程缺乏关注,助长了高等教育评估中“工具理性”的泛滥[29],难以保障高等教育管理和决策的科学性。

大数据和人工智能技术为高等教育决策优化提供了新的视角和途径。基于大数据背景下的人工智能,未来高等教育决策将更加趋向“预警—预测—决策”一体化。例如,在未来的院校评估中,评估专家可以借助大数据和人工智能技术开展线上评估,以便对高校的发展状态进行持续性跟踪,并对高校运行过程中存在的异常和风险进行提前警示。这不仅减少了专家进校考察的时间和成本,还促进了评估过程的科学性。在评估结果反馈阶段,评估专家可以利用数智化手段对高校的发展趋势进行科学推测,以便更好地帮助高校绘制发展图景。预警功能和预测功能的有机结合,有助于高等教育评估主体从表象判断深入到系统推测和预判,提升高等教育决策的洞察力和前瞻性,进而推动高等教育与经济社会发展需求的无缝对接,从而真正实现合规律性与合目的性的统一。

(三)人机互动助推高等教育教学质量从“持续改进”上升为“提质增强”

为教学服务是高等教育评估的核心诉求。数智时代高等教育教学质量的改进将由“持续改进”上升为“提质增强”[30],关注的焦点是提升教学质量、增强竞争力,以加快教育强国建设。

未来的高等教育教学评估将以“发现教学新知识”为目的[31]。数据挖掘是发现知识的手段,数据挖掘的过程就是从海量数据中探寻有潜在价值的新知识的过程。在大数据的驱动下,高等教育评估者在与机器智能的交流过程中推动了知识的不断扩展、共享和创新。可以说,面向知识的评估不仅为高校和教师及时改进教学提供了内在动力,更为高等教育教学质量持续提升提供了有效路径。

面向知识评估的可能性和有效性取决于信息反馈的及时性。信息的及时反馈可以借助有效的虚拟现实可视化技术来实现。虚拟现实可视化技术旨在利用计算机自动化分析能力建立一种符合人的认知规律的心理映像,辅助人们更加系统和高效地洞悉数据背后的规律[32]。视觉系统是人类获取信息的主要渠道,超过80%的信息都需要通过视觉来获取[33]。因此,当可视化技术将大规模、高维度、多来源、动态演化的高等教育评估数据以图形展现出来时,评估者往往能够直观、快速、精准地洞悉数据中隐含的规律知识和价值,以达到“深入浅出”的评估效果。

信息的及时反馈增强了评估主体与智能设备的虚拟互动,大幅缩短了评估结果的反馈周期,加速了评估信息的整合迭代优化,有助于高等教育教学质量的系统提升。在传统教育评估中,为充分发挥评估结果的作用,需要在公布评估结果之前采用人工处理的方式对评估结果的可信度和有效性进行分析和检验,这一过程无疑延长了评估结果的反馈周期。如果评估结果的反馈周期过长,一方面会造成“近期误差”,另一方面会削弱教育评估的鉴定、导向、诊断、激励和监督作用,使评估实践流于形式,不利于高等教育教学活动的持续推进和改进。借助虚拟现实可视化技术,评估反馈能贯穿高等教育教学活动的始终,评估者通过交互式可视化界面可以无间断地掌握教育全过程,并通过人的感知认知能力与智能系统分析计算能力的交互融合[34],达到评估结果的直观反馈、及时反馈、深度反馈和精准反馈。基于虚拟现实可视化技术的交互式展示和高密度信息动态展示功能,评估者不仅能获得教学活动的整体情况,还能对不同教师的教学状态实时跟踪,为教师构建具有个人特色的教学知识体系提供保障,实现细节与整体的同步认知,推动高等教育教学质量的系统化提升。

及时反馈过程中还会不断生成新的数据,且随着数据的迭代优化,教学管理者对教学状态的认知逐渐清晰。教学管理者可以围绕需要改进的教学“问题清单”,凭借数智技术将改进问题系统化为科学问题,进而提出“一对一”最优化解决方案,以促进高校合理定位、分类发展、相互协调、有序竞争,提升高校培养人才、服务社会的核心竞争力,形成“以评促强”新局面。

四、新型高等教育评估体系的建构

深化新时期高等教育评价改革,需要重构高等教育评估体系。建构新型高等教育评估体系应以“瞄准突出问题、遵循教育规律、顺应发展趋势、回应时代需求”为主线,秉持“以评促强、争创一流”的发展理念,探索“平台化”协同慧治的治理模式,创造“教育评估智能体”的超级生态,在评估者与技术之间建立起合乎数字与智能生态伦理准则的良性秩序,不断激发高等教育评估的牵引力,统筹推动高等教育领域综合改革,为建设教育强国开辟新赛道、塑造新动能。

(一)发展理念:秉持“以评促强、争创一流”发展理念,为建设教育强国提供强大动能

习近平总书记指出,教育强国建设,龙头是高等教育。高等教育作为教育、科技、人才“三位一体”的最佳融合点,肩负着服务国家战略、满足国家重大需求,全面提高人才培养质量、引领社会文明进步的责任和使命[35]。发挥好高等教育的龙头作用,要以高等教育评价改革为牵引,坚持用“以评促强、争创一流”的发展理念提升高等教育评估的科学性、专业性、客观性,为建设教育强国提供强大动能。

首先,应回归高等教育评估本真,推进落实立德树人根本任务。传统的高等教育评估过于专注教育主体的功利性需要,对育人的本体价值重视不够。“唯分数”“唯论文”的评估结果具有一定的片面性,忽视了高等教育作为实践活动的复杂性。因此,高等教育评估应从纯粹的学术标准走向立德树人的育人标准,从学术维度回归到人的维度。高等教育的根本任务是立德树人,这里的“人”是指马克思所说的“全面发展的人”。影响学生全面发展的因素包括个人特征、院校环境、知识技能发展情况、个人社会化程度等[36]。传统的高等教育评估受限于数智技术发展水平,无法对动态变化的质性数据或隐蔽性数据进行大规模采集[37]。在数智技术驱动下,高等教育评估有望实现全方位、全过程、全动态的立体化数据采集,可有效解决传统高等教育评估中信息量小、失真和结构缺失等问题[10],有助于对评估对象进行全面价值观照。

其次,需凝聚全链路数字化共识,推动多元评估主体联动协作。被喻为“21世纪的石油”的数据为高等教育评估转型升级提供了新“燃料”,而信息化建设则成为提升评估效果的核心动能。数智技术更是打通了高等教育活动各个环节之间的壁垒,实现了全链路数字化,简化了高等教育活动中间信息沟通、流程,节省了传递时间,增强了评估者之间、评估者与评估对象之间的协同效率。同时,数智技术也为高等教育评估活动的参与者搭建了“沉浸式”的评估场景:通过全链路数据的沉淀,高等教育管理者能够及时发现问题,洞察教育变革未来趋势。因此,数智时代的高等教育评估迫切需要达成数字化共识,须打通评估数据全链路,持续拓展高等教育评估的数智化深度和广度,推动数智技术与高等教育评估全系统深度融合,探索运用虚拟现实、数字孪生等技术和资源创设评估场域,在虚拟与现实交互空间中产生提升高等教育评估效果的数智化驱动力。

再次,要坚守科学导向的底线价值,增强高等教育评估牵引力。传统高等教育评估的各环节均依赖于相关理论体系或评估主体的知识经验,容易导致评估结果存在“路径依赖”和“个人依赖”[38]。数智技术催生了“数据模型+人工智能”驱动的高等教育评估范式,这意味着高等教育评估不再受先验假设的限制,也不局限于因果关系探究,而是借助算法算力对“数据洪流”进行分析,从而揭示高等教育数据背后隐含的关联性和规律性[39],破解了“经验主义”“机械方法”“单一数据”的桎梏。这里的规律性,不仅要体现教育发展规律,还要符合经济社会发展规律,也就是说,要做到合规律性与合目的性的统一。因此,数智技术赋能高等教育评估,是为了更好地挖掘教育价值、实现教育价值、促进教育价值共享,充分发挥高等教育在教育强国建设新征程中的龙头作用。

(二)治理模式:探索“平台化”协同慧治,为建设教育强国提供组织保障

教育评估是教育治理的重要手段。相对于传统评估,数智时代的高等教育评估在内涵、功能等方面发生了较大变化,因而高等教育治理模式也将发生相应变化。数智技术为未来高等教育评估发展提供了高可用性、高可靠性的技术底座。随着物联网、云计算等新型数字基础设施进入快速“安装”期,高等教育评估主体与高等教育评估范围将会发生变化。一方面,评估主体的扩充将牵动权力结构从传统的科层式走向扁平化,“权力图谱”呈现出平台化、网络化、去中心化的特征。另一方面,数智技术对高等教育评估时空的重构,必然导致高等教育评估范围的拓展,范围越广,高等教育评估参与者之间的沟通互动就越多,高等教育评估也变得更具“公共性”。由此可见,数智技术赋能高等教育治理模式变革,为政府、大学、市场、社会组织等多元评估主体协同合作提供了全新引擎,促使政府宏观管理能力、学校办学自主权和社会参与度均得到提高,确保了高等教育领域公共利益最大化。

首先,需构建平台化组织形式的评估主体,彰显高等教育评估服务导向。传统的高等教育评估积极倡导评估主体的多元参与,但评估主体的结构仍具有科层制的属性。在数智时代,基于数字化枢纽平台,评估主体的纵向层级结构被压缩为纵向联通、横向联动的平台化结构,这就有效解决了各部门之间存在的数据孤岛、协作壁垒、系统割裂等问题[40]。平台化组织呈现出“分布式”“自适应性”“有序化”的特点。在平台化组织中,各评估主体都将是一个独立的网络节点,通过数字平台将自身的职责、义务、需求转化为代码形式的“智能合约”,以形成大规模的社会化协同。在这样的背景下,作为高等教育评估组织者的政府部门将部分权力让渡给社会组织,给予评估实施者“自我增权”,确保了高等教育管理组织的运转更加协调、有序和高效,使得高等教育评估在弱化行政色彩的同时强化了服务功能。

其次,应激发评估主体多维潜能,提升高等教育治理效能。数智时代信息呈现增速越来越快、体量越来越大、结构越来越复杂的特点,使得高等教育评估主体的认知能力难以驾驭信息的不断变化。当前,数智技术的涌现和广泛应用为高等教育评估主体认知方式的改变带来了契机。借助数智技术,评估主体不再需要对评估对象的所有信息进行记忆和存储,也不需要依赖个人经验挖掘和判断评估对象行为背后的模式、规则,而是需要掌握数智技术的使用方法来帮助自己突破认知极限、驾驭复杂评估情景、加速知识积累、提高思维效率,从而高效地处理高等教育评估事务、增强高等教育治理效能。

再次,须提升评估主体智能素养,走好高等教育数字治理之路。目前而言,我国高等教育评估主体对数智理念的理解还不够全面,对自身应具备哪些数智技术能力的认识还不够清晰,对数智技术本身产生的预期效果缺乏系统考量,在基于算法技术进行高等教育资源整合和管理决策方面的能力有待提升。这些能力缺陷会加剧数智技术对高等教育评估主体的“控制”或“排挤”。如果评估主体的专业水平偏低,评估决策权会逐渐向数智技术倾斜,最终导致人与智能机器“主辅关系”的错位,阻碍评估主体与数智技术的互嵌和融合。高等教育评估主体缺乏智能素养,关键在于数字化评估人才的培养机制不够健全。从供给端看,“目前国内设置教育评估学科或教育测量与评估学科的高等学校数量屈指可数”[29],无法满足高等教育评估未来发展的需要。从需求端看,大数据人才的学历层次可划分为硕士及以上、本科、专科、专科以下4个大类,其中本科学历占比达到65.45%,而硕士及以上学历占比仅为19.33%[41]。高等教育评估领域专业人才稀缺,不仅容易造成评估资源的浪费,而且容易导致治理本身的低效和无序。为此,要加大高等教育数字化评估人才队伍建设,建立支撑高等教育评估事业和学科发展的人才梯队和创新团队,以评估主体智能素养支撑数字化治理能力,最大限度释放数字在高等教育治理中的效能,加快推进高等教育治理现代化。

(三)超级生态:创造“教育评估智能体”,为建设教育强国提供技术支撑

超级生态是一种不同于自然生态的数智生态系统,不仅包含了人类主体,也包含了可以参与行动的智能机器,每一个行动元都将在数字网络中留下大量数据,从而形成海量级别的“智能关联”。数智时代我们将要面对的实际情况是,高等教育评估者被整合到数字生态下的物体系中,成为一个被高度编码和数字描绘的“行动元”。评估者通过数字化的中介,与智能机器和其他评估参与者进行交流、沟通、传递、互动。可以看出,高等教育评估者和人工智能的关系既不是单纯的竞争、替代关系,也不是纯粹的无关论。因此,我们不能从抽象和孤立的方式来看待人工智能和评估主体的关系。在数智生态下,评估主体将与人工智能形成以数据交换和智能运算为基础的“教育评估智能体”。这一全新的智能评估系统将为重塑中国高等教育评估体系进而加快推进教育评价改革提供新思路、新支撑。

教育评估智能体是在人工智能、虚拟现实、大数据、云计算等数智技术驱动下,由同行专家、教育管理者、教师、学生等多元化利益实体与智能机器相互结合构成的一个立体感知、全域协同、开放共享的智能评估系统。其可以通过与高等教育质量、学科、资源、环境等多维度信息的双向交互,实时评估高等教育客观状态和变化趋势;并结合其内置多领域知识和历史经验,经过持续在线的自我学习和迭代进化,为高等教育“提质增强”生成科学、可靠、客观、适用的评估决策建议,如图2所示。

教育评估智能体的构建应以智能平台为支撑,以数据安全为保障,以“人主机辅”为根本。首先,应尽快创建高等教育“智慧评估”平台。智慧评估平台在信息聚合、数据共建、资源共享等方面具有独特优势,是满足高等教育评估者与人工智能实时互动、沟通、决策一体化需求的重要基础设施。传统高等教育评估都是先从一个“点”出发,然后逐渐向“线或链”拓展。而高等教育管理者需要的是一个全局优化评估方案,数据的碎片化会导致“数据孤岛”,使得评估主体无法获得统一的业务视图。基于智慧评估平台,评估主体和人工智能之间可以通过语言、信号、行动等方式进行有效的信息交流和协调,使人工智能根据“人”的意愿和选择进行决策。这就有效增强了高等教育数据集成一站式智能化,实现了数据在评估主体与人工智能之间的一致性、可用性和价值最大化。近年来,联合国教科文组织(UNESCO)颁布的《高等教育教学数字化转型研究报告》和经合组织(OECD)出台的《经合组织国家的教育数字化战略:探索数字技术教育政策》等教育数字化政策或报告,均注重数字平台建设在高等教育评估中的应用,强调高等教育服务的数字化转型和高等教育模式的变革创新,以支撑全球高等教育数字化战略的持续发展。与此同时,一些国家也积极推动教育平台建设,如德国搭建的国家教育数字化平台(Digitale Nationale Bildungs Platform)和我国建设的高等教育智慧教育平台。这些平台在推进国家高等教育全过程智能化治理中发挥了重要作用。

其次,须做到数据开放安全与数据安全防护并重。在数智生态系统中,评估主体与其他实体或虚体的互动不再以实体互动为基础,而是走向数据的交换。只有一切都变成了数据,在人工智能那里才能被理解[42]。数据资源本身具有开放共享的特殊属性[43]。然而,数据资源越是开放,隐含的风险因素就越多。高等教育数据与个人权力和公共利益密切相关,数据一旦泄露极易对学生、高校甚至国家带来严重的风险和威胁。这种泄露一般源于数据在原始输入与结果输出之间产生的“算法黑箱”[44]。因此,在数据交换的过程中,一方面要提出统一的数据规范和数据安全要求,保证高等教育评估数据的来源层、交换层、归集层、治理管理层和应用层均按照统一的标准进行数据格式的转换,形成统一高效、互联互通、安全可靠的数据资源体系。另一方面,要保持人工智能在搜集和交换数据时的稳定性,确保数据价值的充分释放,推动数据共享和数字安全的良性循环。

再次,教育评估智能体的构建须坚持“以人为本”的核心立场。虽然数智生态中包含多种行动元,但“人”仍然是高等教育评估的主体,人工智能扮演的只是“私人助理”(Agent)的角色。数智赋能的高等教育评估应遵循教育规律,并立足于经济社会发展对高层次复合型人才培养的现实需求,坚持用“以人为本”的价值理念引领高等教育评估数智化发展,让人工智能通过机器学习、深度学习等方法不断提升自身的可信度、可控性、可解释性和伦理性,促进评估者和人工智能在万物互联的数智生态中不断地交互,使评估者和人工智能的智慧融合在一起,最终形成有效的联合决策。



大学教育科学



参考文献

[1] 刘晖,邱若宜.我国本科教学评估中“质量观”的变革与启示[J].高教探索,2019(6):5-10. 

[2] 中国经济网.中共中央关于教育体制改革的决定[EB/OL].(1985-05-27)[2024-02-13].

http://www.ce.cn/xwzx/gnsz/szyw/200706/14/t20070614_11750610.shtml. 

[3] 国务院.国务院批转教育部2003—2007年教育振兴行动计划的通知[Z].国发〔2004〕5号. 

[4] 教育部.教育部关于普通高等学校本科教学评估工作的意见[Z].教高〔2011〕9号. 

[5] 王秉.何为数智:数智概念的多重含义研究[J].情报杂志, 2023(7):71-76. 

[6] 钟秉林,南晓鹏.后疫情时代我国高等教育发展的宏观思考[J].教育研究,2021(5):108-116. 

[7] 中国政府网.中共中央国务院印发《深化新时代教育评价改革总体方案》[EB/OL].(2020-10-13)[2023-08-13]. https://www.gov.cn/gongbao/c ontent/2020/ content_5554488.html. 

[8] 教育部.关于印发《关于深化新时代高等学校评估改革方案》的通知[Z].教督〔2023〕2号. 

[9] 鹿星南,高雪薇.人工智能赋能教育评价改革:发展态势、风险检视与消解对策[J].中国教育学刊,2023(2):48-54. 

[10] 刘邦奇,袁婷婷,纪玉超,等.智能技术赋能教育评价:内涵、 总体框架与实践路径[J].中国电化教育,2021(8):16-24.

[11] 杨现民,顾佳妮,邢蓓蓓.“互联网+ ”时代数据驱动的教育评价体系构架与实践进展[J].浙江师范大学学报(社会科学版),2019(4):16-26. 

[12] 王战军,常琅,蔺跟荣.“双一流”建设成效评价与动态监测[J].学位与研究生教育,2022(11):47-54. 

[13] 国家教育委员会.普通高等学校教育评估暂行规定[Z].国家教育委员会令第14号. 

[14] 教育部办公厅.关于印发《普通高等学校本科教学工作水平评估方案(试行)》的通知[Z].教高厅〔2004〕21号;教育部.关于印发《普通高等学校本科教学工作水平评估专家组工作规范(试行)》的通知[Z].教高评厅〔2007〕1号.

[15] 刘益东.我国高等教育评估30年的发展与变迁[J].大学(研究版),2016(2):37-45. 

[16] 刘振天.从水平评估到审核评估:我国高校教学评估理论认知及实践探索[J].中国大学教学,2018(8):4-11,25. 

[17] 教育部.关于普通高等学校本科教学评估工作的意见[Z].教高〔2011〕9号;教育部.关于印发《普通高等学校本科教育教学审核评估实施方案(2021—2025年)》的通知[Z].教督〔2021〕1号.

[18] 王战军,乔刚,李芬.高等教育质量保障新类型:监测评估[J].高等教育研究,2015(4):39-42. 

[19] 王战军,乔伟峰,李江波.数据密集型评估:高等教育监测评估的内涵、方法与展望[J].教育研究,2015(6):29-37. 

[20] 中国政府网.国家中长期教育改革 和发展规划纲要(2010-2020年)[EB/OL]. (2010-07-29)[2024-02-13]. https://www.gov.cn/jrzg/2010-07/29/content_1667143.htm. 

[21] 袁利平,林琳.高等教育数字治理:内在机理、逻辑构架与实现路径[J].江淮论坛,2022(4):183-192. 

[22] 王战军.学位与研究生教育评估技术与实践[M].北京:高等教育出版社,2000. 

[23] 教育部.深入学习贯彻党的二十大精神加快推进教育评价改革落实落地[EB/OL].(2022-11-18)[2023-08-20].http://www.moe.gov.cn/

jyb_zzjg/huodong/202211/t20221118_995844.html

[24] 马克思,恩格斯.马克思恩格斯选集:第1卷[M].中共中央马克思恩格斯列宁斯大林著作编译局,编译.北京:人民出版社,2012:140. 

[25] 刘云生.教育评价研究:第1期[M].北京:社会科学文献出版社,2023:18. 

[26] 周文辉,赵金敏.中国研究生教育外部评估体系:政策检视、问题剖析与完善路径[J].大学教育科学,2022(6):52-61. 

[27] 刘尧.论教育评价的科学性与科学化问题[J].教育研究,2001(6):22-26. 

[28] 杨小芳,贺武华.新管理主义对公共教育改革的影响及其反思[J].教育发展研究,2013(10):73-77. 

[29] 石中英.回归教育本体:当前我国教育评价体系改革刍议[J].教育研究,2020(9):4-15. 

[30] 乔刚,李芬.监测评估:高等教育评估的新理念[J].高教探索,2016(11):16-20. 

[31] 王战军,葛明星,张微.面向知识的教师教学监测评估[J].清华大学教育研究,2022(6):65-71. 

[32] 任磊,杜一,马帅,等.大数据可视分析综述[J].软件学报,2014(9):1909-1936. 

[33] Card SK,Mackinlay JD,Shneiderman B.Readings in Information Visualization:Using Vision to Think [M].San Francisco:Morgan Kaufmann Publishers,1999:712. 

[34] 余胜泉,王琦.“AI+教师”的协作路径发展分析[J].电化教育研究,2019(4):14-22,29. 

[35] 瞿振元.发挥好高等教育在建设教育强国中的龙头作用[J].中国高等教育,2023(12):1. 

[36] 沈文钦.博士培养质量评价概念、方法与视角[J].北京大学教育评论,2009(2):47-59,189. 

[37] 孙田琳子,胡纵宇.智能技术赋能职业教育增值性评价的逻辑与路向[J].职业技术教育,2022(28):50-55. 

[38] 刘涛雄,尹德才.大数据时代与社会科学研究范式变革[J].理论探索,2017(6):27-32. 

[39] 朱德全,吴虑.大数据时代教育评价专业化何以可能:第四范式视角[J].现代远程教育研究,2019(6):14-21. 

[40] 袁利平,林琳.高等教育技术治理:何以可能与何以可为[J].江苏高教,2022(7):1-11. 

[41] 中华人民共和国人力资源和社会保障部.新职业——大数据工程技术人员就业景气现状分析报告[EB/OL]. (2020-04-30)[2023-12-07]. http://www.mohrss.gov.cn/SYrlzyhshbzb/dongtaixinwen/buneiyaowen/202004/t20200430_367120.html. 

[42] 蓝江.从信息到数字生态:智能算法下生命形式的嬗变[J].国外社会科学前沿,2022(9):3-15. 

[43] 付宏燕.公共资源交易数据交换共享的设计与实现[J].计算机时代,2022(11):92-95,100. 

[44] 谭维智.人工智能教育应用的算法风险[J].开放教育研究,2019(6):20-30.


责任编辑 | 陈剑光

推文编辑 | 张   玲


● 扫码关注我们

CSSCI来源期刊

全国中文核心期刊

AMI综合评价(A刊)核心期刊

人大复印资料重要转载来源期刊

点个在看分享吧

高等教育评论
推送《高等教育评论》(中南财经政法大学高教中心主办、CSSCI2021-2022、2023-2024来源集刊)和友刊研究成果,建高教研究共同体(官网:http://gjpl.cbpt.cnki.net ,稿箱 gdjypl@126.com)
 最新文章