黄巨臣、韦忠霖|“指标”：理解中国大学学术评价的一种视角

文摘 2024-09-18 18:20 上海

作者简介｜PROFILE

黄巨臣，兰州大学高等教育研究院副教授。

韦忠霖，兰州大学高等教育研究院科研助理。

摘要：“指标”是一种兼有概念与政策工具意涵的手段、方法和机制，也是理解中国大学学术评价及其指标体系的一个关键视角。指标在中国大学学术评价中的应用与发展，有其独特的历史性演进过程与制度性形成条件。按照评价主体与被评价客体关系及其意图指向不同，可将大学学术评价指标分为政府主导、市场主导与大学主导等类型。通过对指标的生成、执行、考核与结果应用等阶段的考察，呈现其运作过程机理。同时，大学学术评价指标体系具有重要贡献，却也存在主体参与、方法选用以及测量过程等方面的局限。基于上述认识，提出治理指标的若干建议以及探讨了从日常性考察走向形成可能的“指标治理理论”议题。

关键词：指标；大学学术；学术评价；指标治理

全文

一、问题的提出

进入21世纪以来，指标几乎出现在高等教育的各个领域，学术评价指标也获得了快速发展。一个普遍的趋势是，国家、社会以及大学在科学研究领域所欲达成的目标通常需要借助众多的指标来加以明确并展现其重要性和合理性，可计算、可量化、可比较、可操作的指标才能保证各方的要求被严格地执行落实。近年来，我国政府部门、企业以及越来越多的高校在普遍使用各类指标开展大学学术评价活动，以实现对参与学术活动的行为表现及其成果影响力进行评估评级和精准管理考核。

在当前有关大学学术评价实践中，“双一流”建设评价、学科评估、专业认证、研究成果评奖以及大学“校—院—系”三级机构的年度科研绩效考核等主要基于指标来进行。大学学术评价中的指标往往是由专家学者按照一定的方法和原则来进行标准化的开发、设计、测量、验证与应用，使之成为一套设计精密、系统完整、运行高效的标准体系，以衡量各种复杂学术活动过程及其结果的科学性、创新性和实效性。《辞海》从统计学的角度，将“指标”定义为反映事物或现象数量特征的概念和数值。但具体到学术指标，它不仅仅是一类关于大学学术评价的数据合集，它也是一种政府、市场乃至大学组织本身用于治理学术活动的技术性政策工具，构建了中国大学学术评价体系中的权威结构、等级关系与差序格局。对于大学学术评价构体系而言，指标代表了评价规则制定者和管理者的意志与意图，组织的运行架构、资源的分配流向乃至学术共同体的科研方式和伦理道德认知，很大程度上由指标所秉持的主导逻辑来决定。指标的功用已不再局限于对那些关于大学学术评价显性行为活动的考评，它已经超越了原初的数字考核和目标管理范围，具备了实际意义上的“指标治理”功能，进而发展成治理整个国家大学学术活动的机制。

国内外学术界围绕“评价指标”所开展的研究已取得较为丰硕的成果。其中，最常见的是关于政治、经济、社会类评价指标的研究，包括：政治评价指标的构建维度和要求、经济评价指标的应用及其影响因素、社会评价指标的功能及其效果等。虽然评价指标研究数量较多，涉及指标的构建、使用、改进等方面，但专门探讨大学学术评价指标的研究仍不多见，特别是缺乏关于中国大学学术评价指标的历史演进、类型划分、运作机理、贡献与局限等方面的系统研究。从2020年中共中央、国务院印发《深化新时代教育评价改革总体方案》到2022年习近平总书记在党的二十大报告中提出：“加快构建中国特色哲学社会科学学科体系、学术体系、话语体系”，均要求对现行高等教育评价机制进行反思、调整和优化，并构建中国本土的自主性知识体系，大学学术评价指标自然也在其中。

需要指出的是，大学学术评价指标从生成、分解、应用到影响，都明显迥异于经济、政治、社会等其他类型指标，有其自身独特的形成条件和运行机理，这也凸显了该议题研究的又一重要价值。可以认为，“指标”是一种特殊的概念性、政策性工具，以及思维和机制：1. 在整体乃至具体大学学术评价内容环节中，指标作为众多计量数字、数据的合集可以衡量个体、群体以及组织的学术科研活动情况，并进行反馈和改进；2. 指标使大学治理具有福柯所说的“治理态”（Gouvernementalité）意涵，即指标的作用已经全面渗透到大学场域学术共同体的价值观念和科研方式中，形成一种治理的概念思维；3. 指标也是一种制度化的评价机制，影响着大学组织、学者个体、学术部落、期刊杂志、评议机构的学术活动和与学术活动相关的行为与策略。在“指标时代”中，一位学者只要在某方面获得极高的得分或排名，便拥有了改变个体乃至所在组织身份、等级、资源的机会和能力。

概言之，指标本身就是一种复杂的学术现象和一类具有丰富内涵的工具、机制乃至思维，在其出现并全面进入学术评价领域后，更需要立足于“指标”本身来探究指标在中国大学学术评价活动中的历史演进、类型划分、运行机理、贡献与局限，以帮助人们系统了解学术评价指标的发展样态，并深入思考中国大学学术评价未来发展的方向。

二、中国大学学术评价指标的本土演进与形成条件

历史文化传统和国家管理体制调整与变迁影响了中国大学及其学术评价活动的逻辑，“指标”进入到大学学术评价领域，并逐步确立自身的重要地位和“合法”身份，有其历史性契机和制度性条件。

（一）中国大学学术评价指标的本土演进

事实上，从新中国成立开始，指标就被应用到大学学术评价领域之中。1949年新中国成立之初，为保证政权稳定以及社会建设需要，国家对高等教育进行严格计划管控，大学学术评价事务高度行政化。在随后出台的相关学术评价政策文件中，对大学科研工作者及其成果的评价指标相对单一，且主要以主观的定性评价为主。例如，《高等学校科学研究奖励暂行办法》（1956）指出，不论成果属于集体或个人均可参加评选，经录选后给予奖励；评选以“创造性”和“科学性”为指标依据对成果进行考察。此处的两个指标并未具体化，即缺少明确的内涵和指向，评选中主要根据评价者的认知和经验来做出理解判断。1966年至1976年“文革”期间，高等教育事业发展遭到重创，大学各类科研活动基本陷入停滞。前期建立的大学学术评价制度和指标依据已丧失基本的评判功能，甚至一些政治性指标取而代之并成为推进“政治运动”的工具。直至1977年，大学科学研究活动的学术价值及地位再次受到重视，与此相对应，一系列用以考核评价大学学术活动的规章制度也陆续建立。

1977年9月，中共中央发布《关于召开全国科学大会的通知》，要求恢复技术职称，建立考核制度，保证科学研究人员每周至少必须有六分之五的业务工作时间，不难发现，具有明确数学统计标准的大学学术量化考核指标开始出现。到1987年8月，国家教委出台《关于评选高等学校重点学科的暂行规定》，首次明确了将“科研成果数量”“论文专著数量以及级别”“科研奖励数量和等级”“科研经费数额”等指标作为遴选建设一批重点学科的标准，以此文件为标志，具有量化特征指标的使用及其结果获得了国家的正式承认，其与高等教育的竞争性资源分配联系在一起，使得指标的“合法性”身份和工具性功能进一步彰显。

20世纪80年代末，南京大学率先将SCI（Science Citation Index）论文收录数、被引用次数等作为判断院系、教师、学生学术质量水平高低的核心指标，使得精确评价大学学术科研活动成为现实，被国内学界称为“开启了中国科研评价的定量时代”，引来了其他高校纷纷效仿。1994年3月，国家教委发布《关于加强和改进高等学校人文社会科学研究工作的若干意见》，规定在科研成果的评价问题上，要坚持科学性评价的标准，正式宣告我国大学学术评价指标体系进入科研计量范式阶段。

进入21世纪以来，中国大学学术评价出现了更精准的“分类评价”和纳入“用户、市场和专家等相关第三方参与”趋势，很大程度上促进了各类指标的快速发展，也拓展了评价主体。2003年5月，科技部、教育部等联合印发《关于改进科学技术评价工作的决定》，专门对大学技术活动等学术评价改革做出规定：“要按照‘目标导向、分类实施、客观公正、注重实效’的要求”，“确定不同的评价目标、内容和标准，采用不同的评价方法和指标”，并“建立与国际接轨的评价制度”，试图建立一套与国际衔接的基于不同需求的多元化分类评价指标体系。同时，国外那些追求效率、注重量化、强调排名的指标理念、工具和方法也纷纷涌入，具有实证科学性质的量化指标成为强有力的管理工具介入到大学学术评价活动的各个方面。直到今天，大学学术评价已经无法回避指标所带来的信息、技术、知识乃至权力等的影响。

（二）中国大学学术评价指标的形成条件

长期以来，中国大学学术评价指标的形成深受以下几个条件的影响和形塑。

1. 意义建构：中国大学学术评价指标生成的理论条件

20世纪初，经典测量理论、评估理论等陆续传入中国，表明科学主义范式开始进入大学学术评价之中。经典测量理论强调实证性验证，多强调以公理化形式或量表形式对考察对象进行测量。而评估理论虽然也强调基于数据的可测量性，但在经历了“测量—描述—判断”这三个阶段后，已经迈入第四代评估，即基于响应式建构主义的评估。它的假设前提是，事实并非客观显然地摆在那里，而是依据人为的建构而存在的，即认为指标是一种社会性的建构产物。从现实影响的角度看，这两种理论对中国大学评价的发展作出了重要贡献。经典测量理论的科学主义范式和第四代评估理论的建构主义范式通过阐释理念、明晰内涵、解释变量和说明结果的方式，将评价目标、任务和内容分解为具体的、可操作的指标，以实现对大学各类学术科研活动的统计与测量，并在此过程中共同建构和赋予了指标存在价值及其功能发挥的重要意义。

具体而言，这种“意义建构”的内容和作用主要是：第一，通过阐明经典测量理论和评估理论所秉持的理念，明确大学学术评价指标设计所要坚守的原则；第二，对含义模糊的指标进行清晰的概念界定，使其测量内容更好地与大学实际学术活动过程相匹配；第三，基于前期评价，对反馈结果进行多维度解读和使用，实现对模糊性评价的超越和对科学性评价的回归。因此，概言之，上述两种重要理论“意义建构”的意义是对科学主义范式和现代多元利益评价主体主观偏好的尝试性统合，以帮助生成一个乃至一系列标准规范的理想化大学学术评价指标体系。

2. 统计测量：中国大学学术评价指标生成的技术条件

学术评价逐渐“指标化”既源于国家和高校对学术科研管理的简约化需求，也与技术的发展及其广泛应用于评价管理活动密切相关。知识性技术是评价的前提，而评价的成功与否很大程度上取决于对技术的了解和应用程度。基于统计学方法所开发设计的技术工具和手段，具有明显的测量属性，特别是期刊引证报告（JCR）、基本科学指标数据库（ESI）、InCites等新测量工具的出现，可以帮助人们更好地根据关键数据和指数来量化和考核大学学术活动的总体状态与具体对象等不同方面状况。这与指标自身追求的规范化、标准化和体系化目标高度契合。更重要的是，在自然科学与人文社会科学领域相互交织融合的时代，统计技术被认为是“科学的方法能够提供关于事物真实情况的信息”，即一种“事实的强制性”，对测量的内容、标准、数量、质量等进行客观状态与结果的呈现，在很大程度上改变了中国早期大学学术评价的主观性、模糊性和随意性，加速了可量化、可比较、可考核指标的形成。借助统计技术，指标扩展了专项信息、专业判断和专门知识在大学学术评价中的影响范围与能力。凯伦·杨等算法专家认为，统计技术同样是一种基于规则系统的数字算法，相较于人类决策依据的多变性，它能够精确解释每一个变量是如何进行设定的，以及客观结论得出的过程。具体而言，统计技术的优势在于简化复杂的现实，其对指标的塑造是全面且多维的。

3. 绩效考核：中国大学学术评价指标生成的需求条件

传统的大学是一个松散结合的组织机构，它们不关心投入，也不追求效率，更关注学术性探索过程以及成果的同行认可。但当代的大学已经发生了很大改变，人们日益认为高等学校是一个投资巨大且关联到社会创新动力与活力的公共机构，它必须接受政府以及公众的问责，以令人信服的证据对社会有所交代。概言之，大学学术评价指标的盛行源于绩效考核的需要。更具体而言，可分为以下两个方面：一方面，随着新公共管理运动“绩效”理念进入政府行政领域再渗透到大学学术领域，无论是作为举办者和监管者的政府抑或是作为办学者的大学，都找到了那些用以测量评估大学科研情况好坏或成效高低指标的“合理性”依据，为了保证评估的透明、客观、可操作，评估需要量化，必须建立绩效指标，这也促使大学学术评价的绩效指标日益形成一个规范化和制度化的框架体系。另一方面，大学是一种资源消耗型组织，特别是近代大学学生的扩招、教职人员的增加以及组织架构的扩张都要求政府投入大量的人、财、物等资源。而在资源总量有限的情况下，政府、社会民众乃至市场企业都不希望大学出现资源浪费、无效投入的情况，对其进行绩效指标的考核也就显得尤为必要，以便依据指标评价结果来进行资源的优化配置。

三、中国大学学术评价指标的类型与特征

美国学者伯顿·R.克拉克提出了高等教育的“三角协调模型”，即认为高等教育的发展受到国家/政府、市场/企业和学术/大学三者力量的主导和影响。提出该模型的意义在于，它所界定的这三种主体力量不仅可以用来描述高等教育系统中的利益竞争与博弈行为，也可为划分大学学术评价指标主导主体及其类型提供借鉴。结合“三角协调模型”思想，从类型学角度出发，按照评价主体与被评价客体关系及其意图指向来看，可将中国大学学术评价指标类型划为政府主导式、市场主导式和大学主导式三种理想模式。事实上，我国还存在众多学者个人们自行设计构建的大学学术评价指标体系，但由于没有明确的目标指向，也未在实践应用上产生足够影响，本文不做进一步探讨。

（一）政府主导式学术指标：关注战略方向的引导

集中掌控着社会发展各类关键权力的政府，是当代最成功也是最具权威性的机构。政府与大学的关系以及政府所固有的公共职能促使其去履行监管使命。政府以指标来考察和评价大学科研工作者及其成果，其背后蕴含着这样的逻辑：即从事科学研究的个体、群体乃至专门机构均不同程度地被理想化的内部共同性价值、认同和规范所约束和形塑，如此高度专业化和同质化的学术共同体需要适度地向外界开放，政府作为外部的支持性力量有必要通过一系列的学术考评指标来实现其对大学科研活动的适当管控和战略方向上的引导。政府能够在同一时段内对各个大学开展大规模的指标考评，不仅是依靠现代先进的信息化技术，更是得益于自上而下的科层化权力运作。

在中国，身处大学场域中的科研工作者们能够较为清晰地感受到，政府对大学科研活动的学术评价并非孤立进行，而是试图将相同领域乃至不同领域之间的内容联系起来，并赋予学者职业生活更多的政治性意涵与偏好。从福柯的权力观层面意义来看，政府对大学学术评价的指标化实质上是一种权力对知识控制的制度化过程。这是一个历史性和阶段性相互交织的过程，指标的具体设计和应用既取决于科学研究活动内在的属性，也深受政府宏观性政治战略意图的影响。例如，教育部从2002年开展至今的学科评估，基本上是通过设置“人才培养”“科学研究”“学术队伍”“社会服务与学术声誉”等指标来衡量不同大学的学术水平。其中，2022年第五轮学科评估已经基于一级学科开发出99套指标体系，并根据不同学科特色分别设置17—21个三级指标（特别是科研评价指标主要是围绕国家战略急需的关键领域来设计），多维度地进行任务目标、执行过程、结果成效的评价并得出排名和评级结果，借此对参与评估的大学施加管理权力的压力与激励，通过任务目标的下达、执行过程的约束和最终结果的管控以实现引导大学学术科研活动方向的治理意图。

（二）市场主导式学术指标：注重满足用户的需求

市场主导的学术评价指标可以看作是基于第三方立场来评估大学科研状况和为满足用户需求而兴起的。作为世界上首个具备现代市场商业化价值的大学学术评价榜单的发布者，1983年开始发布大学排名的《美国新闻与世界报道》（U.S. News & World Report）几乎凭借一己之力带动了欧美其他国家和中国在更广泛层面开展基于满足用户需求的市场性大学学术评价活动。人们曾经一度称赞与市场开展深入合作的“现代综合性大学是一种全新事物”，但在今天的中国，有些人认为它们“更大程度上是科学推动的研究公司”。可能这样的判断缺少足够的说服力，然而需要承认的是，在大学卷入市场程度日益加深的时代背景下，市场主导的大学学术评价指标体系，不仅仅局限在为家长和学生选择学校提供决策参考依据，也对大学这一潜在用户产生影响。

当前，在中国，由市场主导对大学科研活动进行学术评价的榜单主要有：由上海软科教育信息咨询有限公司发布的“软科中国大学排名”、由武书连团队及其所在机构发布的“中国大学排行榜”、由艾瑞深校友会网发布的“校友会中国大学排名”等。上述大学排行榜的发布机构，既有营利性的，也有非营利性的。尽管它们都宣称并极力证明自身的独立性、公益性和公正性，但从组织机构的建立初衷、运作方式以及核心指标设置，都能发现背后资本运作的身影。其中，代表科研的“学术能力”指标设定相对稳定，但体现市场要求的“雇主评价”指标赋分权重却呈逐年上升趋势。这从侧面反映出市场的资本逻辑影响着大学学术评价指标的生产运作过程。也正因如此，我们倾向于将这些同时兼具公益性和商业性特征的大学排行榜及其发布机构，归入到市场的范畴。事实上，市场各类非营利性或营利性机构主导的大学排行榜已经渗透到了大学内部，大学的科学研究方向、重点、内容乃至资源分配均不同程度地受到左右。那些更容易量化和转化的成果，经常会优先得到市场企业的关注并获取远超其他领域的经费、场地、设备、人员等资源支持。所以，在现实中，这已成为能影响大学学术评价的内生性要素。

（三）大学主导式学术指标：强调行为活动的规范

如果说政府是运用显性的行政权力来对大学学术评价活动进行干预、控制和引导，那么大学更多的是借助自身隐性的学术性或自治性权力来维持组织的自主性。这也就使得以大学为代表的科研机构所构建的学术指标具有较高独立性，其初衷往往是对内部成员的学术科研活动及其行为进行规范，以服务于追求真理性的探索、创新和发现。再者，大学是社会中最大的知识生产和创新组织，在某种程度上，可以认为，大学中的科研工作者垄断了现代社会中最高度专业化的复杂性知识与技能。这一特质也决定了大学主导的学术评价指标更关心学术共同体内部成员的科研状态及其规范。我国大学早期的学术评价指标主要体现在考察“教师是否具备相应能力获得聘任、晋升或学术奖励”方面，把教师和其他研究者的学术水平、研究能力作为首要评价标准。随着大学科学研究和社会服务职能的不断强化，人们日益认同“我们应当鼓励大学在所有职能上都表现优秀，而不应仅限于第一职能和第二职能”的观点。

时至今日，大学对于外部社会环境的变迁和自身职能的理解，影响着所制定学术指标的呈现方式和规范程度。具体表现在，大学所实施的各类学术指标表现出了明显的变化，科学研究活动的社会化服务理念体现在各项具体指标体系中。例如，清华大学发布的“基于学术责任与成就的教师评价指标体系”（2019），以 “能力”“质量”“贡献”为核心指标开展评价，强调教师的学术道德责任与学术水平。而北京理工大学制定的《教师考核评价办法》（2022），既突出“学术水平与社会贡献”，也关注“论文著作”“发明专利”“科研项目”“课题经费”“荣誉称号”“学术诚信”等指标，要求广大教师坚守学术职业道德，并鼓励以高质量学术成果服务经济社会发展。这些指标都承载着不同大学对学术科研行为的规范要求。

四、中国大学学术评价指标的运作过程机理

客观科学的大学学术评价得以实现就是借助于指标，指标是一种重要的治理工具、策略和机制。大学日常学术评价中的指标运作过程及其表现机理构成学术评价活动治理的微观基础，从这一角度出发来观察和刻画，可以更好地理解中国大学学术发展的现实样态以及深化对指标治理的认识。

（一）指标生成：目标设定

目标设定是大学学术评价指标生成的首要环节和核心要素，它集中体现了主体对预期成果实现程度的判断和要求。不同指标制定主体的利益需求和偏好是存在差异的，这也决定了在大学学术评价指标制定生成中，政府、市场、高校等行动主体所遵循的逻辑及其依据也各有不同。政府作为公共权力和意志的代表，关注的是监管和服务职能的发挥，其对大学学术评价指标设计的原则和目标必然体现出明显的“战略”和“产出”导向；市场主体主要是从事经济性生产和交易活动，所制定的大学学术评价指标更多的是出于满足用户和使用者需求的目的，或多或少带有一定的经营和谋利取向；而大学自身所制定设计的学术评价指标，其目标既是为了规避学术共同体开展科学研究过程中可能出现的各种风险和伦理问题，也是为了能展示科研能力和优势，赢得政府和市场的认可，进而获取更多资源投入和支持。无论是哪一类利益相关主体，指标的生成都是为了实现各自特定的目标，而目标设定的过程中可能是单一主体自己制定并一以贯之推进，也可能是多主体协商而定后形成类似“委托—代理”的契约关系。在指标制定形成阶段，政府、市场、高校等主体往往会同时兼顾多重目标追求，基于对总目标的审慎考量和预期，按照重要性程度进行权衡排序，列出可能的最佳目标搭配组合，进而选取最优的目标设定方案，为评价大学学术活动提供明确指引。

（二）指标执行：分解实施

无论是哪一个主体制定的关于大学学术评价的指标体系，只有当其进入到大学内部并转化成为用以指导、激励或约束从事学术科研事业群体的工具和机制时，它们才具有现实意义，即便是大学自身制定的学术评价指标亦是如此。这一转化的过程本质上就是指标体系的分解实施过程。

通常的做法是，负责具体操作的执行者会根据现实状况以及未来预期做出适应性的调整和实施，将指标体系分解分类为兜底类指标与贡献类指标。兜底类指标主要用于评价所要求的日常性学术工作，多是完成最低任务目标；贡献类指标则关注如何在已有良好基础上，拔高原定指标的基础要求，积极开展创新性学术科研活动，突出所取得的成效。更具体而言，有以下两种转化途径和情况：一种是，政府和市场等外部主体制定指标的转化。政府凭借其权力和权威，自上而下进行传导，要求大学执行上级部门制定的指标方案并将其在具体实践中加以细化推行；市场主要借助新闻媒体等途径进行广泛宣传，形成大众舆论的导向力量和提高资本的关注，进而让大学内部知晓并接受所提出的指标，这是一种软性影响力扩散，是否接受以及接受的程度主要取决于大学的办学定位及其管理理念。另一种是，作为内部主体的大学所制定指标的转化。大学制定学术评价指标，多以举办动员宣讲会来要求各院系就具体实施达成共识，往往就此形成以指标管理为中心的执行模式。

（三）指标考核：检查验收

在中国，政府主导的指标体系，无疑是众多大学学术评价指标中最具权威及决定性意义的。因此，在这一阶段，大学更为关注回应政府的问责，需要变通性地将那些不容易测量和完成的指标限制在努力范围之外，最大限度地降低指标执行过程中可能出现的不确定性风险和意外，并对照高显示度指标来凸显成果和业绩，以展现强大的竞争性实力，确保完成上级政府要求的目标任务。但与此同时，大学学术声望和社会地位的提升又需要通过政府、大学自身之外的组织机构来认可和确立。这也就不难理解，为什么大学在应对检查验收时发展出了两种不同的策略：一方面，在面对政府时，主动接受中央教育行政部门、地方政府乃至其他带有官方性质组织的检查和评估，既提成就又讲问题，积极吸纳、反馈意见建议，形成下一阶段优化改进的依据，以回应质询和批评；另一方面，在面对社会、市场时，倾向于向外推出和展示所取得的重要成果，以增加关注度，提升办学声誉和影响力。由此，除了密切关注和回应政府要求与意见外，社会大众（包括新闻媒体）、市场企业等作为信息监督和评价大学学术科研成果用以服务和推进社会发展的主体，其需求、态度与反应，同样受到重视。换言之，大学需要同时接受来自政府的“垂直监督”和社会大众、市场企业的“水平监督”，选择何种应对方式主要取决于上述主体对大学所能产生的实际影响力。

（四）结果应用：激励奖惩

结果应用，即基于评价指标检查验收之后的激励奖惩环节，以引导、激励和改进大学学术活动。那些制定指标并开展考核监督的主体，能够在相当程度上影响大学学术评价考核的最终结果，这主要涉及被考核的指标及其相关群体与评价主体之间是否存在密切的利害关联。通常做法是按照最后的完成情况与预期以及指标所设定的标准、时间、任务量等进行考核后，得出一个客观性结果，进而根据所得结果，采用排名或分级的形式，对大学及其科研工作者进行不同强度和范围的奖惩。具体而言，奖励的内容大致包括宣传、表彰与示范，而惩罚的措施则有约谈、撤销称号、限制评优、一票否决等。由于惩罚具有强激励效果，不论是政府还是大学职能部门都会谨慎的设置分级分类的评判标准以及相应的差异化处理方案。在现实中，评价结果不会被全部应用到对大学的激励奖惩中，政府乃至大学经常会选择性使用，有时甚至只对管理者或科研工作者这些有限个体进行专门的奖惩，以起到示范或警示效果。也正因如此，社会大众、市场企业等主体即便对一些大学学术科研活动及其转化成效存有异议或意见，也难以形成有力的附加奖惩措施，只能通过舆论来推动这些意见进入政府或大学的关注议程，使之受到重视与采纳，并应用到奖惩之中。但不论是“正向的激励”还是“负面的惩戒”，都共同起到了改善大学学术评价治理的实质性效果。

五、中国大学学术评价指标的贡献与局限

在高等教育领域，指标或者说指标技术只是被人们视为一种用以评价大学各类复杂学术活动的手段和工具，可在现实中却释放出了强大力量，且这种力量表现为贡献与局限两方面。

（一）中国大学学术评价指标的贡献

中国大学学术评价指标的发展产生了积极的影响，其贡献主要包括：

1. 知识的生产与建构

指标是一种可量化、可通约的知识形式，能将复杂的社会现象转化为明确、客观、可比较的衡量标准，其功用反映出了内在的知识生产与建构逻辑。大学学术评价指标体系本身就涵盖了诸多的理论思想、统计方法、运算公式、测量指数等，可对评价对象进行全面、系统的监测、诊断与反馈，是一类基于众多专家学者的智识性意见和建议而构建出的复杂多样的精细化知识体系。在伯顿·克拉克看来，大学是一个“探究的场所”，居于“知识生产的中心地位”，学者们没有例外地寻求使他们的思维模式和大批知识滚动向前，对大学学术的评价必然涉及科研成果价值的判断以及在此过程中建立起的与知识生产的关联。当指标在大学学术评价中的影响力日趋获得利益相关主体和场域内学者认可的时候，它之于学术生活世界的意义及其知识价值便得以凸显，具有立足于理论与实践的双向知识探索特征，因而被赋予了知识生产与建构的内涵，亦有学者认为，对指标的关注推动了高等学校由相对自主的学术组织向受控性的生产型组织的转化。

2. 规范的确立与引导

指标的影响力优势在于，它们为众多组织提供相应的偏好意识和形态，借助“硬数据”来论证其“真理”。当从事专门职业性科研事业的个体、群体乃至学术部落的价值取向和目标追求与大学学术评价指标的要求与内容趋向一致时，就开始形成福柯所说的“规范之规范”（conduct of conduct），且在某种意义上，规范化力量是强求一律的。即通过强调学术共同体内部的基本价值一致性和行为的合规性，符号化或仪式化了那些能够对个体和组织机构产生影响的规范性力量。尤其是在社会结构变迁速度加快和学术部落边界趋向模糊的背景下，“学术部落”来自外部的影响和干预越来越多，使得学术系统内部的话语模式和范式标准受到了外部评价指标的冲击和约束。可以认为，指标作为一种规范得以在大学学术场域中确立，进而对科研从业者及其活动产生协调、引导和约束等作用。

3. 资源的计划与优配

当外在于学术共同体的政府或机构成为学术活动的组织者，特别是成为学术资源及利益的主要提供者和分配者时，学术评价也就从学术活动演变为参与分配学术资源和利益的权力行为。在大学学术评价指标化的过程中，不但各种各样具备科学主义性质特征的理论、工具与方法将被用来支持指标评判考核的合法性与合规性主张，而且精确化的测量指标能够通过获取大量具有多样性和价值性的数据来深度呈现和解析数值所隐含的信息与反馈，以及时回应管理者和使用者的动态需求，进而一定程度上实现对大学科研工作者在职务晋升、职称评定、荣誉归属等方面的集体性资源与机会的优先排序和优配，精准辅助绩效考核的方案决策与实施，因需制宜、因人施策，从设想变成现实常态，并促进有限学术资源合理化计划与配置，提升治理的成效。从更深层次意图的角度看，作为典型资源依赖型组织的大学愿意接受众多主体所制定指标的评价，其目的并不完全在于借此获得并占有更多的用以发展的资源，而是同时关注着甚至更希望通过指标评价能带来和扩大对资源进行计划、配置与控制的自主权，这对于那些想要早日跻身世界一流大学的高校来说具有特殊的重要意义。

（二）中国大学学术评价指标的局限

从学术发展角度看，中国大学学术评价指标有重要贡献，但也存在一些局限，主要包括：

1. 创建主体的“中心化”偏向

指标的生成并非纯技术过程，而是政治和社会过程，其选择机制很可能带有偏向性。就当前实际情况看，大学学术评价指标已经基本完成了从一类测量工具到特定主体用以影响大学学术活动的治理术的转变，这意味着它已经不是纯粹的统计手段而是一种带有主体价值偏好的策略和机制。虽然制定大学学术评价指标体系的主体囊括了政府、市场乃至大学自身，但不可否认的是现有高等教育管理制度下的政府占据着绝对的话语权，其他主体的价值诉求和偏好难以在主流评价指标中得以充分体现。加之，中国的大学对政府的天然依赖性强化了学术发展的体制化色彩，也促使其更倾向于遵照政府的意愿行动。从福柯权力观的角度考察，作为指标制定者、管理者和考核者的政府，在很多方面习惯于按照一种权力愿望将自身的构成规范强加于管理对象，把评价从一种需要专业知识与技能的实践行为转变为一种自动化的机械操作，实现基于单一权力中心对学术世界的可能性控制，而这往往容易导致大学学术活动的政治化和行政化。

2. 方法选用的“计量化”倾向

当前，大学学术评价指标体系拥有一套精确严密的计量方法以及技术，如抽样方法、资料收集方法、数字统计方法等。可见，作为推进大学学术评价活动走向科学化的一种努力，“计量化”的方法备受推崇。通常认为，指标的大规模应用以及被过度放大的工具性功能是科学技术方法高度现代化和精确化的社会后果。从科学技术发展史的角度看，指标在一定程度上可以被认为是自然科学的产物，而自然科学是获取真实可靠的科学知识的唯一途径。这在很大程度上决定了指标不可避免地带有科学主义性质的实证、计算以及量化属性和特征。当制定和使用一套大学学术评价指标体系时，人们习惯于关注它是否可以全面精确量化、是否可以将复杂内容极简化、是否运用了经典测评量表。若都不具备这些要素和标准，那么这一类的学术评价指标就被认定为是不科学的，因为所选用的不是能够满足上述要求和条件的计量方法。而在此过程中富有创造性的学术想象以及探索被不同程度地筛选量化成了一个个数值，只测量了可以测量的，而忽略了那些至关重要但不可测量的东西。

3. 测量过程的“简单化”指向

需要承认的是，将指标用以评价大学学术活动往往只能呈现“事情是什么”的样貌而无法了解“事情是如何进行的”以及在此基础上去探究和解释评价结果背后组织、群体、个人的复杂行为取向和价值系统，由此遮蔽了学术世界蕴含的丰富意义。美国理论物理学家马克·布坎南曾指出，要真正了解事物，人们必须要理解其背后的逻辑。事实上，大学场域中的学术共同体越来越意识到，采用数字指标来评判学术活动及其成果并据此来进行奖惩和资源分配是一种看起来很科学的粗陋方法。各种不同的领域之间实际上存在着很重要的区别。我们不应当在社会科学各领域中不经思考就轻易地接受那种被自然科学家视作是他们可以泰然受之的必然的趋势。指标的制定者和使用者常把评价过程和影响机制假设成简单的因果线性关系，而容易忽视统计背后的“人及其复杂性”问题，即大学科研工作者的多样复杂需求和科研活动过程中的诸多不确定性。大学学术评价指标测量的“简单化”指向致使科研工作者及其日常职业系统状态随之也发生了变化，容易出现尼尔·波斯曼所言的与学术意义上价值乃至实践相脱节的“学术漂移”后果。

六、建议与讨论

现有大学学术评价指标体系已超越了最初所具有的统计、比较和排序等传统功能，其实际运用与所产生的影响具有方法论上的重要价值，从更具体的管理成效和学术贡献评价上来看，它正影响和重塑大学学术评价的价值理念和行动方向。甚至可以认为，指标应被看作是中国大学学术评价活动实践过程中产生的一种可能的新理论，而非仅仅是一类可以被描述、解释的现象。

（一）从“指标”到“被指标治理”再到“治理指标”

“指标”本身就是一个值得人们去深入思考的议题。指标出现并被应用到大学学术评价领域时，不论是政府还是市场、社会大众抑或是大学组织，都相信具有科学主义性质的指标遵循着客观中立的立场，因为它突破了“科学范式下的社会科学局限”，其测量技术和工具能契合理性化的目标成果管理、任务过程控制以及效率提升需要，进而保证大学学术活动能反映并回应不同主体需求。时至今日，指标已发展成一整套严密计算安排的测量技术系统和制度机制，通过设计、实施、监督、考核、验收、评估和奖罚等一系列程序来实现对大学学术活动的技术化和标准化评价。即“指标治理”成为大学学术评价活动的一种常态化机制。然而，由此却也陷入了类似公共管理领域中出现的“从‘按指标治理’到‘被指标治理’的困境”，表现为指标深嵌于评价活动过程中所出现的创建主体“中心化”偏向、方法选用“计量化”倾向、测量过程“简单化”指向等局限，由此引发了新的治理难题。

因此，当前大学学术评价急需扭转这种“唯指标进行治理”的局面，从“被指标治理”走向“治理指标”。具体有以下几点建议：一是构建一种基于多方主体协同的评价模式。即大学必须通过开放的治理结构充分包容利益相关者，要协同整合政府、市场以及大学自身的学术评价指标体系。尤其是，应探索完善社会第三方监督评价机制，开展独立性、客观性、专业性的评估，以调动各类学术评价主体的参与积极性，丰富评价主体类型，创造良好的学术评价生态。二是采用基于学术共同体的同行评议制度。即使用定性与定量相结合的评价方法，充分发挥专家个人的学术专长，对同行学者及其成果影响力进行专业性判断，以鉴定学术水平的高低及其价值。事实上，带有主观色彩的同行评议不仅是科学功能的一个常规组成部分，而且是科学建制的基础原则，同样能增进评价的科学化程度，而这种基于同行认可的影响力评价亦是一种综合性的社会效益评价，重视包括案例在内的多样化证据而非简单的量化指标。三是赋予指标以价值内涵。要赋予指标丰富的道德认知、个性化需求等价值内涵，以使得大学学术评价指标不仅仅满足于将事物状态用数据形式呈现出来，而是基于数据提出有生命、有价值的解释，帮助了解和理解人类所建构的学术意义世界。

（二）从日常性考察走向可能的“指标治理理论”探讨

社会学家周雪光等人曾指出，知识进步的一个重要标志是对社会现象的解释从类比(metaphor) 转变为具有分析力度的理论(theory)。故在本研究中，虽然所探讨的是大学学术评价指标的演进历程、类型划分、运作机理、贡献与局限以及若干优化建议，但这些描述性的介绍和概括性的分析不仅能对实践层面产生积极影响，而且对高等教育领域形成新的自主性理论知识体系具有同样重要的意义。

在大学学术评价指标发展过程中，“数字”和“公式”被作为主要工具，建立起了一般化的模型体系，并尽可能科学精准地呈现客观的学术事实和结果。可见，它们所遵循的逻辑假设在于：“物化”和“简化”。这两个维度都指涉到了指标作为一种计量方式所固有的先天优势，即可量化、可简化和可比较。从这个角度看，以量的方式在“经验—实证”和“假设—演绎”中去探究和获取可能的真理性规律，完成一种从量到质、从经验到理论的飞跃，似乎可以成为一种构建“指标治理理论”的进路。但存在于大学场域中的学术职业世界，是由无数个鲜活的个人所组成和建构。具有生命和情感的“个人”，特别是个人的主观意志、价值判断乃至“在变革中产生新的思想或观点”是无法真正做到指标化和模型化的。大学学术评价中的“指标”也绝不是一个统计层面的数字概念，它乃是由主体的主观偏好和需求所创设和赋予具体涵义。换言之，对大学学术评价指标的研究以及知识经验的积累，往往是一个趋近却又无法像自然科学那样直抵价值无涉的客观规律的过程，看似高度标准化、规范化的指标体系结构，事实上是由更宏大的价值结构所决定。

所以说，大学学术评价指标乃至希冀形成的“指标治理理论”本质上是关于“人的理论”而非“物的理论”。构建高等教育学术评价领域“指标治理理论”的核心是研究学术群体及其需求，以及提供满足需求的工具和方法，进而改善大学学术职业环境和学术行为活动。即要以“人”为中心，将“人之发展需求以及价值”嵌入到各类评价概念、工具、程序、方法乃至制度体系之中，并从学术人的目的性与需求的多样性、所拥有知识结构的差异性、自我学习成长的动力性和发现真理的探索性等方面，尝试构建出一套不同于自然科学主义范式的指标治理理论体系。

总而言之，中国乃是一个科研大国，在推进人文哲学社会科学繁荣发展过程中，学界应更积极地参与大学学术评价指标体系的建构，对指标应用的各类成功或失败的做法和经验进行学理化研究，以形成基于本土特色的指标治理理论。需要指出的是，上述讨论并不能就此直接建构出一套完全契合中国大学学术评价需要的成熟“指标治理理论”体系，而是对理论体系建构的可能性方法、路径以及需要注意的要点进行了初步探讨，希望能借此引起学界同仁的关注和重视，共同致力于在开展现代大学学术评价过程中形成关于“指标治理”的一般经验和提出能够解释现象和解决问题的分析思路或框架，从而为“指标治理理论”的建构提供可能的有益知识积累与参考。

扫码阅读全文

原文《“指标”：理解中国大学学术评价的一种视角》刊于《上海交通大学学报（哲学社会科学版）》2024年第8期（第93-107页）。若下载原文请点击：https://kns.cnki.net/kcms2/article/abstract?v=Uq4Diyda8XCDm7nFBm3zDS9trXXuqg_oL-KB7KknErdy-PFi9WIftq1Z2rJ6S7zIMojggfhVWb0li6jxxBFXOsDBcVdUeoGQOIhavONrxn_LEQNPaVXiCrsbSDvUlhUxVCWMP_FmG9EWBmyP-68skLoUWnrdJWbFybtYV2gHXUJeWSD_4f6XTTH5WzeZD0ci&uniplatform=NZKPT&language=CHS

————————

编辑：黄艺聪

审校：孙启艳

http://mp.weixin.qq.com/s?__biz=Mzg3MTExNDc5MQ==&mid=2247500270&idx=1&sn=83389d106cf245a1f7e5a886936dd2f9

上海交通大学学报哲学社会科学版

上海交通大学主办的CSSCI来源期刊，综合性人文社科期刊，每月出版。