【Patton评估思想】多元评估方法背后的十大价值取向

文摘   2024-10-16 05:57   美国  
原视频:Why so damn many options? The 10 competing values that explain the panoramic evaluation landscape

这个视频Patton深入探讨了评估方法的多样性及其背后的十大价值取向。Patton在视频中提到,目前已经存在超过100种不同的评估方法,而且这个数字还在不断增加,这种现象不禁让我们思考:为什么会出现如此多样化的评估方法?这些方法之间有什么区别?它们各自适用于什么样的情况?本文将带您与Patton一起深入探索评估领域的多样性,揭示不同方法背后的价值取向,并思考这种多样性对评估实践的影响。

评估领域的概念驱动特性

评估领域的一个显著特征是其强烈的概念驱动性。尽管某些评估概念在理论上可能存在不足,但它们在评估界仍然获得了广泛认可。这种现象的根源在于评估领域的本质:它是由概念和方法论驱动的。
在实践中,评估专家们将各种概念应用并适应于具体的情境和情况。这些概念引导了优先的评估问题,进而影响了评估的设计、方法和测量。换言之,概念框架为评估实践提供了一个思考和行动的基础,使评估者能够系统地处理复杂的社会问题和项目干预。
正如评估理论家Alkin和Christie(2004)在他们的"评估理论树"中所描述的,评估理论和方法的发展可以被视为一棵树,其根源是社会调查、社会问责和认识论。树干代表了评估的共同基础,而树的三个主要分支则代表了评估的三个主要关注点:使用、方法和价值。这个隐喻生动地展示了评估领域的概念驱动特性,以及不同评估方法如何从共同的根源发展出来,但又各自强调不同的方面。

评估方法的多样性:十大价值取向

Patton通过十个主要的价值取向或"张力"来解释评估方法的多样性。这些张力不仅反映了评估方法的多样性,也揭示了评估领域中存在的深层次哲学和方法论争议。让我们深入探讨这些张力,并思考它们对评估实践的影响:
  1. 确定性答案 vs. 多元视角
  2. 一些评估方法,如实验性评估和影响评估,追求确定性答案,试图客观地判断"项目是否有效"。这种方法的代表是随机对照试验(RCT),被许多人视为"黄金标准"。例如,Abdul Latif Jameel贫困行动实验室(J-PAL)就大量使用RCT来评估发展项目的效果。J-PAL的联合创始人Esther Duflo因在这方面的工作而获得2019年诺贝尔经济学奖。
    然而,这种追求确定性的方法也面临着批评。批评者认为,社会现实太过复杂,无法简化为简单的因果关系。正如Pawson和Tilley(1997)在他们的"现实主义评估"中指出的,我们需要理解"什么对谁有效,在什么情况下有效,以及为什么有效"。
    相反,另一些方法,如Egon Guba和Yvonna Lincoln(1989)提倡的建构主义评估,则强调收集多元视角,认为不同利益相关者可能对项目效果有不同的理解和判断。Robert Stake的响应性评估和Saville Kushner的个性化评估也属于这一类。这些方法认为,评估的目的不是得出一个单一的"真相",而是促进对话和理解。
    这种张力反映了评估领域中长期存在的认识论争议:我们是否可能获得客观的知识,还是所有知识都是社会建构的?这个问题不仅影响了评估方法的选择,也影响了我们如何理解和使用评估结果。
  3. 评估者独立性 vs. 参与式方法
  4. 一些评估者,如Michael Scriven,强调评估者应该保持独立性,做出客观的判断。Scriven(1991)认为,评估的本质是确定价值,评估者的任务是做出这种价值判断。Elliot Eisner开发的鉴赏评估将评估者视为专家,具有被评估对象的知识。这种观点认为,评估者的专业知识和独立性是保证评估质量的关键。
    然而,这种观点也面临挑战。批评者认为,完全的客观性是不可能的,每个评估者都带有自己的价值观和偏见。此外,外部评估者可能缺乏对本地情况的深入了解,导致评估结果与实际情况脱节。
    相反,参与式方法如协作评估、互动评估方法、包容性评估等,强调让利益相关者参与评估过程,共同创造评估结果。Fetterman的赋权评估(Empowerment Evaluation)就是一个典型例子,它将评估视为一个赋权的过程,帮助项目参与者获得评估技能和对自己项目的控制权(Fetterman, 1994)。
    这种张力反映了评估中的一个核心问题:谁应该有权解释数据和做出判断?这个问题不仅涉及技术考虑,也涉及权力和民主的问题。
  5. 描述性评估 vs. 解释性评估
  6. 描述性评估方法包括基于目标的方法(如SMART目标)、绩效测量、实施评估等,主要关注描述项目的实施情况和结果。这些方法通常能提供清晰、具体的信息,易于理解和使用。
    然而,仅仅知道"发生了什么"往往是不够的。我们还需要理解"为什么会发生"。这就是解释性评估的角色。解释性评估试图解释为什么项目产生了特定的结果,关注因果机制。这类方法包括理论驱动评估、现实主义评估等。
    Carol Weiss(1997)的项目理论评估是一个重要的贡献。她强调,每个项目都隐含了一个"变革理论",评估的任务就是揭示和检验这个理论。同样,Pawson和Tilley(1997)的现实主义评估关注"背景-机制-结果"配置,试图理解在特定情境下,什么机制导致了特定的结果。
    这种张力反映了评估的不同目的:是仅仅提供信息,还是产生深入的理解?这个问题直接影响了评估的设计和实施方式。
  7. 问责 vs. 学习
  8. 问责和学习是评估的两个主要目的,但它们之间常常存在紧张关系。一些评估方法,特别是那些源于审计传统的方法,主要关注问责。例如,美国政府问责办公室(GAO)的评估工作就属于这一类。这些评估通常关注项目是否按计划实施,是否达到了预定目标,资金是否得到了适当使用。
    然而,过分强调问责可能导致防御性行为,阻碍真正的学习和改进。正如Ebrahim(2005)所指出的,过度强调向上问责可能会削弱组织的创新能力和适应性。
    另一方面,形成性评估和发展性评估则更强调通过评估促进组织学习和改进。Patton(2011)提出的发展性评估特别适用于复杂、动态的环境,它将评估者嵌入到项目团队中,提供实时反馈以支持创新和适应。
    这种张力反映了评估的两个重要但有时冲突的目的。如何在问责和学习之间找到平衡,是评估者面临的一个重要挑战。
  9. 标准化 vs. 情境化
  10. 标准化方法追求通用的标准和"最佳实践"。例如,OECD DAC的评估标准(相关性、效率、效果、影响和可持续性)被广泛用于国际发展项目的评估。这种方法的优点是可以进行跨项目、跨地区的比较。
    然而,标准化方法也面临批评。批评者认为,这种方法忽视了地方特色,可能导致"一刀切"的评估。正如Chouinard和Cousins(2009)所指出的,评估不能脱离其社会、文化和政治背景。
    相反,文化响应性评估的倡导者则强调评估需要根据特定的文化和情境进行调整。Stafford Hood领导的文化响应性评估和评估中心就是这一方向的代表。这种方法认为,评估标准和方法应该反映当地的价值观和需求。
    这种张力反映了全球化与本土化之间的拉锯。在一个日益互联的世界中,我们如何平衡普遍性和特殊性?这个问题不仅在评估领域,在许多其他领域也同样重要。
  11. 使用导向 vs. 方法严谨性
  12. 以Patton为代表的使用导向评估强调评估的实用性,认为评估的首要目的是产生有用的信息。Patton(2008)提出,评估应该从一开始就考虑评估结果的潜在用途和用户。这种方法的优点是可以提高评估结果的相关性和使用率。
    然而,critics担心过分强调使用可能会影响评估的独立性和客观性。如果评估者过于关注利益相关者的需求,是否会忽视一些不受欢迎但重要的发现?
    另一方面,一些评估者(如Rossi和Freeman)则更关注方法的严谨性,强调科学的研究设计和数据分析。他们认为,只有通过严格的方法,我们才能得到可靠的结果。
    这种张力反映了评估的双重性质:它既是一门科学,也是一门艺术。如何在严谨性和实用性之间找到平衡,是评估者需要不断思考的问题。
  13. 项目层面 vs. 系统层面
  14. 传统的评估通常关注单个项目或干预,而系统评估(如Bob Williams的工作)则试图从更宏观的角度理解复杂的社会问题和变革过程。
    系统评估认识到,社会问题通常是复杂系统中多个因素相互作用的结果,单一干预很难产生持久的影响。正如Cabrera等人(2008)所指出的,系统思维可以帮助我们理解复杂的因果关系,识别意外后果,并设计更有效的干预。
    然而,系统评估也面临挑战。它通常需要更多的资源和时间,结果可能不如项目层面的评估那样具体和直接。
    这种张力反映了我们对社会问题的理解方式:是将问题简化为可管理的部分,还是尝试理解整个系统的复杂性?这个问题不仅影响评估,也影响了我们设计和实施社会干预的方式。
  15. 命令与控制 vs. 复杂性应对
  16. 传统的评估方法通常基于线性的规划-实施-评估模式,假设我们可以准确预测和控制干预的结果。这种方法在稳定、可预测的环境中可能有效。
    然而,在今天快速变化、高度不确定的世界中,这种线性思维越来越受到挑战。复杂性科学的insights被引入评估领域,产生了新的方法,如Patton(2011)的发展性评估。这些方法强调适应性和灵活性,认识到在复杂系统中,小的变化可能产生大的影响,结果往往是不可预测的。
    这种张力反映了我们如何看待世界:是一个可以被控制和预测的机械系统,还是一个复杂、自适应的生态系统?这个问题深刻影响了我们设计、实施和评估干预的方式。
  17. 技术性 vs. 价值导向
  18. 一些评估方法试图将评估呈现为一种中立的、技术性的活动。这种观点认为,评估者的任务是客观地收集和分析数据,而不是做出价值判断。
    然而,越来越多的评估者认识到,评估本质上是一个价值判断的过程。正如House和Howe(1999)所指出的,评估总是涉及价值选择,问题是这些价值是否明确。女性主义评估、LGBTQ评估、人权评估等则明确承认评估的价值导向性。这些方法认为,评估应该积极促进社会正义和公平。例如,Mertens的变革性范式(2009)主张评估应该关注权力关系,挑战不平等,促进社会变革。
    这种张力反映了一个根本问题:评估是否应该是价值中立的?如果不是,那么谁的价值观应该被优先考虑?这个问题不仅是技术性的,也是政治性和道德性的。
  19. 知识生成 vs. 直接干预
  20. 传统上,评估被视为一种知识生成活动,其主要作用是为决策提供信息。这种观点认为,评估者的责任是提供可靠的证据,而不是直接参与变革过程。
    然而,一些评估者(如倡导评估、蓝色大理石评估的支持者)则认为评估本身就应该成为变革的一部分,直接促进社会正义和可持续发展。例如,Fetterman的赋权评估(1994)就将评估视为一个能力建设和赋权的过程。
    这种张力反映了对评估者角色的不同理解:是客观的观察者还是积极的变革推动者?这个问题涉及评估的伦理和专业边界。
    这十对张力不仅反映了评估方法的多样性,也揭示了评估领域中一些深层次的哲学和方法论争议。它们代表了评估者在实践中需要不断权衡的问题。重要的是,这些张力不应被视为非此即彼的选择,而是一个连续体,评估者需要根据具体情况在这个连续体上找到适当的位置。
    评估方法倾向性
    核心观点
    代表人物/机构
    确定性答案
    追求客观、确定性答案,试图判断"项目是否有效"
    RCT, J-PAL, Esther Duflo
    多元视角
    强调收集多元视角,认为不同利益相关者对项目效果有不同理解
    Egon Guba, Yvonna Lincoln, Robert Stake, Saville Kushner
    评估者独立性
    强调评估者应保持独立性,做出客观判断
    Michael Scriven, Elliot Eisner
    参与式方法
    强调让利益相关者参与评估过程,共同创造评估结果
    Fetterman (赋权评估)
    描述性评估
    关注描述项目的实施情况和结果
    SMART目标, 绩效测量
    解释性评估
    试图解释为什么项目产生了特定的结果,关注因果机制
    Carol Weiss, Pawson和Tilley
    问责
    关注项目是否按计划实施,是否达到预定目标
    GAO(美国政府问责办公室)
    学习
    强调通过评估促进组织学习和改进
    Patton (发展性评估)
    标准化
    追求通用的标准和"最佳实践"
    OECD DAC评估标准
    情境化
    强调评估需要根据特定的文化和情境进行调整
    Stafford Hood (文化响应性评估)
    使用导向
    强调评估的实用性,首要目的是产生有用的信息
    Patton (使用导向评估)
    方法严谨性
    更关注方法的严谨性,强调科学的研究设计和数据分析
    Rossi和Freeman
    项目层面
    关注单个项目或干预
    传统项目评估
    系统层面
    试图从更宏观的角度理解复杂的社会问题和变革过程
    Bob Williams, Cabrera等人
    命令与控制
    基于线性的规划-实施-评估模式
    传统评估方法
    复杂性应对
    强调适应性和灵活性,认识到复杂系统中的不可预测性
    Patton (发展性评估)
    技术性
    将评估呈现为中立的、技术性的活动
    传统技术导向评估
    价值导向
    明确承认评估的价值导向性,促进社会正义和公平
    House和Howe, Mertens (变革性范式)
    知识生成
    评估被视为知识生成活动,为决策提供信息
    传统评估观点
    直接干预
    评估本身就应该成为变革的一部分,直接促进社会正义
    Fetterman (赋权评估)

评估方法多样化的动因

评估方法的多样化并非偶然,而是多种因素共同作用的结果:
  1. 社会问题的复杂性:随着我们对社会问题认识的深入,传统的线性因果模型越来越难以解释复杂的社会现象。例如,气候变化、贫困、不平等等问题都涉及多个系统的相互作用,需要更复杂的评估方法来理解和应对。
  2. 价值观的多元化:不同的评估方法反映了不同的价值观和世界观。在一个日益多元化的社会中,评估需要能够容纳和反映不同的价值观。例如,原住民评估方法就试图将原住民的世界观和知识系统纳入评估过程(LaFrance & Nichols, 2008)。
  3. 学科交叉:评估领域吸收了来自社会学、心理学、经济学、人类学等多个学科的理论和方法。这种跨学科的融合促进了新评估方法的产生。例如,现实主义评估就借鉴了批判现实主义哲学的洞见(Pawson & Tilley, 1997)。
  4. 技术进步:新技术,特别是数据收集和分析技术的进步,为新的评估方法提供了可能性。大数据分析、社交网络分析、地理信息系统等技术都在改变评估的实践方式。例如,监测评估中越来越多地使用远程传感器和卫星图像来收集数据。
  5. 实践需求:不同类型的项目和干预需要不同的评估方法。例如,创新性项目可能需要更灵活、适应性强的评估方法,而成熟的项目可能更适合标准化的评估方法。
  6. 政策环境:不同的政策环境对评估提出了不同的要求。例如,强调证据基础决策的政策环境推动了更严格的影响评估方法的发展。在美国,"什么是有效的"(What Works)运动就促进了随机对照试验在社会政策评估中的应用(Baron, 2018)。
  7. 评估使用的多样化:评估不再仅仅是为了做出总结性判断,还可以用于促进学习、支持决策、促进对话等多种目的。这种用途的多样化也推动了评估方法的多样化。
  8. 全球化:全球化带来了跨文化评估的需求。国际发展项目的评估需要考虑不同文化背景下的价值观和实践。这推动了文化响应性评估等方法的发展。
  9. 社会正义意识的增强:越来越多的评估者认识到评估不应该是价值中立的,而应该积极促进社会正义和公平。这种认识推动了变革性评估、批判性评估等方法的发展。

评估方法多样化的影响

评估方法的多样化对评估实践产生了深远的影响:
  1. 方法选择的复杂性:面对众多的评估方法,如何选择最合适的方法成为一个挑战。评估者需要考虑多种因素,包括评估目的、资源限制、利益相关者的需求等。这要求评估者具备更广泛的知识和更强的判断力。
  2. 评估质量标准的多元化:不同的评估方法可能需要不同的质量标准。例如,参与式评估的质量可能更多地取决于利益相关者的参与程度,而实验设计的质量则更多地取决于内部效度。这使得评估质量的判断变得更加复杂。
  3. 评估者角色的变化:不同的评估方法对评估者提出了不同的要求。例如,发展性评估要求评估者成为项目团队的一部分,而传统的外部评估则强调评估者的独立性。这意味着评估者需要具备更多样的技能和能力。
  4. 评估能力建设的需求:方法的多样化意味着评估者需要掌握更多的技能和知识。这增加了评估培训和能力建设的重要性。评估专业协会和教育机构需要不断更新他们的课程和培训内容,以反映评估领域的最新发展。
  5. 评估结果的多样性:不同的评估方法可能产生不同类型的证据和洞察。这增加了综合不同类型证据的需求,也增加了评估结果解释和使用的复杂性。决策者和其他利益相关者需要学习如何理解和使用不同类型的评估结果。
  6. 跨学科合作的增加:评估方法的多样化促进了评估者与其他学科专家的合作。例如,系统评估可能需要评估者与系统动力学专家合作。这种跨学科合作可以带来新的insights,但也可能带来沟通和协调的挑战。
  7. 评估伦理的新挑战:新的评估方法可能带来新的伦理问题。例如,参与式评估可能涉及权力动态和利益冲突的问题。大数据分析在评估中的应用也带来了隐私和数据安全的问题。评估伦理指南需要不断更新以应对这些新挑战。
  8. 评估理论的发展:方法的多样化推动了评估理论的发展,使我们对"什么是好的评估"有了更深入的理解。例如,Chen(1990)的理论驱动评估、Pawson和Tilley(1997)的现实主义评估都对评估理论的发展做出了重要贡献。
  9. 评估使用的新可能性:不同的评估方法为评估结果的使用开辟了新的可能性。例如,发展性评估可以支持实时决策和持续创新。参与式评估可以促进利益相关者的学习和能力建设。
  10. 评估的民主化:一些新的评估方法,如参与式评估和赋权评估,促进了评估过程的民主化。这些方法赋予了更多的声音给传统上在评估中被忽视的群体。然而,这也带来了如何平衡不同声音的挑战。

未来展望:评估领域的发展趋势

展望未来,评估领域可能会继续呈现以下发展趋势:
  1. 方法的整合与融合:我们可能会看到更多方法的整合和融合,以应对复杂的评估需求。例如,混合方法评估就是结合定量和定性方法的一种尝试(Creswell & Plano Clark, 2017)。
  2. 技术驱动的创新:大数据、人工智能、物联网等新技术可能会为评估带来新的可能性。例如,机器学习可能会被用来分析大量的文本数据,帮助识别项目的意外效果。
  3. 参与和民主化的深化:评估可能会变得更加参与式和民主化,更多地纳入利益相关者的声音。这可能会挑战传统的专家主导模式,带来评估过程和结果的新形式。
  4. 全球视角的加强:评估可能会更多地采取全球视角,关注跨国界的问题和影响。例如,可持续发展目标(SDGs)的评估就需要一个全球的视角。
  5. 系统思维的普及:系统思维可能会在评估中得到更广泛的应用,以应对日益复杂的社会问题。这可能会导致更多关注间接影响、反馈循环和长期效果的评估方法。
  6. 评估与决策的紧密结合:评估可能会更紧密地与决策过程结合,提供更及时、更相关的信息。实时评估和快速循环评估可能会变得更加普遍。
  7. 评估伦理的重视:随着评估对社会的影响越来越大,评估伦理可能会得到更多的关注。这可能会导致更严格的伦理指南和更多关于评估伦理的讨论和研究。
  8. 文化响应性的增强:评估可能会变得更加文化敏感,更好地适应不同的文化背景。这可能会挑战一些传统的评估假设和实践。
  9. 可持续发展视角的主流化:随着可持续发展成为全球共识,评估可能会更多地纳入可持续发展的视角。这可能会改变我们评估成功的方式,更多地考虑长期和系统性影响。
  10. 评估能力建设的重视:随着评估变得越来越复杂,评估能力建设可能会得到更多的重视。这可能会导致更多的评估培训项目和专业发展机会。

结语

评估领域的多样化反映了我们对社会问题认识的深化,也反映了评估实践面临的挑战和机遇。这种多样性一方面为评估者提供了丰富的工具箱,使我们能够更好地应对复杂的评估需求;另一方面也带来了选择和整合的挑战。
面对这种多样性,评估者需要保持开放和批判的态度。我们需要认识到每种方法都有其优势和局限,没有一种方法适用于所有情况。选择合适的方法需要对评估的目的、环境、资源和利益相关者有深入的了解,同时也需要对不同方法的理论基础和实践含义有清晰的认识。
此外,我们还需要认识到评估不仅仅是一种技术活动,更是一种价值导向的实践。不同的评估方法反映了不同的价值观和世界观。因此,在选择和应用评估方法时,我们需要反思自己的价值立场,并考虑这些方法可能产生的更广泛的社会影响。
最后,尽管评估方法呈现多样化趋势,但我们不应忘记评估的根本目的:提供有用的信息以改善决策和实践。无论采用何种方法,好的评估应该能够产生可靠的、相关的和有用的信息,推动组织学习和社会进步。在这个快速变化的世界中,评估者需要不断学习和适应,以确保评估能够继续发挥其重要作用。
正如Patton(2018)所说,"评估的未来不是预测,而是创造。"作为评估者,我们有责任塑造这个未来,确保评估继续为创造一个更美好的世界做出贡献。

Nan的炼心坊
让不可见的价值被认可,让有意义的行动被看见。