1964年,教育部、共青团中央委员会和科学院决定成立一个以诺贝尔物理学奖得主、院士彼得·卡皮查为首的智力奥林匹克竞赛联合组织委员会。在这个联合委员会的管理下,一个全球性的智力奥林匹克竞赛体系出现了。在 1966 年至 1974 年间,数学、物理和化学奥林匹克竞赛在四个级别组织进行:学校、区(或镇)、地区(州)和全国。学校竞赛的获胜者参加区的奥林匹克竞赛,区的获胜者参加地区竞赛等等。全国级别的竞赛在加盟共和国首都或俄罗斯的大城市举行。自 1967 年以来,全国奥林匹克竞赛的获胜者有权无需额外考试进入最好的大学。与此同时,远程奥林匹克竞赛体系也得到了发展。一些全国性和地区性的报纸公布题目并收集学生们的答案。不久之后,远程奥林匹克竞赛被接纳为共和国级别奥林匹克竞赛的选拔赛事,作为一种帮助来自俄罗斯偏远乡村孩子的尝试。苏联丰富的智力奥林匹克竞赛体系涉及许多有能力的孩子,并确保苏联队在国际智力竞赛中名列前茅。苏联传统的智力奥林匹克竞赛涉及解决非常困难的问题,这些问题不需要超出学校课程范围的知识,但确实涉及对知识的创造性应用。不时有人尝试改进这种方法,使其更加多样化。例如,1971 年在里加举行的全国竞赛中,首次加入了“研究任务”,每个参与者必须选择一个他或她觉得有趣的问题,并提出一种原创的解决方法。另一个想法旨在为参与者创造平等的起始条件,而不依赖于他们先前知识的水平。竞赛以一个参与者之前未知的主题讲座开始,然后要求他们解决与该主题相关的一些问题。在苏联,奥林匹克竞赛的高官方地位也带来了负面后果;它促使一种奥林匹克竞赛培训产业的产生。当然,奥林匹克竞赛的任务一直涉及非典型问题,需要很大的创造力,但训练孩子解决这些特定类型的任务并非不可能。有人认为,解决奥林匹克竞赛问题的培训造就的是运动员,而不是科学家。1991年之后,俄罗斯的天才教育体系发生了重大变化。处于严重危机中的中央政府的权力减弱。因此,个人和组织(包括私人和公共的)的自主权大大增加。结果,天才教育中的大多数“政府性”目标(例如,发展某些科技分支的战略利益)失去了一些重要性,转而倾向于更“私人”或“集体”的目标(例如,大学对招募有才华学生的兴趣,或者父母帮助孩子实现自我的动力)。智力奥林匹克竞赛的多样化发展就是后果之一。不同的大学、高等院校、中学和私人协会现在对政府当局的依赖减少,除了继续发挥作用但范围缩小的中央体系之外,还创建了许多不同的智力奥林匹克竞赛。如今,奥林匹克竞赛在19个学科中举行。2008年,俄罗斯科学和教育部发布了一份名单,确认了120个俄罗斯智力奥林匹克竞赛,分为三类。每一类都代表着获胜者进入高等学校的一定可能性水平。第一类也是最高类别被分配给了30个奥林匹克竞赛,第二类有12个,第三类有78个。3.奥林匹克竞赛和心理评估作为识别天赋的方法
识别天赋意味着发现那些有潜力成为杰出科学家、作家、管理者、运动员、工程师、音乐家等的儿童。挑战在于如何识别这种潜力。测量认知能力是一种可能的方法。下面引用的研究表明,认知能力对于在科学事业上取得成功至关重要,其重要性超过在音乐、艺术和政治生涯中的作用。在这种情况下,智力可以被认为是科学天赋的一个重要因素,智力评估可以作为识别科学天赋的一部分加以应用。无论如何,将能力评估作为识别天赋的一种方法,要求能力的预测效度是明确的。另一种方法是分析儿童和青少年在与专业活动类似的现实生活活动中的成功表现。例如,如今,对现实活动的分析是识别有天赋的音乐家和艺术家的更好方法。一个奥林匹克数学问题及其解决方案,类似于专业水平的数学问题及其解决方案。因此,人们可以假设在奥林匹克竞赛中的表现能够准确预测科学上的成功。已经有人尝试评估奥林匹克竞赛成功的预测效度。苏博特尼克和施泰纳(1995)评估了1983年“西屋科学人才搜索”获奖者在获胜后的12年里在科研、工程和医学方面的成就,并报告了相当令人鼓舞的数据。詹姆斯·坎贝尔对参加国际奥林匹克竞赛的美国人进行了一些研究。他报告了参加数学奥林匹克竞赛(坎贝尔,1996)和物理奥林匹克竞赛(冯、坎贝尔和维尔纳,2001)的参与者在生活中取得了相当大的成功。然而,尝试评估智力奥林匹克竞赛的预测效度可能会遇到一些方法上的困难。部分回复可能会产生系统性偏差。例如,冯等人(2001)报告说,在80份请求中收到了55份回复。然而,正如研究和常识告诉我们的那样,那些没有达到成功预期的有天赋的人往往不会回复询问他们成就的问卷(弗里曼,2001)。同时,大量证据表明心理测试可以预测人生结果。智力测试被认为是职业成功的最佳预测指标(戈特弗里德森,1996;亨特,1986)。在一项经典研究中,罗(1952,1953)成功地研究了64位杰出的美国科学家,并在样本中发现他们在数量、空间和言语智力方面的平均智商在137到160之间。创造力是人生成就的另一个可能的预测指标(克拉蒙德,2005)。在创造力研究的黄金时代,E.P.托兰斯开始了一项纵向研究,以评估他的创造力测试的预测效度。他成功地表明,青少年的创造力测试分数与22年后他们的创造性成就之间的相关系数约为r = 0.40(托兰斯,1988)。在同一研究中,智力测试的预测效度略低。使用线性结构建模对托兰斯的数据进行重新分析,结果显示在加入智力因素后,模型的拟合度并没有显著提高(普卢克,1999)。一个很少引起研究关注的重要问题是,智力和创造力得分是否是奥林匹克竞赛结果的良好预测指标。对奥林匹克竞赛获奖者人生成功的研究通常没有控制心理测量变量,如智力和创造力。然而,人们可以假设,解决困难的奥林匹克竞赛问题的成功在很大程度上取决于认知能力,因此奥林匹克竞赛的获奖者是非常聪明和有创造力的青少年。如果是这样,我们可以预期奥林匹克竞赛的结果能够预测人生结果,因为它们与认知能力高度相关。为了验证这一假设,我们对莫斯科地区多学科智力奥林匹克竞赛——莫斯科智力马拉松决赛的参与者进行了一项研究(网址:http://intmarathon.ru)。这项研究的目的不仅是调查认知能力(智力和发散性思维)作为奥林匹克竞赛结果的因素,更重要的是,评估奥林匹克竞赛与认知能力共同的方差量,以便比较它们作为未来人生结果的潜在预测指标。4.本研究
4.1参与者
参加莫斯科智力马拉松决赛的选手参与了这项研究。为了进入决赛,所有孩子都必须在选拔赛中取得好成绩。决赛的所有参与者都被邀请参加我们的研究。在818名参与者中,至少有一人接受了一项测试,700人参加了所有的研究测试。参与者的数量如表1所示。
4.2 方法
对受试者进行了三项心理测试:
1.瑞文高级推理测验(APM)。该测验的标准程序规定时间限制为40分钟或者根本没有时间限制。在这项研究中,采用30分钟的时间限制有两个原因。首先,在奥林匹克竞赛中进行心理测试的时间分配相当严格。其次,我们试图避免普通青少年在智力上出现天花板效应。事实上,在711名参加智力测试的人中,只有一人在30分钟内完成36道APM任务时达到了36分的最高分。这种方法的缺点是无法将我们的结果与总体平均值进行比较。2.由阿韦里娜和舍布拉诺娃(1996)修订的俄语版《不寻常用途测试》(UUT)。九至十一年级的学生完成“木尺”测试,五至八年级的学生完成“报纸”测试。从UUT的评分中可以得出不同的维度——流畅性、灵活性、独创性。许多作者根据相关研究(迪克森,1979;特雷芬格,1985)和因素分析结果(克拉彭,1998;迈克尔和巴彻勒,1992;朗科、普卢克和林,2001)提出,发散性思维是单因素的。然而,在最近的一项研究中,K.金(2006)针对托兰斯测试的非言语部分表明,与单因素模型相比,双因素模型更合适。在这种情况下,流畅性和独创性属于第一个因素,而精细加工和抽象命名属于第二个因素。对于UUT,由于无法计算像精细加工这样的参数,单因素解释是最合适的。在进一步的分析中,流畅性被用作UUT的单一得分。与独创性相比,这个参数的优势在于它不受样本中反应频率规范的影响。这些频率对于有天赋的受试者来说可能是特殊的。3.进行了三个测量人格的量表测试:1)挫折感(9 个项目),2)焦虑(12 个项目),3)孤独感(7 个项目)。这些量表由 A. 斯克里尼科夫在俄罗斯精心编制,根据作者的报告(《心理测试年鉴》,1996),具有良好的心理测量特性。这些量表被选用于本研究,因为孤独感、焦虑感和不稳定的自尊感在有天赋的儿童和青少年中经常被报道为常见问题(弗里曼,2001;维纳,1956)。我们还分析了参与者的奥林匹克竞赛任务结果。不同年级的奥林匹克竞赛任务不同。受试者完成人文学科、科学和数学的任务,任务数量从五年级学生的13个到十一年级学生的27个不等。相应学科领域(数学、物理科学、天文学、化学、生物学、历史和俄罗斯文学)的专家设计了这些任务。这些任务在竞赛之前没有进行过预试。4.3.程序
所有测试都是以20至30人为一组进行的。调查分两次进行。第一次测试于2001年12月在针对九至十一年级学生的奥林匹克竞赛中进行,持续了三天。第一天,受试者参加智力测试。第二天,他们进行创造力测试,第三天进行人格量表测试。第二次测试于2002年2月在针对五至八年级学生的奥林匹克竞赛期间进行,持续了两天。这次只进行了智力和创造力测试,省略了人格量表测试。在所有情况下,心理测试都是在上午进行,在完成奥林匹克竞赛任务之前。奥林匹克竞赛的组织者对竞赛任务进行评分。评分采用部分计分法。5.结果
5.1.奥林匹克竞赛任务的量表一致性和因素分析。
奥林匹克竞赛的任务通常在设计时没有过多考虑其心理测量学特性。本研究的第一个目的是评估奥林匹克竞赛的结果是否可以被视为受试者表现的一致指标。对每个年级的数据分别进行分析。首先,评估量表的一致性。克朗巴哈系数(Cronbach's α)在0.40到0.74之间。在17个量表中,只有8个达到了或多或少可接受的克朗巴哈系数的水平。进行了一项因素分析,以评估奥林匹克竞赛任务是否真的形成了与奥林匹克奖项(数学、科学和人文学科)相对应的因素。在大多数情况下,因素的数量与奖项提名的数量并不对应。例如,对于九至十一年级的学生,包含在数学竞赛中的天文学任务实际上与数学任务并不相关。为了进行进一步的分析,我们通过排除那些降低得分一致性的任务,从奥林匹克竞赛任务中形成了更具一致性的量表。对于五至八年级,为人文学科和数学分别构建了两个量表。对于九至十一年级,确定了一个额外的科学量表。这个量表的核心是由生物任务形成的,因为大多数物理任务都加载在数学量表上。
5.4.奥林匹克竞赛识别系统与能力评估的比较
由于奥林匹克竞赛和能力评估被认为是识别天赋的不同方法,评估它们的结果有多一致是很有趣的。当然,使用任何一种方法确定的受试者数量取决于阈值。例如,为了使用智力测试来识别天赋,可以将阈值设定为智商130分、125分或140分。在每种情况下,确定的有天赋的受试者数量会有所不同。同样,由于奥林匹克竞赛成绩而确定的有天赋的参与者数量可能也会有所不同。在后续的分析中,使用了四种不同的方法去构建一个样本,该样本由根据相应识别方法被认为是最有天赋的所有参与者中的 10% 组成。 1.依据智力得分 —— 将最聪明的参与者中的 10% 视为有天赋的样本。
2.依据智力加创造力——对智力和创造力得分进行 z 变换,并为每个参与者计算其总和。同样,总和最高的参与者中的10%被分配到有天赋的样本中。
3.依据奥林匹克竞赛总分——将奥林匹克竞赛总分最高的参与者中的10%分配到有天赋的样本中。
4.依据数学加人文学科得分——在数学得分最高的参与者中取5%,在人文学科得分最高的参与者中取5%,这些参与者被视为有天赋的样本。
由奥林匹克竞赛和心理评估确定为有天赋的样本的交集被计算出来并呈现在表5中。 如果这些识别方法没有相关性,那么交集将是10%。如果这些方法完全一致,那么交集将是100%。显然,尽管交集超过了10%的水平,但它们远未达到100%的水平。5.5.能力、成就与适应
挫折、焦虑和孤独量表的克朗巴哈系数分别为0.63、0.54和0.74。智力和创造力与人格特质没有显著相关性。然而,在十年级和十一年级的高智商男孩中(分布中得分最高的一半),我们发现数学奥林匹克竞赛成绩与孤独问题之间存在显著的正相关(十年级和十一年级的相关系数分别为,和, )。6.讨论
6.1.能力测试作为奥林匹克竞赛成绩的预测指标
智力测试与奥林匹克竞赛成绩的相关性低于其与学业成就和职业成功的通常相关性。智力与学业成就的相关性通常在至的范围内。在我们的研究中,瑞文高级推理测验得分与数学任务的相关性约为。
这种低相关性的一种可能解释是,样本是从以往的竞赛中挑选出来的,因此可以预期会有很大的范围限制。这可能是一种间接范围限制的情况:样本是基于先前竞赛中的问题解决能力被挑选出来的。不幸的是,我们没有参与者在 “选拔轮” 的成绩。然而,为了解决范围限制问题,我们可以比较我们的研究样本和一些莫斯科学校的不受限制样本的智力得分。这个比较的结果相当出人意料。正如预期的那样,研究样本中的智力均值至少比未被挑选的样本高一个标准差。但与这些预期相反,只有在十年级时,未被挑选的样本的标准差显著更高(见表 3 和表 4)。
我们样本中的智力得分显著更高,这表明选择标准(选拔轮中的问题解决能力)与智力相关。如果我们估计这种相关性为,那么我们的样本在选拔轮中的问题解决能力应该比平均水平高约3个标准差。如果我们估计这种相关性为,那么样本在选拔轮中应该比平均水平高 2 个标准差。第二种估计可能看起来更合理,因为它对应于大约最初参与者中能够进入决赛轮的5%。然而,应该考虑到最初的参与者已经通过他们决定参加比赛而进行了预先筛选。有理由认为,决定参加比赛的积极性很高的受试者在智力测试和奥林匹克竞赛问题解决方面都高于平均水平。
我们的样本涉及两个标准:1)受试者决定参加竞赛;2)解决奥林匹克竞赛问题。这种分析可能解释了为什么样本选择不一定会导致范围限制。当然,基于问题解决能力的选择应该会导致范围限制,但如果有不成比例的高能力受试者进入样本,那么基于受试者的决定进行的选择可能会产生相反的结果。这两个标准的结合实际上可能会产生一个高于平均水平且没有范围限制的样本。
相关性相对较低的另一个解释是,一些奥林匹克竞赛的参与者比其他人有更好的准备机会。一些学校提供的准备工作比其他学校好得多。奥林匹克竞赛聚集了来自许多不同学校的孩子,他们的表现很大程度上取决于学校条件,而学校条件可能会降低他们能力的影响。这种情况与体育运动类似,在体育运动中,可用于准备的技术往往比运动员的身体潜力更有价值。相比之下,当测量智力与学业成绩的相关性时,通常评估的是一起学习过因而有相似的获得能力和知识的可能性的学童。
6.2.奥林匹克竞赛结果作为一种识别天赋的方法。
我们的研究显示了关于奥林匹克竞赛成绩量表的心理测量特性的一些令人沮丧的结果。这些量表没有显示出高一致性,也不直接与因素分析的结果相对应。需要进行一些额外的心理测量工作,以将奥林匹克竞赛的结果转化为或多或少在心理测量上正确的量表。这个结果并不完全出乎意料,因为是相关学科领域的专家而不是心理测量学专家构建了奥林匹克竞赛的任务。
有人可能会说,奥林匹克竞赛并非测试一种孤立的认知或人格特质,而是用于整体地识别天赋,即作为不同心理特质的组合。当然,生活中的表现很少仅仅取决于一种心理特质。奥林匹克竞赛的胜利,如同现实生活中的创造性成功一样,源自许多不同的因素。
以体育类比为例。一名篮球运动员的良好潜力包括诸如身高、良好的手眼协调能力、快速的反应能力、速度、力量、耐力等特征。这些可以被称为一阶特征。二阶技能,如投篮、上篮、抢篮板、运球等,是在一阶特征的基础上发展起来的。对篮球的精通集合了所有这些技能。
现在想象两种预测初级篮球运动员潜力的方法。第一种方法是仔细测量一阶特征,并将其应用于篮球专业人士。那些能显著预测专业能力的特征将被用作指标来确定初级球员的潜力。从某种意义上说,这种方法类似于识别天赋的心理测量方法,因为它分离出一阶特征,并确定它们的线性组合作为未来表现的预测指标。
第二种方法是在一场或多或少类似于专业比赛的竞赛中评估初学者。这种方法类似于通过思维奥林匹克竞赛来识别智力天赋。在这种情况下,不能寻求一致性,因为竞赛包括的项目不一定相互关联。例如,罚球能力不一定与抢断球能力相关,但这两者对于篮球精通都很重要。
这两种方法都有其优点和缺点。以目前的形式,心理测量方法无法解释现实生活表现的非线性预测。继续以篮球为例,很可能一名篮球运动员的潜力是身高、手眼协调能力、速度等特征非常复杂的相互作用。此外,具有特定技能组合的球员在某个位置(例如后卫而不是前锋)以及在能最大程度发挥其优势的特定球队中可能表现得更好。非线性通常无法通过当前预测现实生活表现的方法来解释。然而,线性效应足够强大,可以预测表现差异的重要部分。即使是智力作为单一预测因素,也可以解释高达 50%的职业表现差异(戈特弗里德森,1996)。
关于奥林匹克竞赛,问题则有所不同。没有决定性的论据可以假定在奥林匹克竞赛中的表现与科学活动是同构的。此外,有人认为,奥林匹克竞赛偏爱“智力运动员”,即那些能够专注于快速解决难题的人,而不是为需要更多时间的问题找到深刻解决方案的人。
奥林匹克竞赛的成功反映了在解决复杂学术问题方面的能力,而这又取决于一个人的能力、个性、家庭支持、学校提供的机会等。问题在于,奥林匹克竞赛能力所涉及的因素是否与现实生活中的表现相关。如果相关,那么奥林匹克竞赛可以成为研究有效性的良好预测指标。
其中一些因素,如卓越的智力,是稳定的,有助于获得奥林匹克竞赛能力以及研究能力。然而,其他因素是不稳定的,例如学校的支持。一所好学校可以为学生提供充足的资源来解决复杂问题,以便在奥林匹克竞赛中取得好成绩。学生的家庭也可以影响能力的发展,但尚不清楚这种影响在成年后是否持续。无论如何,在青少年参加奥林匹克竞赛和他或她开始进行专业研究之间可能会发生重大的环境变化。
根据我们的数据,能够通过心理测试工具(如智力和创造力测试)预测的奥林匹克竞赛成功的部分是有限的。当然,我们只能使用非常有限的心理测试工具,但我们使用的这些工具似乎对于这个目的是最相关的。我们不能排除其他一些人格特质(如内向性)也可能影响奥林匹克竞赛结果的可能性,但这些因素似乎不太可能从根本上改变已解释的方差水平。
无论如何,国家和国际奥林匹克竞赛的获胜者肯定是既聪明又有创造力的。当在国家层面进行选拔时,即使是适度相关的测量方法也仍能成功地识别出卓越的智力。例如,通过选拔人口的0.01%,奥林匹克竞赛成功地识别出那些属于最高5%的人。坎贝尔的研究结果与这种观点相符。然而,在选拔大量有天赋的个体时,奥林匹克竞赛可能不会取得同样程度的成功。
6.3.参加思维奥林匹克竞赛作为人生事件
奥林匹克竞赛不仅仅是一种测量方法;它们也是重要的人生事件(奥姆达尔和理查兹,2008)。参与者的人生历程,特别是在职业机会方面,可能会受到先前参加奥林匹克竞赛的积极而强烈的影响。可以说,在奥林匹克竞赛中取得成功是一种“自我实现的预言”。一个人有可能以一种鼓励科学活动进展的方式塑造自己的环境。在这种情况下,由于奥林匹克竞赛对现实生活事件的影响,它的预测效度甚至可能比预期的更高。
与心理测试相比,思维奥林匹克竞赛还有另一个重要优点。一个人的奥林匹克竞赛成绩显然不仅取决于能力,还取决于为获取学术知识所付出的个人努力,这激励着孩子们努力学习并取得成功。相比之下,能力评估会导致更复杂的情况。正如德韦克和莫尔登(2005)所说,一部分孩子及其父母认为智力能力是恒定的,不利的评估可能会导致一种“污名化”。虽然在奥林匹克竞赛中的失败可以归因于努力不足,但智力测试的低分往往与个人的内在特质相关。
然而,结果显示了奥林匹克竞赛成绩的另一个方面——它与前面提到的天才个体的孤独问题之间的联系。人们普遍认为,神童,尤其是数学神童,常常在与他人交流方面存在问题(例如,维纳,1956)。对此有两种解释被提出。第一,交流问题可能是由于高智商,其中社交技能本质上受到了损害。第二,神童的交际能力由于他们在非常抽象的学术领域投入过多而没有得到充分训练。我们的证据不支持第一种解释,因为在智力和人格量表之间没有发现相关性。当然,我们的样本是预先挑选的——参与者总体上是学业成功的学生。学业不良的天才学生不在我们的研究对象之列。在这一类别中,智力可能是一个负面的适应因素。这一结果与显示天才儿童没有特殊的情感和社会问题(弗里曼,2001)甚至存在特殊应对资源(哈索娃,2002)的研究一致。数据支持第二种解释。已经表明,在高智商男孩中,数学奥林匹克竞赛成绩与孤独感之间存在显著相关性。男孩通常在数学方面成绩更好,并在提高数学理解和应用方面投入更多,这可能会阻碍社会和情感成长的发展。
这一证据也表明了一个重要事实,即在奥林匹克竞赛中取得杰出成就需要在抽象学术领域投入大量的努力、奉献和认知资源。这样的投入对于社交能力的发展并不那么有利。如果社交能力被认为是创造性人生的一个重要来源,那么为参加奥林匹克竞赛而进行的早期专业化可能并不适合在现实生活中取得创造性成就。
6.4.学业专业化问题
人的时间和精力资源是有限的,投入到一个学术领域不可避免地会占用个人生活的其他方面。我们的数据显示,在奥林匹克竞赛中取得好成绩是通过大量投入和随之而来的学业专业化实现的。十一年级的学生在某些学术领域最为专业化,因为他们即将进入具有专业方向的高等教育阶段。在这个年级,人文科目成绩和数学成绩之间的相关性为零()。十一年级学生的言语创造力与数学成绩无关()。最后,在瑞文高级推理测验得分和人文科目奥林匹克竞赛得分之间发现了一个奇怪的相关性,。总之,结果表明人文科目成绩和数学成绩之间没有联系,言语能力测量值与数学成绩之间没有联系或呈负相关,表现能力测量值与人文科目成绩之间也没有联系或呈负相关。
7.结论
奥林匹克竞赛的任务构成了一致性较低的量表。在奥林匹克竞赛中的成功往往取决于孩子们在学校或其他地方为竞赛所接受的训练,这实际上可能会降低他们的能力对竞赛结果的影响。同时,参加奥林匹克竞赛可以成为参与者人生中的一次积极的、有成就感的经历,并可能在日后影响他们的职业选择。因此,奥林匹克竞赛除了识别有天赋的青少年之外还有其他作用。
对科学家来说具有说服力的研究证据,对公众或决策者来说往往没有那么令人印象深刻。奥林匹克竞赛的任务具有很好的表面效度;其复杂性和新颖性吸引着有天赋的青少年,并引起公众的兴趣。与心理测试相比,作为识别天赋的一种工具,思维奥林匹克竞赛具有更好的公众形象,但可能具有更具争议性的科学背景。