如果你想预测或解释某种现象,一种自然的做法是查看该现象发生时的案例。但如果你只看该现象发生时的案例,那你是在评估一种没有变化的相关性。
来看几个例子。
在 2008 年金融危机之后,大量的学者和记者想要了解如何预测未来的金融危机。他们投入了大量的时间和精力来研究历史记录,以寻找危机的模式。
马尔科姆·格拉德威尔(Malcolm Gladwell)在他的《异类》一书中,讲述成功人士的人生,寻找他们的相似之处,试图来理解成功的相关性。
美国国会在考虑改变阿富汗战略时,听取了一位学术专家的证词,他讲解了自杀式恐怖主义的相关性,对 1980 年以来的所有自杀式恐怖主义运动进行了详尽的研究,寻找共同特征。
面对你想要预测的事件,从它过去的案例中寻找共性似乎很自然。但这是一个错误的做法。
因为在“该现象是否发生”这个点上,没有变化。这就像在不考察任何民主政体的情况下,寻找专制政体的相关性。这是行不通的。
这个错误叫“因变量选择”。
因变量指的是代表你想要预测或解释的现象的变量。
这种错误之所以称为因变量选择,是因为你是根据因变量的值(例如,只看专制政体)而不是根据因变量的变化(例如,比较专制国家和民主国家)来选择研究案例。
相比书中的其他大多数章节,这一章更多围绕例子展开。这样做是有原因的。
我们发现,一旦我们解释“相关性需要变化”,人们往往会点头同意,似乎理解了。
这个表达很直白,似乎很好懂。所以很多人很怀疑:这真是什么很严重的问题吗?然而,他们自己还是会犯这个错误。
我们希望通过展示很多非常聪明的人在高风险环境中犯这种错误的例子,让你相信这是一个真实的问题。避免这种错误需要清晰的思维、真正的努力和专注。
为了了解这里的关键概念缺陷,让我们从《异类》的核心主张开始,即所谓的一万小时定律。
—
一万小时定律
天赋可能也很重要,但最最重要的是,一个伟大的成功者,必定是一个花了 1 万小时练习的人。
当然,格拉德威尔并不满足于预测成功。他认为一万小时定律可能是因果关系。如果这是真的,将产生深远的后果。
这意味着,只要练习得足够多,任何人都可能取得成功。
但谈论因果关系还为时尚早。在此之前,我们需要弄清楚格拉德威尔的证据是否足以证明 1 万小时的练习与巨大成功之间存在相关性。
“一万小时定律是成功的普遍法则吗?”格拉德威尔的答案是肯定的。
证据呢?
“如果我们深入每位伟大成功者的表面”,会看到同样的模式(第 47 页)。“事实上,每一个关于成功的故事……都能看到某人或某个团体比他们的同龄人更努力地工作”(第 239 页)。
从比尔·盖茨到披头士乐队,格拉德威尔在一个又一个案例中表明,伟大的成功者都投入了 1 万小时的时间——他得出结论,这是充分的证据,证明实践预示着成功。
让我们试着更清楚地思考一下格拉德威尔的证据。他向我们展示了什么?
当然,他并没有研究每一个伟大的成功者。但他向我们展示了,许多伟大的成就者至少练习了 1 万小时。
但最大的问题是,他没有向我们展示,那些不成功的人,情况是怎样的。
由于选择了因变量,格拉德威尔的数据在“成就”这个变量上缺乏变化。
如果你想知道 1 万小时练习是否与成功相关,仅仅观察到大多数成功者投入 1 万小时的练习是不够的。
我们还需要了解那些不成功的人的练习习惯。
当然,格拉德威尔的分析确实提供了一些原本未知的信息。暂时,让我们假设格拉德威尔没有为了写书而精心挑选他的故事(尽管他确实是这么做的。他是一个讲故事的人,不是一个科学家)。
在这种情况下,我们已经了解到,大多数非常成功的人,在取得巨大成功之前都花了 1 万小时来练习。
虽然这些信息不足以衡量相关性,但格拉德威尔和他的辩护者可能会辩称,我们已经有了一种粗略的感觉,即大多数没有获得巨大成功的普通公众,并未投入 1 万小时的练习。
在这种情况下,即便他没有明确地衡量相关性,他的分析也许也已经显著改变了我们对练习和成功的相关性的看法。
在他的案例中,我们已经了解了某件事在群体中的普遍程度,“说明它在另一特定群体中的普遍程度是不同的”,也许这种做法很有用。
也许吧。但我们仍然怀疑格拉德威尔的分析是否能教会我们什么。
因为大多数人多少在某件事上投入了至少 1 万小时的练习。
安东尼(本文作者之一,Tara注)在高尔夫球场上花了 1 万小时,而他没成为泰格·伍兹(Tiger Woods)。伊森(本文作者之一,Tara注)花了 1 万小时弹吉他,他也没成为吉米·亨德里克斯(Jimi Hendrix)。
如果你在某件事上全职工作了 5 年,但并不是所在领域最成功的人,那么你就是上图右上角的许许多多的人中的一员,这些人是格拉德威尔从未考虑过的。
我们还应该记住,格拉德威尔是一个天才的故事家。
对于“安东尼赢得美国大师赛”这一极其不可能的场景,格拉德威尔可能会写一个鼓舞人心、令人信服的故事:安东尼虽然是一名全职大学教授,但多年的练习、失败和更多的练习让他完成了体育史上最伟大的灰姑娘故事(让我们梦想一下)。
但更有可能的是,安东尼将愉快地继续成为数百万人中,甚至数十亿人中的一员。
他们热爱某件事,努力工作,但从未取得巨大的成功,也从未被格拉德威尔的分析所考虑。
为了检验你的理解,让我们在另一个背景下看看格拉德威尔观点的问题。我们将重复他的确切论点,但在一个虚构的例子中,我们希望使问题更加清晰。
假设一个有 1 万人的小镇突然爆发了大量疾病。在一个月的时间里,有 500 人因同样的症状生病。
当地卫生官员希望确定疾病的原因。他们收集了 500 名病人的病史,寻找共同点。
在调查过程中,他们发现这 500 人在入院前一天都喝了同一种饮料,来源相同。
每个生病(成功)的人都喝了同样的饮料(投入了 1 万小时)。当然,喝那种饮料(练习 1 万小时)是患病(成功)的重要预测因素。
如果想知道还有谁可能会生病,我们应该调查一下这个城镇,看看还有谁喝了同样的饮料。对吧?
假设我们告诉你所讨论的饮料是自来水。疾病的“模式”表明饮料和疾病之间存在关联,现在看来是值得怀疑的。为什么?因为很多人每天都喝自来水。
的确,在我们虚构的小镇里,所有 500 个病人都喝了自来水,但 9500 个没有生病的人也是如此。
事实上,饮料和生病之间没有任何关联:100% 的病人和 100% 的健康人都喝了这种饮料。
想想所有的乐队,他们练习了无数个小时,演出了无数场,却没有成为披头士。
—
堕落青年
其最著名的创始人是当时的参议员,后来的副总统艾伯特·戈尔(Al Gore)的妻子蒂珀·戈尔(Tipper Gore)。她被普林斯(Prince)一首歌的歌词震惊后,成立了这个团体。
PMRC 声称,露骨的歌词正在腐蚀年轻人,导致自杀、性暴力甚至谋杀。他们谴责“色情摇滚”并要求在专辑上贴警示标签。
其中包括布鲁斯·斯普林斯汀(Bruce Springsteen),因为歌曲《惹火》(I’m on Fire)含有性暗示。
1985 年,参议院商务、科学和运输委员会举行了听证会。从乡村歌手约翰·丹佛(John Denver)到扭曲姐妹乐队(Twisted Sisters)的迪·斯奈德(Dee Snider),各路音乐家都对 PMRC 的立场表示了反对。
但 PMRC 占了上风。
让我们来思考一下这个论点。以下是 PMRC 顾问杰夫·林(Jeff Ling)的证词:
现在很多专辑里都有鼓励自杀、暴力报复、性暴力、为暴力而暴力的歌曲…… 这是史蒂夫·鲍彻(Steve Boucher)。史蒂夫在听 AC/DC 乐队的歌曲《神射手》(Shoot to Thrill)时去世了,用他父亲的枪对着自己的嘴开了枪...... 前几天我在圣·安东尼奥演讲。在我到达的前一天,他们埋葬了一名年轻的高中生。这个年轻人带着他的磁带盒去了足球场。他在听 AC/DC 乐队的《神射手》时上吊自杀了。
自杀在我国青少年中已经成为一种流行病。今年将有约 6000 人结束自己的生命。他们中的许多人从一些摇滚明星那里得到了鼓励,他们将死亡视为一种积极的、几乎有吸引力的选择...... 当然,AC/DC 对暴力内容并不陌生。你们都知道他们的一个粉丝,就是被指控的暗夜魔王(Night Stalker)。
杰夫的观点,是反对青年堕落的斗士们的典型观点,大致是这样的:
1. 有些年轻人的行为令人遗憾。
2. 行为令人遗憾的年轻人都听这种可怕的摇滚乐。
3. 音乐一定是令人遗憾的行为的原因
当然,谈论因果关系还为时尚早。我们将重点关注,这些证据是否表明存在相关性。
30 年前,也就是 1954 年,参议院听到了令人震惊的类似证词,是关于那一代年轻人的祸害——漫画书。
以下是神经学家和精神病学家弗雷德里克·韦瑟姆(Fredric Wertham)在参议院小组委员会作证时说的话:
纽约州的一个小镇上有一所学校,那里发生了大量的偷窃行为。不久前,几个男孩袭击了另一个男孩,把他的胳膊拧断了两处。就像漫画书里画的那样,骨头从皮肤里穿了出来。 大约 10 天后,在同一所学校,7 个男孩突然袭击了另一个男孩,把他的头撞到混凝土上。男孩失去了知觉,被送往医院,脑部遭受了脑震荡。 在同一所高中,1 年内有 26 个女孩怀孕。
主席先生,这就是我所说的伦理和道德上的困惑。我不认为这些男孩或女孩,谁和别人有很大的不同。这是无法单独解释的。 这是一种普遍的道德困惑,我认为这些女孩在受到肉体诱惑之前就受到了精神上的诱惑。当然,所有人都是非常非常资深的——不是所有人,但大多数人,都是非常资深的漫画读者,过去是,现在也是。
这种说法在当代环境中依然存在。关于电视、电子游戏或社交媒体的潜在影响,我们都听过,甚至可能说过类似的说法。
例如,在科伦拜中学(Columbine High School)发生可怕的枪击事件后,美国教育部和特勤局成立了一个联合工作组,以确定哪些因素可以使学校官员预测和预防校园暴力。
该工作组研究了1974 年至 2000 年间发生的 37 起校园暴力事件。虽然得出的结论是,并不存在一个校园枪手的统一的画像,但他们也报告了以下结论(当然也有别的结论):
1. “许多袭击者在袭击前感到被他人欺负、迫害或伤害。”
2. “大多数袭击者都难以应对重大损失或个人失败。”
3. “大多数袭击者在事发之前都有一些引起他人关注或表明需要帮助的行为。”
4.“超过一半的袭击者通过电影、视频游戏、书籍和其他媒体表现出对暴力的兴趣。”
2018 年也成立了一个类似的委员会。虽然不太关注具体的青年堕落分子,但该委员会有时也会陷入对因变量的选择。
例如,在“建议加强对品格教育的关注”这一章中,委员会指出,许多校园枪击者经历了社会孤立。
但他们没有将其与未进行过暴力活动的人的社会孤立程度进行比较:
在帕克兰枪击案发生后,多份报告显示,被指控的枪手,在枪击事件发生前的几年里,经历了被孤立和抑郁的感觉.... 以前的校园枪击事件的肇事者也有这种孤立感。 例如,一名科伦拜枪手被描述为抑郁和隐居....弗吉尼亚理工大学枪手的家人和熟人说,随着他在大四期间越来越孤立,他“对校园活动和课堂的注意力下降了”…. 桑迪胡克(Sandy Hook)的情况也是如此。
有时,委员会确实会避免选择因变量。在心理健康的一章中,他们写道:
实施大规模枪击事件的个人可能患有严重的精神疾病,也可能没有。几乎没有人口层面的证据支持这一观点,即那些被诊断患有精神疾病的人,比其他人更有可能犯下枪击案。
但没过多久,他们又回到了一种观点之中,这种观点中的相关性没有变量的变化:
美国教育部和美国特勤局的一项分析发现,多达四分之一的大规模枪击案凶手,曾接受过精神疾病治疗。这类人经常感到愤懑和极度愤怒,并有暴力报复的幻想。
并不只有这些政府报告是这样的;在青少年暴力行为发生后,此类分析似乎是不可避免的。
但是,由于我们已经看到的原因,就像上面参议院的证词一样,这些结论具有误导性。
即使每一个行为不良的年轻人都听摇滚、看漫画书或玩电子游戏,也不能在年轻人的行为与这些“堕落品”之间建立相关性。相关性需要变化。
“参与这些活动的孩子比不参与这些活动的孩子更容易有暴力倾向”,这一命题的证据必须包括对这两类孩子的比较。
如果我们想知道,假想的青少年祸害与暴力之间是否存在联系,我们就不能选择因变量。
也就是说,我们必须将暴力青少年与非暴力青少年进行比较,看看暴力青少年是否比非暴力青少年更有可能沉迷于祸害(同样,即便答案肯定,我们也不能说这种关系是因果关系)。
即使是专家也可能不会想得特明白。这意味着,这个话题尽管有不少专家意见,而我们可能依然所知甚少。
—
高中辍学生
彼时,教育的经济回报率达到历史新高,然而几乎三分之一的公立学校高中生不能如期毕业。超过 10% 的学生无法毕业。
2006 年,比尔和梅林达·盖茨基金会(the Bill and Melinda Gates Foundation)决定投入一些资源来解决这个问题。寻找解决方案的第一步,是委托进行了一项高中辍学相关因素的研究。
该报告的主旨是,高中辍学主要与你可能猜到的事情无关——家庭问题、缺乏学术准备或听摇滚音乐。更确切地说,最大的问题似乎是孩子们对教育环境不感兴趣,觉得学校很无聊。
正如报告所述,“近一半(47%)的辍学者表示,辍学的一个主要原因是课程无趣。”“近七成(69%)的受访者表示,他们没有动力或灵感去努力学习。”
不幸的是,由于相关性需要变化,就像 PMRC 和之前的反漫画书游说团体提供的证据一样,盖茨基金会的这项研究中的证据,是相当缺乏信息的。
一半的高中辍学生说他们觉得学校无趣,这并不意味着,觉得学校无趣与辍学有关。
因为相关性需要变化,所以衡量相关性必须涉及将辍学者与非辍学者的比较,以确定辍学者是否更有可能觉得学校无趣。
盖茨基金会的这项研究只关注高中辍学生,所以无法进行这样的比较。
这么说并不是我们在卖弄学问。思考一下。这本书的两位作者都上过高中。两人都没有辍学。然而,两位作者都回忆说,有些课程很无趣。难道你不觉得吗?
当然,我们的个人经历也不能构成令人信服的证据。所以,让我们看看我们是否能做得更好一点,来弄清楚,无聊的课程,是否真的是退学的一个关键预测因素。
2009 年,印第安纳大学的研究人员对高中生进行了一项全国性的调查。
这些学生中的大多数都不打算辍学,但研究人员报告称,“2009 年三分之二(66%)的受访者在课堂上,每天都感到无聊。”这一数据甚至超过盖茨基金会的“50%”。
但我们还是要小心。盖茨基金会的调查和印第安纳大学的调查在很多方面是无法比较的。他们对不同的学生群体进行抽样,提出不同的问题,且来自不同的年代。所以我们不想妄下结论。
但至少,印第安纳大学的调查应该让你担心,发现学校无聊实际上是高中生的一个非常普遍的经历,而不仅仅是那些辍学的学生。
美国教育的未来是一件严肃的事情。令人钦佩的是,盖茨基金会正在努力改善教育。但他们的研究忽略了一个关键原则:用数据清晰思考。
他们试图了解教育失败的相关性,而没有去了解失败与成功的差异。
这种方法行不通。
—
自杀性袭击
2009年,芝加哥大学教授、著名恐怖主义专家罗伯特·佩普(Robert Pape)向众议院武装部队恐怖主义小组委员会作证。
这次会议的主题是斯坦利·麦克里斯特尔(Stanley McChrystal)将军提出的,向阿富汗塔利班叛乱分子增兵 4 万人的建议。佩普是这样说的:
情况很清楚,越多的西方军队进入阿富汗,越多的当地居民认为自己处于外国占领之下,并使用自杀和其他恐怖主义来抵抗。 我对1980 年以来世界各地自杀式恐怖主义的研究表明,自杀式恐怖分子的动机不是因为存在恐怖分子庇护所,而是因为外国军队占领了他们所珍视的土地。 因此,美军正在培养反美自杀式袭击者也就不足为奇了。
这个论点听起来似乎有理。在阿富汗,美军遭到自杀式袭击者的袭击,后者希望美军离开阿富汗。泰米尔猛虎组织(Tamil Tiger)的自杀式袭击者袭击了斯里兰卡政府,认为该政府正在占领他们的家园。巴勒斯坦自杀式袭击者袭击以色列人,称他们是外国占领者。
显然,占领似乎是自杀式袭击的主要相关因素。
而我们认为,这一说法是有争议的。(例如,当奧萨马·本.拉登(Osama bin Laden)声称,应沙特政府邀请,驻扎在沙特阿拉伯的美国军队是占领军,我们确定同意他的观点吗?)
但是,为了便于论证,我们假设这个基本的事实性说法是正确的。这是否意味着外国占领与自杀式袭击之间存在关联?答案当然是否定的。相关性需要变化。
要了解自杀式袭击的相关性,你不能只研究每一个自杀式袭击的实例,然后寻找共同点。这是对因变量的选择。
你必须将有自杀式袭击的冲突与没有自杀式袭击的冲突进行比较。
在这种案例中,一个简单的做法是,查看每一个国家,然后问:被外国占领的国家比其他国家更容易遭受自杀式袭击吗?
最近的一项研究正好进行了这种比较,并发现答案是否定的。特别是,如果我们比较被占领和未被占领的国家,经历自杀式袭击可能性的差异不到1个百分点!
这是怎么回事?我们列出的所有自杀式袭击的例子都与外国占领者有关。为什么外国占领者和自杀式袭击之间几乎没有任何关联?
单凭直觉的话,我们可以想想有多少外国占领没有导致自杀式恐怖主义?
英国对爱尔兰的占领,尽管引发了长达数十年的暴力抵抗运动,却从未引发自杀式恐怖主义。西班牙的巴斯克分裂主义者打了几十年的仗,也从未诉诸自杀式袭击。
在冷战(及冷战之后)的不同时期,美国在德国、日本、韩国、格林纳达、巴拿马和海地驻扎了军队(可以说,所有这些占领都与假想的对沙特阿拉伯的占领一样多),但在这些地方甚至没有遭受过一次自杀式袭击。
如果占领预示着自杀式暴力,那么这些地方是怎么回事呢?
这个例子还有另一个很好的作用。它不仅说明了寻找相关性却不寻找变化的错误。它还展示了,如果你仅仅观察感兴趣的现象(例如自杀式袭击)来得出结论——也即, 通过选择因变量来得出结论——你会受到多么大的误导。
要了解这一点,回顾一下历史会有所帮助。
假设你从 20 世纪 80 年代初开始收集自杀暴力的数据。到 1986 年, 你会记录到 33 起自杀袭击事件,超过 1000人 死亡。
基本上,这些袭击中的每一次都是由什叶派武装黎巴嫩真主党(Shi'a militia Hezbollah)对黎巴嫩境内的美国、以色列和法国目标实施的,包括对贝鲁特美国海军陆战队军营的袭击,那次袭击造成 320 人死亡。
如果你在 1986 年发生的每一次自杀式袭击中寻找共同点,你可能会注意到它们都是由中东的穆斯林实施的。
用同和“被外国占领是自杀式袭击的主要预测因素”同样的逻辑得出的结论,你可能会得出“伊斯兰教是关键相关因素”的结论。
当然,如果你做了适当的比较,你就不会得出这个结论。世界上有很多以穆斯林为主的国家。1986年, 几乎没有一个国家发生过自杀式暴力。
此外,如果你试图预测下一次自杀式袭击可能发生在哪里,1986 年的这个结论会让你误入歧途。
1987 年, 世界目睹了泰米尔猛虎组织发动的第一次自杀式袭击。泰米尔猛虎组织是斯里兰卡的一个非宗教分裂组织,与伊斯兰教没有关系。
这次袭击标志着世界上有史以来规模最大的自杀式暴力运动的开始。
当你试图在不考虑变化的情况下建立相关性时,你可能会犯大错。
怎么样,大家有没有把“相关性需要变化”刻在脑子里啦?记住这个就能防止很多忽悠呢
Ps 本篇翻译的是第四章前半部分,开头部分有删节