在瑞典一所大学有一位希尔博士,他给学生布置作业,让他们回去找一枚硬币,抛上500次,然后把正反的结果记录下来。
等学生把作业交上来之后,教授只是扫了一眼,就看出来哪些学生的作业是乱编的,根本就没有真的去抛硬币。
教授是怎么看出来的呢?
你会想,是不是这些学生的记录过于规律了,出现了明显的漏洞,完全不懂什么是随机。如果让我写出抛500次硬币的结果,那肯定都会尽量乱写,避免出现规律,比如说反正反反正正反正反正反正反反反正反正反反正反正反正反反。反正是随机的,就随便交叉编,下一个想到哪个就写哪个就好了。
而那些被看出来明显瞎编的学生们其实也是这么想的,我们对真实的概率都有误解。
如果我们真抛了500次硬币,就会发现一定会出现连续七八次都是正面,甚至连续十几次都是正面的情况,反面也是一样。如果你的记录里没有出现这种反直觉的连续,那就说明你没有真的去抛硬币。
这跟我们开头的问题类似。很多人就是不信邪,连续都开十把大了,我就不相信下一把还开大。虽然作为独立事件,每次开小的概率都是各半,但受到前10次结果的影响,孤独一掷押小,最终倾家荡产,这就是赌徒谬误。
抛10次硬币,可能10次都正面朝上。但随着抛的次数增多,正面朝上的概率会趋向50%。比如抛一万次,正面朝上和反面朝上的次数占比非常接近50%:50%。
在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。通俗地说,这个定理就是,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。偶然中包含着某种必然。
与大数定律对应的一个词叫均值回归。
均值回归是指如果一个数据和它的正常状态偏差很大,那么它向正常状态回归的概率就会变大。大数定律不会对已经发生的情况进行补偿,而是利用大量的正常数据,削弱那部分异常数据的影响。正常数据越多,异常数据的影响就越小,直到小到可以忽略不计。
比如股票价格、商品价格等社会现象,气温、降水等自然现象,无论高于或低于价值中枢(或均值)都会以很高的概率向价值中枢回归。
根据这个理论,一种上涨或者下跌的趋势,不管其延续的时间多长,都不能永远持续下去,最终均值回归的规律一定会出现:涨得太多了,就会向平均值移动下跌;跌得太多了,就会向平均值移动上升。