剖析归纳逻辑可知,频率观点通常包括连续性假设。连续性假设意味着一切规律都能稳定和永久地运行,不会有意外事件发生打破这个规则。
但是,世界的运行往往事与愿违。例如,每天早上9点,你都要喂火鸡,火鸡感到很幸福,因为有人愿意一直养它。直到感恩节那一天,所有的历史经验都化为乌有,它被宰了,跟所有的历史经验都不一样。这也引发了对频率派的尖锐批评,涉及频率解释本身,许多问题和投掷硬币是完全不同的,是一次性的或不连续的,在严格相同甚至大致相同条件下重复进行实验是不现实的。
在相对可靠的自然科学里,人类与“上帝”较量:宇宙的设计是有蓝本的,“上帝”不会轻易改变规则。虽然人类还没有找到“大统一”的物理理论,但由自然科学规律描述的宇宙运行方式基本是固定和可靠的。
但在社会科学中就不同了,以金融学为例,人类与“上帝创造的”人类较量:人们按照自己的想法为资产定价,而这些想法几乎每天都在改变。在这里,人类的行为是很难理解的。在自然科学中,可以重复进行实验,一次又一次地验证同一个理论,但在金融学中,没有严格一致的平行宇宙供人们一次又一次地展开相同的实验,因此很难研究其客观规律。
数理经济学家就反复说数理经济学的困境在于变量太多。米塞斯认为,真实的情况是只有变量,没有常量,在没有常量的情况下谈论变量是没有意义的。这里并不存在重复实验的基础。2015年,发表在《科学》上的一篇文章指出,回顾270名心理学家在5个国家重复进行的100项经典的心理学实验,结果发现74%的实验结果都无法重现。
人类社会不是物理化学,复杂程度导致其无法在严格受控的条件下进行可重复的实验,因此也很难推出客观规律。在许多情况下,频率解释完全没有现实意义。
在抽象的科学世界中,思考严格的概率很多,使得人们有一种倾向:当他们转向现实世界的实际问题时,也更加倾向于用频率来思考概率。
当查尔斯•达尔文1835年9月第一次登陆加拉帕戈斯群岛时,他不知道在那里会发现多少种不同的新植物。在检查了122个标本,发现它们可以分为19个不同的物种之后,他面临的问题是,继续收集植物样本还是停止收集植物样本。因为继续收集植物样本不太可能学到更多的东西。真正的问题是,其他尚未被发现的新物种被发现的可能性有多大?
这里要求在建立数学模型时对现实世界做出预先判断。单凭朴素的频率观点无法做到。频率观点的局限性使它更适合解决概率可以解决的问题的一个子类,为了应对全新的问题,必须发明全新的方法。
频率解释的根源是把样本放在无穷多可能值的背景下去考察,这有点像平行宇宙的设想,不仅要考虑现有发生某种情况的宇宙,还要顾及可能发生但其实没有发生某种情况的宇宙。频率派学者经常会说这样的话:在95%的平行宇宙中,出现了我们观察到的同样的现象。但是对于统计学家来说,接受这种世界观并不容易,他们会想,我为什么要关心其他宇宙的情况呢?我只在乎自己所处的宇宙中的这一种现实的情况,毕竟这才是我的人生。
在频率派学者看来,频率是观察到的历史情况,概率是要建立的模型。频率派的数学建模往往很简单,通常只考虑一个概率模型F(一个分布),并选择一个算法t(如考察均值的算法),而这种简单和灵活性恰恰又代表着频率派的一个缺陷:单纯对频率的信仰并不能帮助我们选择合适的算法来解决实际问题。
例如,我们在观察国民收入统计数据时,即便不清楚真实的概率分布(如Pareto分布80/20),也必须通过样本的估计量(如平均值)获得一些概率的性质(如真实的收入分配情况)。问题是,在收入分配这个特定的题目里,我们应该用样本均值来估计这个特定的分布吗?在数学上已经证明了,Pareto分布作为一类“偏态”肥尾分布,要比样本均值这种统计量更适合描绘收入分配规律,如果直接套用样本均值来描绘收入分配规律,会造成严重低估并误导大众和政策制定者。
Pareto分布的概率密度函数图像。
α越小,尾部越肥。
统计推断往往涉及两步,第一步确定收集的数据是否支持理论。如果支持,则进行第二步,即评估自变量对因变量(与模型/ 理论相关的参数)的影响程度。在缺少对世界的本质认知的情况下,我们怎么知道自己是否选取了最合适的模型和算法呢?总之,频率主义不能算是统计推断的一个无懈可击的思想,在频率主义的边界内,其仍然存在着不可调和的矛盾。
本文内容来自徐鸿鹄《统计信仰:驾驭无序世界的元认知》,做适当修改并添加图片,供学习参考。