当我刚刚学假设检验的时候,我一直对“无法拒绝零假设”(cannot reject the null)这个表述很疑惑:当统计检验结果显著时,我们说我们可以拒绝零假设,那么当统计检验结果不显著时,我们为什么不说“接受零假设”呢?我相信很多初学者都会有这样的疑问!
但假如你能够深刻理解假设检验的一些特性,这些疑问将会迎刃而解。在今天这篇文章中,我尽量通俗地来谈谈我们为何在统计结果不显著时要这么说。
我们可以将假设检验想象成一个法庭的审判过程,在审判伊始,我们往往首先需要假定被告嫌疑人是无罪的,然后通过逐步的举证,来判断这些证据是否能够作为被告有罪的充足理由。
这个过程背后的逻辑和假设检验是相同的,在假设检验中,我们往往想要证明备择假设的内容,但我们首先需要假定零假设的内容,然后通过采样(也就是法庭中的举证),来判断这些证据是否能够作为备择假设为真的充足证据。
在法庭上,每次庭审后,如果当次例举的证据不足以构成被告有罪的充足理由,从严格的意义上,我们通常会说,我们无法对罪犯做有罪推定/我们无法拒绝罪犯无罪这个假设,而不是直接推定罪犯无罪——因为我们知道证据还没有穷尽,所以这时我们面临两种可能性:1)罪犯确实无罪;2)我们还没有看到能够推定罪犯有罪的证据。
同理,在假设检验中,我们的证据是样本,而我们知道,在99.99%的情况中,我们的样本都不能穷尽总体(不然也就不叫样本了)的所有情况,所以我们自然也没收集到所有的证据。所以,当获得一个非显著的结果时,我们无法确定造成这一结果的原因究竟是1)零假设确实为真,还是2)我们的证据还没有累积到让统计检验结果显著的程度。
如何理解这第二点呢?我们可以想象下图:
在某一次实验中,假如我们获得了某个样本平均值,但由于样本过小,所以假定的零假设抽样分布将会比较宽(样本量比较小,标准误比较大),导致了我们的观测值落在了拒绝域之外。但假如我们能够多积累一些证据/增大样本量,它将导致标准误减小,零假设分布变窄。而在这种情境下,假定我们观察到的样本平均数仍旧保持原有大小,我们最终也会因为证据的足够积累而成功拒绝零假设!这就是证据累积对统计检验结果的影响特性。
所以,通过上面的讲述,相信大家能够更好地理解“无法拒绝零假设”的措辞。事实上,与法庭不同,实证研究中的证据往往永远没有穷尽的时候(不然我们就不需要统计学了),所以我们永远无法得知非显著结果背后的原因到底是什么。
最后给自己打一波广告,上述的讨论实际上节选自我的第一本讲义《深化理解假设检验》,如果你想阅读更完整系统的探讨,或者想要获得其他类似的,令你恍然大悟的关于假设检验的深入见解,欢迎扫码购买相关的讲义对我的创作进行支持!
也希望各位读者老爷们多帮我点点赞和在看呀!!!