点击蓝字,关注我们
数据分析软件 | JMP
今天的文章将通过一个抛硬币的小案例,介绍假设检验在决策中的作用,帮助您理解假设检验在日常工作中的应用,例如产品缺陷率的估计,对于质量管理将会有一些思路上的帮助~
本文作者
杨老师 - JMP 数据分析师
在生活的许多时刻,当决策变得艰难时,我们通常会抛硬币来辅助决定。大多数人认为这种方法很公平,毕竟硬币正反两面出现的机会看似各占 50%。但事实真的如此吗?
让我们来看看历史上的一个有趣的小故事:
英国数学家 John Kerrich 在二战期间被囚禁在丹麦的一个纳粹战俘营中。
为了打发时间,他进行了一系列概率实验,其中包括抛硬币 10000 次。
结果是 5067 次正面和 4933 次反面。
这听起来像是个公平的游戏,不是吗?
但等等,让我们使用 JMP 软件来进行更深入的分析。我们都知道,在理想情况下,“公平”的硬币意味着正反两面出现的概率应该是相同的。让我们把这 10000 次的试验结果输入到 JMP 中,进行单样本比例检验。
即使你是统计学的新手,也不必担心,这个过程非常容易。
使用 JMP 进行单样本比例检验
首先,我们将试验结果记录到数据表中(如下表所示)。
1
数据分布
接下来,点击“分析”>“分布”,选择“结果”作为“Y,列”,“计数”作为“频数”,然后点击“确定”。为了更直观的展示,选择“分布”旁边红色三角形下的“堆叠”选项,以获得水平布局的图形。
让我们看看结果:样本中正面和反面的数量大致相同,这让硬币看起来像是公平的。
2
置信区间
为了进一步验证,我们在报表中点击“结果”旁边的红色三角形,并选择置信区间为 0.95。95% 的置信区间显示,正面出现的最可能概率范围是 0.4969 到 0.5165。
虽然这些数据似乎与我们对一个公平硬币的期望相符,但我们还不能就此断定硬币确实是公平的。为此,我们需要进行单样本比例检验,实际上就是拟合优度检验。
3
单样本比例检验
下面分别是其原假设和备择假设:
H0 :硬币是公平的。
Ha :硬币不是公平的。
我们在报表中点击“结果”旁边的红色三角形,并选择“检验概率”。在正面和反面的假设概率栏中输入 0.5,选择“概率不等于假设值(双侧卡方检验)”的选项,然后点击“完成”。
操作过程
最后,两个检验给出的 p 值是 0.1802。这意味着我们没有足够的证据来证实这个硬币是不公平的。
样本量的重要性
样本量对于统计检验来说极为重要。就像我们不会仅凭一个人的推荐就断定一家餐馆的好坏一样,我们也不能仅仅依赖几次试验的结果。想象一下,如果你只听了一个朋友的建议就决定去某家餐厅,结果发现食物并不合口味,那你可能会觉得被误导了。同理,在统计学中,一个基于大样本量的结果通常比小样本量更可信。
以掷硬币实验为例,假设两次实验中出现正面的比例都是 51%,我们需要验证这一比例是否显著大于 50%。
在第一个实验中,样本量为1000(510正面/1000 次),p 值=0.274>0.05,这意味着我们无法拒绝原假设,即尽管正面比率达到了 0.51,但这并不足以证明其显著地超过 0.5。
样本量 = 1000
然而,当样本量增大至10000(5100 正面/10000 次)时,情况发生了变化。对于同样的检验问题,检验结果变得显著。
样本量 = 10000
这说明,统计学不仅仅关注百分比结果,更关注这些百分比背后的样本量,只有理解了样本量的大小,我们才能正确解读统计数据。
应用拓展
单样本比例检验的应用领域极其广泛,尤其在质量控制方面发挥着关键作用。
以手机零部件制造为例,假设一家制造商希望确定某批次零部件中的缺陷比例是否低于 5%。为此,他们设定了一个原假设:假定缺陷部件的比例至少为 5%。接着,他们从该批次中随机抽取 500 个零部件进行检验,并发现其中有 15 个存在缺陷。
为了进行严谨的统计分析,制造商使用了显著性水平为 0.05 的单样本比例检验,并计算出了 p 值 0.0199。由于这个 p 值小于预定的显著性水平,他们有充分的理由拒绝原假设。
因此,制造商得出一个重要结论:这批零部件中的缺陷比例确实显著地低于 5%。
操作过程
看到这里,你是不是也觉得统计学既有趣又实用呢?下次当你再次掷硬币做决定时,或许会想到背后隐藏的统计学原理哦!
JMP官方微信公众号
敏捷分析 成就无限
分享
收藏
点赞
在看
点击“阅读原文”,立即下载 JMP 试用版~