很多人在工作或合作中会用到统计学,而合作对象或者客户可能完全不懂统计学,这时候我们该如何向对方解释清楚最基本并且最常用的统计学概念——p值呢?
首先解释清楚这篇文章的一些情景限定:虽然对方不懂统计学,但我们应该假定对方有基本的逻辑思考能力和语言理解能力。如果对方在这两方面的能力有欠缺,那讲再多也是白搭。毕竟本文讲的是如何沟通统计学概念,而非如何让人变聪明。
实际的情景中,可能存在很多情况,不满足这一前提,所以请大家灵活甄别情境和使用正确的策略。
我们先给出一个研究实例,然后基于研究实例来聊聊如何进行p值的解读和沟通。假如你现在在为腾讯公司的微信公众号相关部门工作,领导想要测试新的推流算法对创作者的激励效果,就随机选定了一部分新的创作者,对他们采用新的推流算法,然后让你根据相应的创作指标来检验新的推流算法是否显著提升了创作者创作热情和创作行为。
根据领导的需求,你做了相关的统计检验,获得了0.04的p值,这时你该如何向老板解释这个p值的含义呢?我们接下来分别给出三个版本,依次为低手版,中手版和高手版。
低手版:
老板,这个p值测量了差异的显著性,一般阈限值定为0.05,小于0.05就代表差异显著。我们的检验p=0.04,说明新的推流算法确实能够显著提升创作者的创作热情和创作行为。
中手版:
老板,这个p值可以理解为:假如新推流算法没有效果,我们观察到当前结果(或者更极端的结果)的一个大致概率。然后你看,我们的p值告诉我们,如果新推流算法确实没有效果,那么我们观察到当前的结果(或者更极端的结果)将会是一个小概率事件,概率为4%。所以反过来,我们可以推测新推流算法其实是有效果的,它能够提升创作者的创作热情和创作行为!
中手版已经是一个比较标准的版本了,把p值的意思通过大白话和老板基本沟通清楚了。但如果你的老板比较犀利,他这时候可能会问以下两个问题:
1. 这个“观察到当前结果的大致概率”,到底是什么?如何理解这个概率?
2. 我们现在反过来推定新推流算法是有效果的,那么我们这个结论错误的概率是不是也是4%呢?
如果你的老板或合作者完全没有学过统计学,却问出了如上的问题,那么恭喜,你拥有一个极其优秀的老板/合作者,具有很强的洞察力和学习能力。
那么,现在你就得化身统计学的高手,来回答上述两个问题。
高手版:
首先,概率可以这样理解:假如新的推流算法没有效果,然后我们严格重复测试这个新推流算法1000次,p值告诉我们只有1000*0.04,也就是40次我们会观察到当前结果(或者更极端的结果)。
其次,我们结论错误的概率并不是4%。这里我们需要注意,p值代表的是:假如新的推流算法没有效果,观察到当前结果(或更极端结果)的概率;而结论错误的概率展开来讲其实是:在我们观察到当前结果(并作出推流算法有效果结论)的前提下,新的推流算法没有效果的概率。在这两个论述中,前提和结论是相反的,它们描述的事件也是不同的,概率自然不同。
你的老板如果学过概率论,就会知道你现在在说P(A|B)≠P(B|A)。但如果他没有学过概率论,这时候一脸懵逼不知道你在说什么,你该怎么办呢?
首先,你可以让老板把上述p值代表的含义和错误结论的概率含义写在纸上,让他直观地看到二者的不同,也就是结论和前提是相反的。接下来,你可以给他举一个例子:
我们现在有一枚硬币,我们想知道这枚硬币是否均匀,于是我们就把这枚硬币抛了十次,逐一记录十次抛硬币的结果,均为正面!
这时,我们可以构想两个概率,一个是这枚硬币均匀的前提下,我们抛十次都是正面的概率,这个就对应了p值;一个是当我们抛十次都得到正面的情况下,这枚硬币均匀的概率,这个就对应了结论错误的概率。它们二者是不同的。
老板可能这时还很懵,那你可以再花点时间给老板解释:
第一种概率是可以用数学公式算的,中学数学水平的人就会做,它是一个纯理论的概念,它的计算方式是永远不会变的;第二种概率所指涉的却不同,假如现在我告诉你这枚硬币是一个工艺极其纯属的硬币加工厂生产的,他们的硬币均匀率为99%,然后在另一个平行世界里,我却告诉你这枚硬币是我自己手搓的第一枚硬币。这时,在这两个平行世界之间,你是不是能感受到同一个概念所对应的概率值发生了变化?
当然,大多数人不会问到这一层,很多应用统计方法的人也没有领悟到这一层,所以我个人觉得,在进行与非专业人士的统计沟通时,能够把“中手版”的沟通融会贯通,就可以了!
如上,就是本文的全部内容!如果你觉得对你有帮助的话,欢迎点赞+在看+转发三连,你的支持是我更新最大的动力!