哇,好可爱的统计学

文摘   2024-08-03 11:31   上海  

什么时候你会觉得一门学科很可爱呢?我想,当你发现它不仅能够解答你的疑惑,还能以一种让你感到愉悦和新奇的方式呈现知识时,这门学科就变得非常可爱了。

统计学,本科时候系统学习过,现在也每天都在使用,但说实话当初学习它的时候知道它很有用,但没觉得“可爱”。当然,也不能只拿“可爱”当去评价一个学科或一门课程,但这愉悦的感觉确实很棒。

不知道大家对统计中的“偏度”(skewness)是怎么理解的,下面是四种分布的图,第一行表示正态分布(两侧对称)和均匀分布(数据频率近似相同)不难区分。

如果数据不是对称分布的,那就是偏态分布。第二行是偏态分布图,但右偏态(左图)和左偏态(右图)容易让人弄混,“大头”在左边的不是左偏态而是右偏态,同样,“大头”在右边的是左偏态。

当记混几次之后,你意识到了不能看“大头”,而是要看“尾巴”,尾巴在左边就是左偏态,尾巴在右就是右偏态。这时候勉强记住了,如果这时候有人来告诉你另外一种记忆方法:

左偏态就类似于左边的脚趾,右偏态就类似于右边的脚趾。

这个记忆方法就很有趣,虽然和分布的本质没啥关系,但确实让人耳目一新,你一看自己的脚趾,嘿,还真挺像:

类似的例子还有关于抽样分布的表示:

我们要考虑样本均值的分布情况,上图的最右边的表示是不是很形象,一下子就记忆住了。

上面的两个例子取自我这两天正在看的《基础统计学(第14版)》,这本书连续25年在美国统计类教材中排名第一,是一本很经典的书了。已经至少14版了。

这本书的整体内容确实在我看来不是很难,全书中文版有475页,第1-3章着重介绍描述统计学;通过第4-6章的概率分布逐渐过渡到第7-9章的推断统计学;第10-15章介绍了现代统计学中一些重要的实践方法,例如回归分析、拟合优度、方差分析、非参数检验等。

但解释非常通俗易懂,案例也很新颖。

下面是几个书中的案例:

  • 用相机对海豹称重;
  • 总统的身高与其主要对手的身高;
  • 硬币的质量与制造年份;
  • 比较迪士尼乐园热门游乐项目的等候时间;
  • 求成年人认为其见过或遇到过贵的概率;
  • 一扇门的高度应该是多少;
  • 如何调整波音737飞机的座椅宽度;
  • 少于30%的成年人有过梦游吗;
  • 人们会谎报体重吗;
  • 接种疫苗与自闭症之间是否有关系;
  • 车型与头部损伤之间的关系;
  • 打哈欠会传染吗;
  • 质量好的智能手机售价更高吗;
  • ...

怎么写着写着感觉像是在写书籍推荐文,我的本意只是想分享我的阅读感受啊。说实话上述例子看上去就很吸引人,看了解释之后又觉得统计学真有用。比如“如何调整波音737飞机的座椅宽度”这个案例,

美国航空公司使用的是主舱有126个座位的波音737飞机。为了节省空间,工程师考虑将座椅宽度从16.6英寸缩小到16.0英寸(数据来源:《应用人体工程学》期刊)。成年男性的臀部宽度服从均值为14.3英寸,标准差为0.9英寸的正态分布。

问题1:随机选取一个成年男性,试求其臀宽大于座椅宽度16.0英寸的概率

所求的是来自正态分布总体的单一的值。因此,我们需要求图6-23(a)中阴影区域的面积。

  • 使用统计软件:可求得阴影面积为0.0295。
  • 使用表:先将16.0英寸的臀宽转换成对应的z分数,计算如下:
    再查询表,得到z=1.89的左侧累积面积为0.9706,因此阴影面积为 

问题2:假设126个主舱位全部被男性坐满,试求他们平均臀宽大于16.0英寸的概率

因为是来自126个男性样本的均值,所以需要应用中心极限定理。

只有当原始总体呈正态分布或样本量n>30时,才能使用正态分布。由题意得知样本量大于30,因此样本均值呈正态分布。

因为我们处理的是样本均值的分布,所以必须用到参数  和 ,计算过程如下:

接下来需要求出图中阴影区域的面积(注:图不是按比例绘制的。如果按真实的比例绘制图6-23(b),阴影区域将不可见,并且正态曲线将更薄、更高)。

  • 使用统计软件:可得所求的阴影面积为0+,一个非常小的正数。
  • 使用表:先将样本均值16.0英寸转换成对应的z分数,计算如下:

得到z=17.00的左侧累计面积为0.9999,因此阴影面积为0.0001,126个成年男性的平均臀宽不太可能超过16.0英寸。


对于统计问题而言,很多都是流程化的东西,给出流程图是非常方便理解的,比如求p值得步骤:

假设检验的总结模板:

假设检验的步骤:

这些图对读者而言都很友好。

我会建议大学生,也包括初高中学生来通过这本书入门,真的很通俗易懂;对于学过统计学的朋友不妨通过该书“温故而知新”,会获得别样的感受和新的理解,因为我就是这么感觉的。(作者:王海华)

不过这本书也有和我国学习者习惯不一致的地方,那就是单位。一个是长度度量单位,书中基本使用的是英尺、英寸之类的;另一个是温度,书中基本使用的是华氏温度。我们读者需要转换一下。

从摄氏温度转换到华氏温度

从华氏温度转换到摄氏温度

其中:

  • 表示华氏温度
  • 表示摄氏温度

最近上海都100华氏度了(将近38摄氏度)

英尺(foot,简写为ft)和英寸(inch,简写为in)是英制单位,而米(meter,简写为m)和厘米(centimeter,简写为cm)是公制单位。它们之间的转换关系如下:

  • 1 英尺 = 12 英寸
  • 1 英寸 = 2.54 厘米

因此,转换关系可以表示为:

  • 1 英尺 = 12 英寸 × 2.54 厘米/英寸 = 30.48 厘米
  • 1 英寸 = 2.54 厘米

勒布朗·詹姆斯(LeBron James)身高是6英尺9英寸(约206厘米)

总之这本书推荐给大家,挺不错的。

模型视角
一个资深数学建模爱好者的知识、视角和建模乐趣分享!主理人:王海华,数学建模教师,著有《模型,就是数学化的思维》《数学建模实战:手把手教你参加数学建模竞赛》,参编《数学建模:教学设计与案例》《高中STEM精品课程资源课例》等。
 最新文章