CICC科普栏目|万物皆可统计学?每个人都应学点统计学

科技   2025-01-30 17:07   北京  

日常生活中的统计学

当今社会完全被数字所统治。无论你看到什么,数字都无处不在,从广告牌上展示特定航空公司的准点统计数据,到体育节目讨论即将到来的足球比赛的拉斯维加斯赔率。晚间新闻充斥着关于犯罪率、垃圾食品爱好者预期寿命和总统支持率的故事。在正常的一天里,你可能会碰到5、10,甚至20个不同的统计数据(在选举之夜可能会更多)。仅仅通过仔细阅读一份周日报纸,你就会在报告、广告和涵盖从汤到坚果的文章中遇到成百上千个统计数据。
在这一章中,我将讨论在你的生活和工作中经常出现的统计数据,并探讨统计数据如何呈现给普通大众。阅读完这一章后,你会意识到媒体是如何频繁地向你灌输数字的,以及理解这些数字的含义有多么重要。不管你喜欢与否,统计学是你生活中的重要组成部分。所以,如果你无法战胜它们,就加入它们吧。如果你不想加入它们,至少试着去理解它们。

统计学与媒体:问题多于答案?

打开一份报纸,开始寻找涉及数字的文章和故事的例子。不久之后,数字就开始堆积起来。读者被研究结果、突破性公告、统计报告、预测、图表和摘要淹没。统计学在媒体中的出现频率让人难以置信。你可能甚至没有意识到,如今你经常受到多少次数字的冲击。
这一部分仅从我前几天读到的一份周日报纸中挑选了一些例子。当你看到统计数据在新闻中报告得如此之频繁,而却没有提供你所需的所有信息时,你可能会感到紧张,不知道还能相信什么,不能相信什么。放松!这就是这本书的目的——帮助你辨别好的信息和坏的信息。

探究爆米花问题

我看到的第一篇涉及数字的文章是《爆米花工厂面临健康调查》,副标题是:“生病的工人表示风味化学物质导致肺部问题。” 文章描述了疾病控制与预防中心(CDC)对微波爆米花香精化学物质暴露与某些阻塞性肺病例之间可能存在的关联表示关注。仅一个爆米花工厂就有八名工人患上了这种肺病,其中四人正在等待肺移植。
根据文章,其他爆米花工厂也报告了类似的病例。现在,你可能会想知道,那些吃微波爆米花的人怎么样了?根据文章,CDC认为“没有理由认为吃微波爆米花的人有什么可担心的”。
下一步是更深入地评估员工,包括进行调查以确定他们的健康状况和可能的化学物质暴露,检查肺活量,并进行详细的空气样本检测。这里的问题是:这种肺病的多少例构成真正的模式,与仅仅是偶然或统计异常相比如何?

冒险涉足病毒

第二篇文章讨论了最近的一次网络攻击:一种类似蠕虫的病毒通过互联网传播,在全球范围内减缓了网页浏览和电子邮件传递的速度。有多少台计算机受到了影响?文章中引用的专家表示,有39,000台计算机受到了感染,它们又影响了数十万其他系统。
问题:专家们是如何得出这个数字的?他们检查了每台计算机,以确定是否受到了影响吗?文章在攻击发生后不到24小时就写成了这样,这表明这个数字是一个猜测。那么为什么说是39,000而不是40,000呢?是为了使其看起来不那么像猜测吗?要了解更多关于如何自信地进行估算(以及如何评估他人的数字),请参阅第13章。

理解交通事故

接下来的报纸是关于摩托车致命伤亡人数急剧上升的警告。专家表示,摩托车手的致死率——每10万辆注册车辆的死亡人数——一直在稳步上升,这是由美国国家公路交通安全管理局(NHTSA)报告的。在文章中,对摩托车致死率上升的许多可能原因进行了讨论,包括年龄、性别、发动机大小、驾驶员是否持牌、酒精摄入以及州内的头盔法规(或缺乏法规)。报告非常全面,展示了各种表格和图表,具体标题如下:
  • 摩托车手的死亡和受伤情况,按年份、每万辆注册车辆和每亿车英里的死亡和受伤率
  • 各州按摩托车手的死亡人数、头盔使用率和血液酒精含量划分
  • 按车辆类型(摩托车、乘用车、轻型卡车)每万辆注册车辆和每亿车英里的乘员死亡率
  • 按年龄组划分的摩托车手死亡人数
  • 按发动机大小(排量)划分的摩托车手死亡人数
  • 在致命交通事故中涉及的驾驶员的先前驾驶记录(包括先前的交通事故、酒驾定罪、超速定罚、驾照停吊)
  • 酒精影响下的摩托车手在一天中的交通事故中死亡的百分比,包括单车事故、多车事故和总事故
这篇文章非常详细,并提供了大量关于美国摩托车致命伤亡和受伤情况的详细信息。然而,大量的表格、图表、率、数字和结论可能让人感到不知所措和困惑,容易让你忽略整体情况。通过一些实践和第二部分的帮助,你将更能够理清图表、表格和所有相关统计数据。例如,当你看到率与计数(如死亡率与死亡人数)时,会涉及一些重要的统计问题,如果在更适当的情况下使用率,计数可能会给你提供误导性的信息,这是在第3章中讨论的。

思考医疗事故

报纸上的进一步报道涉及一项关于最近的医疗事故保险的研究:医疗事故案例在医生收费和患者获取所需医疗服务方面产生影响。文章指出,乔治亚州有五分之一的医生因该州不断上升的医疗事故保险费用而停止进行风险程序(如接生)。这被描述为在全国范围内的“国家流行病”和“健康危机”。文章包含了研究的一些简要细节,并指出,在对2,200名乔治亚州医生进行的调查中,预计其中约18%的医生,即2,800名医生,将停止提供高风险的程序。
等一下!那不可能是对的。在2,200名医生中,2,800名不执行程序,这代表18%?那是不可能的!分数的分子不可能比100%还大,对吧?这是媒体统计错误的许多例子之一。那么真正的百分比是多少?从文章中无法得知。第5章详细介绍了计算统计数据的细节,使你能够知道要查找什么,并立即发现某些情况不对。

强调土地流失

同一份周日报纸中有一篇关于美国土地开发和投机程度的文章。了解你所在地区可能建造多少房屋是一个重要的问题。文章提供了每年失去的农田面积的统计数据。为了进一步说明失去的土地有多少,还以橄榄球场为单位列出了该地区的面积。在这个特定的例子中,专家表示,俄亥俄州中部每年失去15万英亩,相当于234平方英里,或115,385个橄榄球场(包括两端区域)。人们是如何得出这些数字的,它们有多准确呢?以及以橄榄球场的数量来形象化土地流失是否有帮助?我在第16章更详细地讨论了数据收集的准确性。

审视学校

报纸上的下一个主题是学校的熟练程度——具体来说,额外的学校课程是否有助于学生表现更好。文章指出,在这个特定的区域,参加额外课程的学生中有81.3%通过了写作熟练测试,而只有71.7%没有参加额外学校课程的学生通过了测试。但是,这是否足够说明每年38.6万美元的开支?在这些课程中发生了什么,导致了学生的进步?参加这些额外课程的学生是不是花更多时间准备这些考试,而不是学到更多有关写作的知识呢?
这里有一个重要的问题:参加额外课程的学生是否是自愿者,可能比普通学生更有动力尝试提高他们的考试成绩呢?文章没有说明。
研究各种形式的调查
调查和民意调查是当今媒体用来吸引你注意力的最显眼的机制之一。似乎每个人都想进行调查,包括市场经理、保险公司、电视台、社区团体,甚至是高中课程中的学生。以下是当今新闻中一些调查结果的例子:
随着美国劳动力的老龄化,公司正在规划他们未来的领导层。(他们怎么知道美国劳动力在老龄化,如果是的话,老龄化程度是多少?)最近的一项调查显示,近67%的人力资源经理表示,在过去五年中,规划继任已经比过去更为重要。调查还表示,210名受访者中有88%表示他们通常或经常通过内部候选人填补高级职位。但是有多少经理没有回应,而210名受访者真的足够多,值得在商业版面的头版上报道吗?不论你信不信,当你开始寻找它们时,你会在新闻中找到许多例子,这些调查基于比210名受访者更少的参与者。(然而公平地说,有时210名受试者实际上在某些情况下可能是一个足够多的样本量。关于样本大小何时足够大以及回复者的百分比何时足够大的问题在第16章中得到了详细解释。)
一些调查是基于当前的兴趣和趋势的。例如,最近的Harris Interactive调查发现,近一半(47%)的美国青少年表示,没有手机他们的社交生活将结束或变得更糟,57%的青少年甚至说他们的手机是他们社交生活的关键。研究还发现,42%的青少年表示他们可以盲目发短信(你真的如何测试这个?)。然而,请保持清醒,这项研究并未告诉你实际有多少百分比的青少年拥有手机,以及这些青少年在人口统计特征上与没有手机的青少年相比有何不同。并且请记住,关于这类主题的数据并不总是准确的,因为被调查者可能倾向于给出偏见的答案(谁不想说他们可以盲目发短信呢?)。有关如何解释和评估调查结果的更多信息,请参阅第16章。
这样的研究经常出现,要知道该相信什么,唯一的方法就是了解要提出什么问题,并能够评价研究的质量。这就是统计学的一部分!好消息是,通过提出一些明确的问题,你可以迅速评价统计研究及其结果。第17章将帮助你做到这一点。

研究体育

体育版块可能是报纸中数字最丰富的部分。从比赛得分、每支球队的胜负比例到每支球队的相对排名,体育界报告的专业统计数据深入到需要穿过胶鞋才能理解的地步。
例如,篮球统计数据按照球队、每个季度和每个球员进行细分。对于每个球员,你都能得到上场时间、投篮命中数、罚球命中数、篮板、助攻、个人犯规、失误、盖帽、抢断和总得分等信息。
除了球员的母亲,还有谁需要了解这些东西呢?显然有很多球迷需要。统计数据是体育迷永远无法满足的东西,而球员们常常不愿听到这些。统计数据是水龙头边讨论的素材,也是世界各地坐在沙发上的四分卫的动力。
幻想体育也对体育产业产生了巨大影响。幻想体育是一种参与者扮演业主的游戏,他们可以从现有职业联赛的球员中组建自己的团队,然后彼此竞争。竞争基于球员和团队的统计表现,由“联盟专员”制定的规则和已建立的积分系统进行测量。根据幻想体育贸易协会的数据,参与幻想体育的12岁及以上的人数超过3000万,年度支出为30至40亿美元。(即使在这里你也可以问问这些数字是如何计算的 — 问题永远没有止境,不是吗?)

业务新闻的投资

报纸的商业版提供了有关股市的统计数据。一个星期市场下跌了455点;这个下跌是多还是少?你需要计算一个百分比来真正了解这个问题。
我所看到的报纸的商业版包含了全国各种存款证书(CD)的最高收益报告。(顺便问一句,他们怎么知道这些收益是最高的?)我还发现有关30年期固定贷款、15年期固定贷款、1年期可调利率贷款、新车贷款、二手车贷款、家庭股权贷款以及从你的祖母那里贷款(实际上并不是,但如果奶奶看到这些统计数据,她可能会提高她慷慨的利率)的报告。
最后,我看到了许多心爱的信用卡广告 —— 广告列出了利率、年费和结算周期天数。你如何比较有关投资、贷款和信用卡的所有信息,以做出明智的决策?哪些统计数据最重要?真正的问题是:报纸中报告的数字是否给出了整个故事,还是你需要进行更多的侦探工作以找到真相?第16和17章帮助你开始剖析这些数字并对其进行决策。

游览旅游新闻

即使你转向旅游部分,也逃不过数字的轰炸。例如,我在那里发现,交通安全管理局响应中心(平均每周接到大约2,000通电话、2,500封电子邮件和200封信件 —— 你愿意去数所有这些吗?)收到的最常见的问题是:“我能带这个上飞机吗?”这可能涉及从动物到婚纱到一个巨大的爆米花罐的任何东西。(我不建议带爆米花罐。你必须将其水平放置在行李舱中,由于在飞行过程中东西会移动,罐盖很可能会打开;而当你在飞行结束时去取你的罐时,你和你的座位邻居可能会被淋湿。是的,我曾经见过这种情况发生。)
在这种情况下报告的响应数量引发了一个有趣的统计问题:在一天中的不同时间,需要多少操作员来处理那些电话、电子邮件和信件?估计预期通话数量是你的第一步,而估计错误可能会让你付出代价(如果你高估了它)或者会导致很多负面公关(如果你低估了它)。这些统计挑战在第13章中得到解决。

解读天气预报

天气预报提供了大量的统计数据,包括第二天的最高和最低温度预测(他们是怎么确定是16度而不是15度的呢?),以及当天的紫外线指数、花粉计数、污染标准指数,以及水质和水量报告。(他们是如何得到这些数字的 —— 是通过采样吗?他们取多少样本,以及样本是在哪里取的?)你可以随时随地了解世界各地的实时天气。你可以获得未来三天、一周、一个月甚至一年的天气预报!气象学家每天收集和记录大量关于天气的数据。这些数字不仅帮助你决定是否要带伞上班,而且还帮助气象研究人员更好地预测长期天气预报,甚至随着时间的推移全球气候变化。
即使在天气研究人员拥有的所有信息和技术的支持下,现如今天气预报有多准确呢?考虑到你被告知是晴天而实际上却下雨的次数,似乎他们在这些预报方面仍有工作要做。但事实上,大量的数据显示,影响天气的变量几乎是令人难以置信的,不仅对你来说是这样,对气象学家来说也是如此。
统计计算机模型在预测主要与天气相关的事件(如飓风、地震和火山喷发)方面发挥着重要作用。科学家们在能够在龙卷风开始形成之前预测它们,或者在哪里和何时飓风将登陆方面仍有一些工作要做,但这确实是他们的目标,并且他们在这方面不断取得进展。有关建模和统计学的更多信息,请参阅第18章。

电影的沉思

继续看艺术版块,我看到了一些当前电影的广告。每个电影广告都包含某些电影评论家的评论:“两个大拇指!”、“我们时代的至高冒险”、“绝对搞笑”或“年度十佳影片之一!” 你关注评论家的评价吗?你如何确定要去看哪部电影?专家说,虽然一部电影在上映初期可能会受到评论家评论(好或坏)的影响,但口碑是影响一部电影在长期内表现如何的最重要因素。
研究还表明,一部电影越戏剧性,爆米花的销量就越大。是的,娱乐业甚至还关注你在电影院吃爆米花的量。他们是如何收集所有这些信息的,以及这会对电影的类型产生什么影响?这也是统计学的一部分:设计和开展研究,帮助确定受众并了解他们的喜好,然后利用这些信息来指导产品的制作。所以下次有人拿着剪贴板问你是否有一分钟,你可能会想要站起来并亮明立场。

突显星座运势

那些星座运势:你读过它们,但你相信吗?你应该相信吗?人们能否比仅仅靠偶然更频繁地预测会发生什么?统计学家有一种办法可以找出答案,他们使用一种被称为假设检验的方法(详见第14章)。到目前为止,他们还没有找到任何可以读心的人,但人们仍然在不断尝试!

应用统计学在工作中

现在放下周日的报纸,转而投入到日常工作的繁忙中。如果你在会计公司工作,当然数字是你日常生活的一部分。但对于像护士、肖像摄影师、店长、报社记者、办公室工作人员或建筑工人这样的人呢?数字在这些工作中起到了作用吗?当然有。本节为你提供一些统计学如何渗透到每个工作场所的例子。
你不必走得太远就能看到统计学如何在你的生活和工作中来回交织。关键在于能够确定这一切意味着什么,你可以相信什么,并且能够基于数字背后的真实故事做出明智的决策,以便处理并适应日常生活中的统计数据。

接生婴儿——和提供信息

苏在大学医院的分娩部门夜班工作。她在一个晚上照顾几名患者,并尽力满足每个人的需求。她的护理经理告诉她,每次她上班时,应该向患者介绍自己,在患者的房间白板上写下自己的名字,并询问患者是否有任何问题。为什么呢?因为每名母亲带着她的宝宝离开几天后,医院都会给她打电话,询问对护理质量的评价,有什么遗漏之处,可以做些什么来改善服务和护理质量,以及工作人员可以做些什么来确保患者选择这家医院而不是城里的其他医院。例如,调查显示,知道护士姓名的患者比不知道护士姓名的患者在医院更感到舒适,提出更多问题,并有更积极的体验。苏的薪水涨幅取决于她满足新母亲需求的能力。毫无疑问,医院还进行了大量研究,以确定质量护理的因素,远远不止护士与患者的互动。(有关医学研究的详细信息,请参见第17章。)

摆姿势拍照

卡罗尔最近开始在一家百货公司的肖像工作室担任摄影师;她的优势之一是与婴儿一起工作。根据客户多年来购买的照片数量,这家商店发现人们购买的摆拍照片比看起来更自然的照片更多。因此,商店经理鼓励摄影师拍摆拍的照片。
一位母亲带着她的宝宝进来,并提出一个特殊的请求:“你能不能不要刻意地摆拍我的宝宝?我只是希望他的照片看起来自然。”如果卡罗尔说:“对不起,不能这样做。我的加薪基于我摆姿势的能力,”你可以打赌这位母亲会在这次拍摄后填写服务质量调查表——而不仅仅是为了在下一次拍摄中获得2.00美元的折扣(如果她回来的话)。相反,卡罗尔应该向老板展示第16章关于收集客户满意度数据的信息。

挖掘披萨数据

特里是一家当地比萨店的经理,该店按片出售比萨。他负责确定在特定时间内有多少员工,提前制作多少比萨以满足需求,以及订购和磨多少奶酪,同时最大限度地减少工资和原料的浪费。周五午夜,这家店门可罗雀。特里还剩下五名工人,有五个大盘比萨可以放进烤箱,每个盘大约可以做40片比萨。他应该让两名工人回家吗?他应该放更多比萨进烤箱还是等等?
店主已经追踪了几周的需求,所以特里知道每个周五晚上10点到12点之间情况都会变慢,但随后,酒吧的人群会在午夜左右涌入,直到凌晨2:30都不会停歇。因此,特里让工人继续工作,从午夜开始每30分钟放入一次比萨,并得到了一个盈利的夜晚,满意的顾客和一个高兴的老板。有关如何使用统计学进行良好估计的更多信息,请参见第13章。

办公室中的统计学

D.J. 是一家计算机公司的行政助理。统计学如何渗透到她的办公场所?很简单。每个办公室都充满了想要找到问题答案的人,他们希望有人“处理数字”,“告诉我这意味着什么”,“查找是否有人对此有硬数据”,或者简单地说:“这个数字有意义吗?” 他们需要了解从客户满意度数字到全年库存变化;从员工在电子邮件上花费的时间百分比到过去三年的用品成本。每个工作场所都充满了统计数据,如果 D.J. 是那位高层领导求助的人,她的市场价值和作为员工的价值可能会提高。每个办公室都需要一位驻场统计学家 — 为什么不让这个人是你呢?

来源:工程师和他的朋友们*注:内容仅做学术分享之用,若涉及侵权等行为,请先与本公众号联系删除,万分感谢。

转自:数学中国

编辑 /张志红

审核 / 范瑞强

复核 / 张志红

 关注公众号了解更多

会员申请 请在公众号内回复“个人会员”或“单位会员


 欢迎关注中国指挥与控制学会媒体矩阵

CICC官方抖音

CICC头条号

CICC微博号

CICC官方网站

CICC官方微信公众号

《指挥与控制学报》官网

国际无人系统大会官网

中国指挥控制大会官网

全国兵棋推演大赛

全国空中智能博弈大赛

搜狐号              

一点号              


中国指挥与控制学会
中国指挥与控制学会是中国科协、国家民政部批准成立的国家一级学会,是由我国从事指挥与控制科学技术领域的单位和科技工作者自愿结成的学术性、全国性社团组织。学会办事机构挂靠中国兵器工业集团公司。
 最新文章