做数据分析到底要懂哪些统计学知识?一文梳理清楚!

教育   2025-01-14 19:03   黑龙江  

每次在写数据分析必学知识时,我都会提到,对于数据分析师来说,我们是必须学习统计学知识的,毕竟天天跟数据打交道,总不能连最基础的统计学知识都不会吧?


举个例子,数据分析,你如果连最起码的置信区间都不懂,你还怎么处理数据?如果统计学中最基本、核心的思想:用样本估计总体,你都没概念,就别说自己会数据分析了。



但多数人在学习统计学知识时会无比头疼,因为统计学的书籍里几乎都是复杂的推理公式,让人难以理解。其实,对于大部分数据分析师来说,我们并不需要掌握的那么细。


因此,我整理了一些你需要掌握的统计学知识,把统计学知识展开了说,让大家大致了解有哪几个模块知识,然后跟着这些模块知识去学习。




概率与概率分布


先要明确,统计学不研究统计,它研究的是不确定性!而不确定性事件唯一的量化标准就是概率,独立随机事件没法通过概率来预判何时发生,但却可以用概率来描述事件发生的可能性。


这一模块主要掌握:

  • 随机事件的概率

  • 离散随机变量

  • 连续随机变量的概率分布





数据的概括性度量


在数据人的实际工作中,你会经常遇到这种情况:业务人员/老板拿到一坨数据,丢在你面前,让你分析。这时,大多数人会不知所措,不知道从哪一步开始整理这些数据。这个时候,就需要通过概括性的度量指标,来帮我们从宏观上把握数据中的初步信息。


这一模块主要掌握:

  • 集中趋势的度量

  • 离散程度的度量

  • 分布形态的度量





回归分析


回归分析,因为它的易懂性,也因为它的实用性,但随着自己数据分析经验的积累,对回归分析的理解也越来越深,它不是简单的回归模型求解那么简单,它更是一种日常工作中解决问题的思路和方法论。


这一模块主要掌握:

  • 相关系数

  • 回归分析

  • 最小二乘法

  • 显著性检验





统计量及其抽样分布


抽样,就是从研究的总体中抽取一部分个体作为我们真正的研究对象,称为样本,最后通过样本的结果来推测总体情况。


这一模块主要掌握:

  • 统计量的基本概念

  • 常用统计量

  • 正态分布




参数估计


参数估计,顾名思义就是对参数进行估计,那什么是参数呢?就是你假设分布的参数,也就是说你知道某个随机过程服从什么分布,但是不确定他的参数是什么,那怎么办?你采样,然后通过这些样本的值,去估计分布的参数就是参数估计。


这一章节,需要大家掌握几个核心概念:

  • 参数

  • 点估计

  • 区间估计

来源:https://www.toutiao.com/a7024394076241838629/?log_from=718ef3d4d33d1_1635996452264


由于公众号平台更改了推送规则,如果不想错过后续内容,记得点下“赞”“在看”,这样下次有新文章推送,就会第一时间出现在你的订阅号列表里。


求职必看













面试中,打败90%数据分析师的「项目问题」怎么破?


如何快速构建数据分析5大核心能力?


年薪30W的数据分析师找不到工作,年薪12W的跳槽成功,为什么?






爱数据福利大放送


《17张统计学知识高清思维导图》

《机器学习资料包》

扫描/识别下方二维码后

回复【822】即可领取

(资料包详情如下)


统计学知识导图概览


《机器学习资料包》概览


《机器学习技能图谱》





点击【阅读原文】测一测你适合做数据分析吗?

爱数据LoveData
国内领先数据分析社区,专注数据分析知识分享及求职辅导。爱数据作为一线数据厂商(帆软、观远、永洪等)培训合作伙伴,曾联合阿里、美团、滴滴等一线公司开展数据领域专题分享会。积累10年+行业经验,链接千人数据分析高端人脉,累计服务15w+用户。
 最新文章