10种数据分析必备的统计学方法,附重点应用场景!

教育   2024-11-15 15:59   黑龙江  

从起源角度来看,数据分析是「统计学」与「计算机」的交叉学科,统计知识应用其中;从工作角度来看,应用统计学知识,可以更为科学的度量数据对业务的价值。


因此,作为数据分析师,掌握基础的统计学知识是非常有必要的。下面,为大家总结了工作中常用的10种统计学方法




描述性统计

常用指数:5星


描述性统计,通过概括性的数学方法及图表方式,描述业务数据及其分布现状,在工作中是最为常用的。


涵盖内容如下:



工作中主要应用场景如下:




假设检验

常用指数:5星


假设检验,用于判断样本与样本、样本与总体之间的差异,是由抽样误差所导致的,还是由于本身就存在差异。其中主要涵盖「参数检验」和「非参数检验」,两者的概念如下:


参数检验:假设数据服从某一分布(一般为正态分布),通过样本参数的估计量对总体参数进行检验。

非参数检验:不考虑总体分布形式,直接对数据的分布进行检验。


涵盖内容如下:


工作中主要应用场景如下:




列联表分析

常用指数:3星


列联表分析,用于判断离散型变量之间是否存在明显的相关性。例如:绩效的等级与性别是否存在相关性。


涵盖内容如下:


工作中主要应用场景如下:




相关分析

常用指数:4星


相关分析,用于判断现象之间的某种关联关系以及关联程度,例如:正相关、负相关,在探索性分析中应用较为频繁。


涵盖内容如下:


工作中主要应用场景如下:





方差分析

常用指数:2星


方差分析(又称F检验),用于度量两个及两个以上样本均值差异的显著性检验。


涵盖内容如下:




回归分析

常用指数:5星


回归分析,用于日常指标的拟合,以及对于未来趋势的预测,在工作中应用较为广泛。


涵盖内容如下:


工作中主要应用场景如下:




聚类分析

常用指数:4星


聚类分析,用于将用户/内容,在没有先验性指引的情况下,分门别类的进行划分。


涵盖内容如下:



工作中主要应用场景如下:





判别分析

常用指数:4星


判别分析(分类问题),通过研究对象的特征判断所属的类别。与聚类分析的差异在于,聚类分析在分析前,不知道类别有几类以及是什么,而判别分析是在总体类别已知的情况下,对新样本判断所属群体。


涵盖内容如下:


工作中主要应用场景如下:





主成分分析

常用指数:2星


主成分分析(Principal Component Analysis,PCA),是将一组可能的相关性变量,转化成为一组线性不相关的变量,转化后的这组变量叫做主成分。


主成分分析最大的作用在于「降维」,也可用于「探索变量之间的关系」。简单解释一下,在搭建模型过程中,往往会选择诸多变量作为特征,而这些变量之间也往往存在着相关性,这会引起「多重共线性问题」。因此,需要一种方式,将这些变量转化为相对独立且尽可能多的涵盖原始变量的信息,主成分则是其中的一种方式,将原始变量转化为几个相互无关的新变量。


扫盲 - 多重共线性问题

自变量(特征)之间由于存在相关关系,从而使得模型估计失真(结果不稳定,例如:随机森林特征贡献度,多次运行出来的结果差异较大)。




因子分析

常用指数:2星


因子分析的作用同主成分分析一样,同样是为了「降维」。原理是在多自变量之间,寻找潜在的因子,相似变量归为一个因子,通过因子替代原有的自变量。


与主成分分析相同之处:起到清理原始自变量中内在关系的作用。

与主成分分析不同之处:主成分分析重在归总变量的信息,而因子分析重在解释变量的信息,主成分分析是因子分析的子集。


以上10种统计学方法在工作中较为常见,但方式不止于此,还包括:信度分析、生存分析、多重响应分析、距离分析等。有待你在工作中不断探索、发掘场景,并将知识应用其中。


-END-
今天,小编给大家准备了一份《统计学&数据分析知识宝典》


《统计学&数据分析知识宝典》内容概览


扫描/识别下方二维码
即可免费领取




小伙伴们,快来关注我们领取新人福利吧!



长按关注【爱数据LoveData】

即可领取新人见面礼


《小爱学习包》部分内容


《小爱学习包》部分内容


《见面礼》部分内容



往期精彩

1.这10个Excel功能,SQL也能实现!(附面试原题)

2.数据分析师有点小儿科?商业分析才是战场上的王者?

3.30个数据可视化小技巧 !建议收藏!

4.Python的网络爬虫技术在豆瓣电影中的应用:抓取、清洗及可视化分析9种最常用数据分析方法!

5.Excel技巧大揭秘:5个令你进阶的必备玩法!


爱数据LoveData
国内领先数据分析社区,专注数据分析知识分享及求职辅导。爱数据作为一线数据厂商(帆软、观远、永洪等)培训合作伙伴,曾联合阿里、美团、滴滴等一线公司开展数据领域专题分享会。积累10年+行业经验,链接千人数据分析高端人脉,累计服务15w+用户。
 最新文章