非参数检验是一类统计方法,与参数检验不同,它不依赖于数据的分布假设(如正态分布)。这种方法适用于小样本数据、非正态分布数据或无法满足其他参数检验假设的情况,广泛用于实际数据分析。
非参数检验的特点
无需数据分布假设:
非参数检验不要求数据符合特定分布(如正态分布)。
适用于连续变量、分类变量和有序变量。
对异常值不敏感:
非参数方法依赖于数据的排序或秩值,因而对极端值的影响较小。
适用场景广泛:
小样本、分类数据、秩次数据等都可以采用非参数检验。
效率可能较低:
在数据符合分布假设的情况下,非参数检验的统计效率(即检验力)通常低于参数检验。
常见非参数检验方法
1. 单样本检验
Kolmogorov-Smirnov 检验:
检验数据是否符合某一分布。
单样本符号检验:
检验中位数是否等于某一假设值。
2. 两独立样本检验
Mann-Whitney U 检验(Wilcoxon 秩和检验):
比较两组独立样本的分布是否相同。
Kolmogorov-Smirnov 检验(两样本):
比较两组数据的分布是否一致。
3. 两配对样本检验
Wilcoxon 符号秩检验:
检验两组配对数据的中位数差异。
McNemar 检验:
检验二分类配对数据的比例差异。
4. 多组独立样本检验
Kruskal-Wallis 检验:
比较多组独立样本的分布是否相同。
Cochran Q 检验:
比较多组二分类变量的差异。
5. 相关性分析
Spearman 秩相关:
检验两个变量之间的单调相关性。
Kendall τ 检验:
适合小样本的相关性分析。
6. 分类数据检验
卡方检验:
检验分类变量的分布或关联性。
Fisher 精确检验:
检验 2x2 分类表格中的关联性,适用于样本量小的情况。
非参数检验的适用场景
数据不满足正态分布:
当数据的分布明显偏斜或不对称时,使用非参数方法更合适。
样本量较小:
参数检验在小样本时假设可能失效,而非参数方法更为稳健。
等级数据或分类数据:
如果数据是秩次或分类变量,直接使用非参数方法。
接下来几篇推文,会持续分享非参数各检验方法的具体实操,敬请关注。
点个关注吧