一、非参数检验的概念
参数检验:以特定的总体分布(如正态分布)作为前提,对总体参数(如总体均数)进行假设检验,这类检验方法称为参数检验。
非参数检验的优点是不受总体分布的限制,适用范围广,且简便易学,又称任意分布检验。
对数据的分布没有特别的要求,比如一端或两端是不确定数值(>0.5等),并且特别适用于等级资料(可以推断组间的等级差别)。
秩和检验是非参数检验中的一种,是对数据从小到大排序,该排序号在统计学上称为秩(rank)。用数据的秩代替原数据进行假设检验,秩和检验对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。
它的主要推断目的有以下两种:
1.推断一个总体表达分布位置的中位数M(非参数)和已知M0是否有差别。 2.推断两个或多个总体的分布是否有差别。
二、非参数检验的适用范围:
1.有序分类资料(等级资料),如抗生素的疗效评价:无效、进步、显效、痊愈;大便隐血实验结果:“-”、“±”、“+”、“++”、“+++”等。
2.分布类型未知的资料。
3.数据一端或两端有不确切值的资料。
4.不符合参数检验条件的资料。
三、配对设计和单样本资料的符号秩和检验
(Wilcoxon符号秩和检验)
应用范围
1.用于配对设计的样本差值的中位数和0比较,目的是推断配对样本差值的总体中位数是否和0有差别。
2.单个样本中位数和总体中位数比较,目的是推断样本所来自的总体中位数,M和某个已知的总体中位数M0是否有差别。
配对设计的符号秩和检验
查表法----5≤n≤50
例 对12份血清分别用原方法和新方法测谷-丙转氨酶,结果见下表。问两法所的结果有无差别?
12份血清用原法和新法测血清谷-丙转氨酶结果的比较
1.建立假设,确定检验水准
H0:差值的总体中位数Md=0
H1:差值的总体中位数Md≠0
α=0.05
2.计算统计量T值
(1)求差值
(2)编秩:
①省略所有差值为0的对子数,令余下的有效对子数为n,n=11
②按差值的绝对值从小到大编秩,遇到差值的绝对值相等者取平均秩,最后再加上正负号。
③求正秩和与负秩和,任取正秩和T+或负秩和T-作为统计量T
(3)确定P值,作出统计推断
查附表0.05<P<0.10,按照α=0.05的水准不拒绝H0,差别无统计学意义,尚不能认为两种方法测量结果有差别。
正态近似法-----n>50
随着n的增大,T分布渐渐逼近这样可用正态近似法作u检验。
0.5为连续性校正数——T值不连续,而u分布是连续的——影响较微,常可忽略。
若相同秩次较多时(不包括0),用上式计算的u值较小,需用下式计算矫正的uc值。
tj为第j个相同秩次的个数
假定相同秩次(平均秩)中,有2个1.5,5个8,3个14,则
四、完全随机化设计两组独立样本的秩和检验
两组连续变量资料的秩和检验
例 研究不同饲料对雌鼠体重的增加的关系。试比较喂高蛋白的雌鼠与喂低蛋白的雌鼠增重是否不同?
不同饲料组雌鼠所增体重
1.建立假设,确定检验水准
H0:喂高蛋白与喂低蛋白的雌鼠增重的总体分布相同
H1:喂高蛋白与喂低蛋白的雌鼠增重的总体分布不同
α=0.05
2.计算统计量T值
(1)编秩:
①将两组数据从小到大统一编秩。遇到相同秩次者取平均秩。
②对两组分别求秩和,确定统计量T
将两组秩次分别相加
a.若两组例数相等,则任取一组的秩和为统计量T
b.若两组例数不等,则取样本含量较小者对应的秩和为统计量T(T=T2=44.5)
3.确定P值,作出统计推断
①查表法
0.02<P<0.05,按照α=0.05的水准拒绝H0,接受H1,差别有统计学意义,故可以认为两组雌鼠的体重增加的分布不同。
②正态近似法-----n1>10或n2-n1>10
可用正态近似法作u检验。
若相同秩次较多时(超过25%),应进行校正。
,其中,,tj为第j个相同秩次的个数