置信区间(Confidence Interval)是统计学中用来估计一个总体参数(例如均值、比例等)的范围。它提供了一个区间估计,表示在一定的置信水平下,该区间包含总体参数的可能性。
统计学教材中是这样定义置信区间:
在区间估计中,由样本量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。
置信区间是怎么来的?
由样本均值的抽样分布可知,在重复抽样或无限总体抽样的情况下,样本均值的数学期望等于总体均值,即E(x)=μ,样本均值的标准差为
σx=σ/√n。正常情况下,可以根据此公式求出样本均值落在总体均值μ的两个任何一个抽样标准差范围内的概率,但是由于大多数情况下我们是不知道总体均值μ,只知道样本均值x,总体均值μ通常需要根据样本均值x估计。因为样本均值x与总体均值μ的距离是对称的,所以可以推断如果样本均值x落在总体均值的两个标准差之内,那么就可以说总体均值μ就被包含在样本均值x的两个标准差之内,也就有了95%的样本均值所构造的2个标准的区间内会包含μ。
95%的置信区间又是怎么回事?什么是置信水平?
如果抽取100个样本,每个样本会构造一个置信区间,100个样本就会产生100个置信区间。这样由100个样本产生的置信区间中有95%的区间会包含总体参数的真值,有5%不包含。此时的95%称为置信水平。
置信水平定义:将置信区间中包含总体参数真值的次数所占的比例称为置信水平。
对于置信区间的理解还有几点要注意:
1)一个置信区间就像是为了捕鱼撒出去的网,并不是每一次撒网都能捕到鱼。置信区间中有95%的区间包含总体参数的真值,5%的区间不包含。
2)总体参数的真值是固定的,但是未知。而样本是随机的,所以它所构造的区间也是不固定的,不同的样本所构造的区间是不同的。
说到这里,大家对置信区间和95%置信区间理解了吗?我们举个例子:
某高一二班的物理期中考试成绩的置信区间是60~80分,置信水平为95%。
错误的解读方法:
错误一:60~80分这个区间以95%的概率包含全般同学平均考试成绩的真值。
错误二:全般同学的平均考试成绩以95%的概率落在60~80分之间。
理由:因为真值是一个固定值,不是一个随机变量,只能要么选择包括,要么选择不包括,不存在概率问题。
正确的解读方法:
如果抽样100次,有95次在60~80的区间里包含了真值,有5次是不包括的。如果全班平均成绩是70分,60~80区间里一定包含真值;如果平均成绩是50分,那么60~80这个区间里一定不包含真值,如论做多少次试验。
理由:概率是用来描述特定区间的包含总体区间参数的可能性,而由抽样样本构成的随机区间里,不能使用概率,只能用“包含”或者“不包含”来进行描述。