当数据不服从正态分布时,求参数的区间估计的一种有效方法就是所谓的大样本方法,即要求样本容量比较大,利用中心极限定理进行分析。
(一)0-1分布参数的区间估计
设是来自0-1分布B(1,p)的样本,n>50。由0-1分布性质和中心极限定理,知
近似服从N(0,1)分布,于是有
求一元二次方程可得参数p的置信水平为1-α的近似置信区间为
其中。
例7.5.1 某市随机抽取1000个家庭,调查知道其中有152家拥有私家汽车。试根据此调查结果对该市拥有私家汽车比例p作出区间估计(取置信水平为0.95)。
解 由已知资料计算得
将上述结果代入(7.5.1),得所求置信区间为(0.131,0.176)。
(二)其他分布均值μ的区间估计
设总体X的均值为μ,方差为是来自总体X的样本。根据中心极限定理,当样本容量n充分大时(要求n>50),
近似成立,这样可导出μ的置信水平为1-α的近似的置信区间为
如果方差σ2未知,可以用估计量S2代替σ2,由此得到相应的近似置信区间为
注 当样本容量n⩽50时,根据实际经验,t分布具有良好的统计稳健性,即当总体X不服从正态分布,样本数据相对对称时,枢轴量仍可以看成近似的t(n-1)分布,从而均值μ的置信水平为1-α的近似置信区间为
例7.5.2 根据实际经验可以认为,任一路口单位时间内(如一分或一小时或一天等)的车流量服从泊松分布π(λ),若以分为单位,对某路口进行2小时的记录,得平均每分钟车流量为50辆,标准差为10辆,试求该路口平均每分钟车流量λ的置信水平为0.95的置信区间。
解 利用Excel或查正态分布表得z0.005=1.96,并将样本资料代入(7.5.3)得所求置信区间为(48.211,51.789)。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。