假设检验和区间估计的对比教学[1]1
孙利荣[2] 郭宝才[3]
(浙江工商大学统计与数学学院)
摘 要:随着科学技术和生产的不断发展,数理统计的应用更加广泛,而参数估计和假设检验是统计推断的两类重要问题,在概率统计的学习中占有很大比例,掌握好这两种方法对于学生将来的实际工作非常有益。区间估计和假设检验从表面上看是两个不同概念,实际应用中它们之间又有密切的联系。很多教科书上未对两者的关系做深入研究,导致很多同学认为这两种方法是一样的,可以互推。这只是一种表面个别现象,本文将深入分析两者的关系和区别。掌握这两者之间的关系以及适用范围和注意事项对于这部分的学习大有裨益。
关键词:假设检验;区间估计;参数估计
一、基本概念
首先我们给出两者的定义:
定义1:区间估计是参数估计中的一种,设总体X的分布函数为F(x,θ),其中θ为未知参数,X 1,X 2,…,Xn是来自总体X的一个样本,α是给定常数(0<α<1),若两个统计量θ=θ(X 1,X 2,…,Xn)和θ珋=θ珋(X 1,X 2,…,X n)满足
P{θ<θ<θ)=1-α
则称随机区间(θ,θ)为总体参数θ的置信度为1-α的置信区间,分别称θ和θ为置信下限和置信上限。
定义2:假设检验是一种重要的统计推断形式.它的基本任务是:在总体的分布完全未知或只知道其形式但不知道参数真值情况下,为了推断总体的某些性质,首先提出某些关于总体的假设,然后根据样本所提供信息,对所提假设作出“接受”或“拒绝”的结论性判断。
以双边假设检验和双侧置信区间为例,单侧情况类似。
寻找未知参数θ置信区间的步骤为:
(1)给定待估参数θ,选取一适当样本统计量T=T(X 1,X 2,…,X n;θ),它只含θ,而不含其他未知参数,且它的分布不依赖于任何未知参数(包括θ)。
(2)对于给定的置信度1-α,定出常数a,b,使得
P{a<T<b)=1-α
由于T=T(X 1,X 2,…,Xn;θ)的分布已知,所以常数a,b是可以计算出来的,一般可利用该分布的分位点来确定。
(3)利用不等式变形,求得未知参数θ的置信区间,即由
a<T=T(X 1,X 2,…,Xn;θ)<b
解出θ(X 1,X 2,…,X n)<θ<θ珋(X 1,X 2,…,X n)
对于双边假设检验而言的基本步骤为:
(1)根据实际问题,建立原假设H 0:θ=θ0和备择假设H 1:θ≠θ0。
(2)在原假设H 0:θ=θ0成立条件下,选定检验统计量T,使得T的分布已知,且不依赖于任何参数。在双边检验的拒绝域由两部分组成,接受域只有一部分。
(3)根据显著性水平α,由统计量T的分布决定拒绝域C={T>b或T<a},其中a<b,当然可以称R={a<T<b}为接受域。即
P(T>b,or T<a)=α
等价地,P(a<T<b)=1-α
(4)根据样本观测值,计算统计量T的值,如其落在拒绝域,则拒绝H 0,否则,接受H 0。
在作假设检验时,常有两种方法:采用零假设(H 0)成立时的统计量检验法或置信区间法。这两种方法有时是一致的。
二、两者之间的内在联系
(一)小概率事件原理
小概率事件是在一次独立的实验中发生概率很小的事件。作统计推断的一种重要依据就是小概率原理,即认为小概率事件在一次试验中是不可能发生的。其内涵是很丰富的:其表层的含义是在一次实验中小概率事件几乎不会发生也正是如此,它很容易被人忽视;其深层的含义是如果这种实验独立进行多次,那么小概率事件必然会发生。
(二)思考方式一致
不管是区间估计还是假设检验,尽管两者的提法不同,但解决问题的思想方式是一致的。首先假定未知参数已知的条件下,选择合适的样本统计量,然后根据小概率事件原理构造小概率事件,最后给出结论。区间估计是一定概率保证下的接受域,而假设检验确定在一定的置信水平下统计量是否落在拒绝域内。有时候双侧区间估计的接受域正好和假设检验的双侧拒绝域形成一个概率为1的完整区域。
参数估计和假设检验是统计推断的两个基本问题,而参数估计又包括两类点估计和区间估计。它们都是基于数理统计理论的推断方法,都是基于样本信息来推断总体的性质,即用部分来推断总体。它们都是选用一个统计量,然后使这个统计量落在某个已知区间的概率而由此得到结果,利用区间估计可以建立假设检验,反之亦然。
三、参数的区间估计与参数的假设检验的区别
首先看一个例子。
例:已知某个品牌的柴油发动机,使用采用每升的运转时间服从正态分布,现测试装配好的6台的运转时间分别为28,27,31,29,30,27(分钟),按设计要求,平均每升的运转时间应大于30分钟。问当α=0.05时,这种柴油机是否合格?
解:设X表示一台柴油机每升柴油下的运转时间,则X~N(μ,σ2),这里μ,σ均未知。
(1)提出假设:H 0:μ≥30,H 1:μ<30。
(2)在H 0成立条件下,选择统计量这里μ0为真实的正态分布均值,n为样本容量。
拒绝域为[-∞,-tα(6-1)],查表得到t 0.005=2.015。
(3)由样本观测值,得到珚x=28.67,s=1.633,从而统计量实值为T=-1.995,统计量之值未落入拒绝域,因此接受原假设H 0,即柴油机合格。
此题的解法完全遵循著名统计学家Neyman-Pearson提出的方法,解法经典规范,似乎不存在什么问题,也无须讨论说明。但我们对题中样本数据稍加分析,恐怕对这种柴油机合格的结论就不会很有信心。从样本数据看,仅有一台运转时间略高于设计要求,一台刚好合格,其余4台均不合格,这6台运转平均时间为珚x=28.67也明显低于设计要求。
现使用区间估计方法来分析。由假设条件知,这里μ0为这种柴油机的真实每升柴油运转时间。根据已知数据我们来推断事件μ0<30的概率,即,故在σ未知下,参数μ0的置信度为1-0.05=0.95的单侧置信区间为)。注意到在题中给定的样本数据下,所求的置信区间为(-∞,31.0133),即P(μ0<30)≈0.95。按区间估计,从得到的数据来看,如无特别理由,我们很难认为这种柴油机合格(即油耗1升运转时间大于30分钟)。为什么用区间估计和假设检验这两种统计推断方法结果竟然会大相径庭?其中的缘由值得研究.
既然用同一批样本数据产生了不同的统计推断结果,其原因当然要从两种不同方法所依据的原理和适用条件的差异性方面进行讨论,参数估计和假设检验是两种统计推断方法,都是使用样本信息来推断总体的性质,即用部分来推断总体。由于样本数据的随机性,统计推断的结论不可能是百分之百正确反映总体的情况,出现推断失误的可能性是存在的,我们只能尽量减少而不能完全消灭它。这两种方法各自依赖的理论和适用条件是有差异的。
假设检验的理论依据是:在统计对象的某些性质未知时,我们通过对它总体的某些了解,如历史经验,常规情况等,对其性质作出“一般性”的假设,即原假设H 0。然后利用随机抽样获得的样本数据,对H 0的真伪作出统计意义上的检验,如果样本落入拒绝域,就否定H 0而接受备择假设H 1。如果样本未落入拒绝域,只能接受H 0。
我们注意到,在假设检验中,原假设H 0处于十分有利的“受保护”地位,它的“接受域”远大于“拒绝域”,没有强有力的理由不能轻易否定;而它的对立假设H 1则只有否定了H 0后才能接受,因此H 0与H 1地位不对等。十分明显,选定哪一个假设作H 0从而使其处于强有力地位,选原假设作H 0的理由并非来源于我们对样本数据的分析判断,而是我们在作假设检验的第一步已人为确定好的,与样本信息基本无关。
区间估计与假设检验不同,它对参数所在的区间估计是在选定置信水平1-α后,完全由样本数据决定的,显然十分客观,但它不适用于有许多非样本信息需要考虑的情况。
故针对此例子,最好的推断方法是区间估计,而非假设检验。
下面总结两种统计推断方法的差异性:
(1)两者的要求不相同:区间估计要求在一定的置信水平下给出未知参数的所在范围,解决的是定量问题;而假设检验要求以一定水平来判定未知参数是否取给定的值,解决的是定性问题。
(2)两者对问题的了解程度各不相同。区间估计对未知参数一无所知,而假设检验要求对未知参数有所了解,但无确切了解。
(3)两者考虑的重点有所不同。区间估计中考虑的是,即可信度为1-α,而假设检验考虑的是P(拒绝H 0|H 0成立)=α,即犯第一类错误的概率为α。故区间估计充其量只和假设检验中的第一类错误有关,与第二类错误无关,而第二类错误不是我们可以直接控制的。
四、结 语
区间估计和假设检验是对未知参数的两个不同侧面的研究,只是侧重点不同而已。两者既有联系又有区别。假设检验是先进行“人为”选择一个原假设,然后用样本数据检验是否支持原假设,即假设在前,推断是由规范程序作出的,结论只有成立与否而没有数量大小的反映,而区间估计则是在置信度1-α下由样本数据算出估计量所在的区间,然后由人们根据估计结果进行判断。因此,这两种方法的适用情况并不完全相同。如果我们对实际问题有很多实际了解和经验,或有许多非样本信息需要考虑,则我们应使用假设检验的方法,非样本信息通过与原假设H 0和显著性水平α的选取发生作用。如果我们对于问题除了样本外没有其他信息可以获得,则用区间估计的方法比较稳妥,因为既能得到参数的区间又有置信度的数值,作判断较为客观。
参考文献
[1]龚小庆,王炳兴.概率论与数理统计教程[M].杭州:浙江工商大学出版社,2010.
[2]盛骤.概率论与数理统计(第四版)[M].北京:高等教育出版社,2008.
【注释】
[1]教改项目:假设检验教学中的几个问题研究,编号:1020KU210021。
[2]孙利荣,研究方向为统计学。
[3]郭宝才,研究方向为统计质量管理。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。