第二节 假设检验
一、假设检验的概念
假设检验(Hypothesis testing)是统计推断的另一主要内容。以产品质量的抽样检验为例,如果我们要以一定的概率把握程度以样本的不合格品率估计总体不合格品率,即为我们上一节讨论的参数估计问题;如果我们要以一定的概率把握程度判断整批产品是否合格,则为假设检验问题。
例6-14:某外贸公司出口一种名茶,每包重量服从正态分布,并且包装规格标准差为5克,现抽样检验该茶叶的每包重量,结果如表6-6所示。
表6-6 茶叶每包重量抽检结果
又知:这种茶叶平均每包规格重量不得低于150克方可出口,则这批茶叶是否达到出口要求?
为判断这批茶叶是否符合出口要求,我们首先假设它成立,即能够出口,然后根据已知条件计算出样本的平均每包重量,并以样本的平均每包重量来检验我们的假设是否正确,从而做出该批茶叶能否出口的决定,这便是一个假设检验问题。
例6-15:某地区小麦的一般生产水平为亩产250公斤,标准差为30公斤,根据经验知道,小麦亩产渐近服从正态分布。现对一种化肥进行效果试验,对该地区小麦施用该种化肥后,抽取25个地块检测,平均亩产量为270公斤。问:这种化肥是否使小麦明显增产?
从直观上看,施用这种化肥后,小麦的亩产量较以前有所增加,但是,由于数据来源并非全面调查的结果,因此,差别也可能是随机原因造成的。究竟这种化肥是否使小麦明显增产,我们可以先做这种化肥能够使小麦明显增产的假设,然后利用统计方法检验该假设是否成立。这也是个假设检验问题。
因此,假设检验是先对研究总体的参数做出某种假设,然后通过对样本的观察,运用统计方法,判断假设是否成立。
二、假设检验的步骤
假设检验的一般步骤如下:
第一步:设立假设。根据研究问题的需要提出原假设H0和备择假设H1。
在假设检验中,称所要检验的假设H0为原假设(Null hypothesis)或零假设,称H1为对立假设或备择假设(Alternative hypothesis),若原假设被拒绝,备择假设就被接受。拒绝原假设的区域称为拒绝域(Rejection region),拒绝域之外的区域即为接受域(Acception region)。原假设的提出一般有三种方式,以总体均值的检验为例:
(1)H0: μ=μ0,H1:μ≠μ0
(2)H0: μ≤μ0,H1:μ>μ0
(3)H0: μ≥μ0,H1:μ<μ0
具体采用哪一种方式需要根据具体情况而定,若采用第一种方式,则拒绝域在分布曲线的两侧,称为双侧或双尾检验,如图6-1所示;若采用后两种方式,则拒绝域位于分布曲线的右侧或左侧,称为单侧或单尾检验,如图6-2和图6-3所示。
图6-1 H0:μ=μ0
图6-2 H0:μ≤μ0
图6-3 H0:μ≥μ0
第二步:确定检验统计量。假设检验与参数估计一样,需要通过样本统计量进行推断,用于假设检验的统计量称为检验统计量。在具体问题中,选择什么样的检验统计量需要考虑总体方差已知或未知,样本属于大样本还是小样本,等等。
第三步:规定显著性水平α。由于假设检验是根据样本信息对总体情况进行判断,因此,存在误判的可能,若原假设正确却被当成错误而被拒绝,统计上把犯这种错误的概率α称为假设检验中的显著性水平(Significant level),α的取值人为确定,通常取α=0.05或α=0.01。
第四步:确定临界值。按照规定的显著性水平和样本统计量的分布性质,确定接受域和拒绝域的临界值(Critical value)。
第五步:计算检验统计量的值。根据样本数据计算出检验统计量的值。
第六步:将检验统计量的值与临界值进行比较,做出判断。
三、假设检验中的小概率原理
假设检验的基本思想是应用小概率原理。所谓小概率原理,是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。例如,如果有一个厂商声称,他的产品的合格率很高,可以达到99%,那么,从一批产品(如100件)中随机抽取一件,该件产品恰巧是次品的概率为1%,非常小。如果我们假设厂商所言为真,则随机抽取一件产品为次品的情况几乎是不可能发生的,但是,如果这种情况确实发生了,我们就有理由怀疑原来的假设,做出厂商的宣称是假的,推翻原假设这样的推断。当然,我们也有1%的可能性恰巧抽中100件产品中的惟一一件次品,从而做出错误的推断,这里的1%即为前述显著性水平α。
虽然小概率事件在一次试验中发生的可能性很小,但依然可能出现。如果小概率事件发生了,而我们却拒绝了原假设,我们就犯了以真为假即弃真错误,犯这种错误的可能性或概率就是α。统计上称弃真错误为第一类错误(TypeⅠerror)。反之,若原假设不正确而我们却接受了原假设,我们就犯了以假为真即取伪的错误,犯这种错误的可能性或概率记作β。统计上称取伪错误为第二类错误(TypeⅡerror)。假设检验中各种可能结果的概率参见表6-7。
表6-7 假设检验中各种可能结果的概率
在样本量一定的情况下,如果减小犯第一类错误的概率,就必然增大第二类错误的概率;反之亦然。若要同时减小两类错误,只有增大样本量,但样本量不能无限制,否则就有悖于抽样调查的意义。通常情况下,只对犯第一类错误的概率α加以限制,这种假设检验称为显著性检验。
四、参数的假设检验
(一)总体均值的假设检验
1.一个总体均值的假设检验。如果要检验的总体X~N(μ,σ2),则样本均值,检验统计量为Z统计量:
我们按照假设检验的基本步骤,对例6-14的假设进行检验。
(1)提出原假设和备择假设。判断这种茶叶的包装重量是否符合出口要求,即不低于150克,显然这是一个单侧检验问题。因此
H0:μ≥150
H1:μ<150
(2)确定检验统计量。由于总体服从正态分布,且总体方差已知,样本均值,检验统计量为:
(3)规定显著性水平α。一般取α=0.01或α=0.05,这里我们取α=0.05。查标准正态分布表得临界值
zα=-1.64
(4)计算检验统计量的值。
(5)根据已知条件,做出判断。如图6-4所示。
从图6-4可以看出,计算出的检验统计量z=0.6>-1.64,落入接受域,因此接受H0。这意味着,该种茶叶的包装重量符合出口要求。
图6-4 假设检验决策示意图
例6-16:某日化公司生产洗涤剂,现该公司欲引进一条瓶装洗涤剂自动包装线,其设计规格为每瓶500克,标准差为6克。随机抽取100瓶进行检查后发现每瓶平均重量为498克。若该瓶装洗涤剂的重量服从正态分布,α=0.05,问该生产线的设计规格能否接受。
解:H0:μ=500
H1:μ≠500
查标准正态分布表,临界值zα/2=±1.96
因为z=-3.33<-1.96,落入拒绝域,所以拒绝原假设,即样本的平均每瓶重量与包装线设计规格存在显著差异,该设计规格不能接受。
如果样本来自方差未知的正态总体,大样本时依然可以采用Z统计量进行假设检验,未知的总体方差以样本方差代替;小样本时则检验统计量为:
如例6-16,若总体标准差未知,并且仅抽取25瓶进行检验,样本标准差为5.8克,这时,检验统计量为:
查t分布表,tα/2(n-1)=±2.06
由于-2.06<-1.72<2.06,落入接受域,所以接受H0,即样本的平均每瓶重量与包装线设计规格不存在显著差异,该设计规格可以接受。
如果总体不服从正态分布,或者不知道总体的分布形式,但具有方差σ2,则根据中心根限定理,在满足大样本的情况下,可以近似用Z统计量作为检验统计量。
若σ2未知,可用样本方差S2代替。
2.两个总体均值之差的假设检验。如果两个样本分别抽自两个方差已知的正态总体,即,检验统计量为:
解:H0:μA=μB
H1:μA≠μB
根据已知条件,计算检验统计量
查正态分布表,临界值zα/2=±1.96
因为-1.96<z=0.66<1.96,落入接受域,所以接受原假设,即有理由认为A、B两厂生产的圆钢平均抗拉强度不存在显著差异。
若两个样本均为样本量n≥30的大样本,也可以近似用Z统计量进行检验。
解:根据题意,建立如下假设:
H0:μA=μB
H1:μA≠μB
根据已知条件,计算
查t分布表,得临界值tα/2(n1+n2-2)=tα/2(18)=±2.10。
因为-2.1<t=0.06<2.1,落入接受域,所以接受原假设,即两厂生产的圆钢平均抗拉强度不存在显著差异。
如果两个样本分别抽自方差未知的非正态总体或不知分布形式的总体,大样本情况下,根据中心极限定理,可近似采用Z统计量进行检验:
(二)总体成数的假设检验
1.一个总体成数的假设检验。当样本量足够大时,可选择检验统计量:
例6-19:在例6-2中,如果质量标准要求该种圆钢抗拉强度的合格率不得低于80%,试确定这批圆钢是否满足标准(α=0.05)。
解:根据题意,建立如下假设:
H0:P≥80%
H1:P<80%
根据已知条件,计算
查正态分布表,得临界值zα=-1.64。
因为z=1.41>-1.64,落入接受域,所以,接受原假设,即该批圆钢能够满足标准。
2.两个总体成数之差的假设检验。如果两个样本独立地抽自两个独立的总体,在满足大样本的情况下,可选择Z统计量进行检验:
例6-20:在例6-17中,若根据质量标准,抗拉强度小于30kg/mm2为不合格品,抽样检查结果在A厂的100件样本中有5件不合格,B厂的100件样本中不合格品为7件,问:若α=0.05,两厂圆钢抗拉强度合格率是否有差异?
解:H0:P1=P2
H1:P1≠P2
根据已知条件,计算检验统计量:
查标准正态分布表,得临界值zα/2=±1.96。
由于-1.96<z=-0.60<1.96,落入接受域,所以接受原假设,即两厂圆钢抗拉强度合格率不存在显著差异。
(三)总体方差的假设检验
如果总体X~N(μ,σ2),若要检验总体方差是否等于某一数值,可采用检验统计量:
例6-21:通过计算电子元件使用寿命的方差,可以了解该产品寿命指标的稳定性。已知上季度某电子元件使用寿命的方差为5534,现从本季度生产的电子元件中随机抽取40件进行寿命检测,测得使用寿命的方差为5344。若α=0.05,问该电子元件寿命指标的稳定性是否有显著变化。
解:H0:σ2=5534
H1:σ2≠5534
查χ2分布表,得,由于23.654<χ2=37.66<58.12,所以接受原假设,即该电子元件寿命指标的稳定性没有显著变化。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。