第一节 假设检验的基本概念
在日常社会经济生活中,通常难以完全知道所关心总体的某些数量特征及其变化情况,因而对总体进行研究比较时,常常需要对总体的状况做出某种假设。例如,考虑目前居民的经济收入水平,我们只能依据过去长期观察的平均情况和变异情况,做出当前居民收入可能偏高或偏低的假设。但是这种收入水平毕竟只是过去的情况,是否和当前相似,还需要等待进一步的验证,依据样本的实际资料用一定的程序来检验所做假设是否合理,从而决定接受或拒绝这个假设。总之,凡属于研究总体的数量差异,是否按照预期规律变化等问题都属于统计假设检验的讨论范围。
一、意义
假设检验亦称为显著性检验,具体是实际的抽样指标与假设的总体指标之间的检验,目的在于判断原假设的总体参数和现在实际样本统计量是否有显著性差异。因此,进行假设检验时,首先从原来总体出发,确立一个标准——总体参数等于原本统计量;其次,考虑差异是否显著(是否为随机因素影响),通过样本统计量与总体参数的比较来判断,这一过程就是假设检验的过程。要求样本统计量和总体参数之间完全一致的可能性是很少的,关键在于明确差异达到多大程度才算是显著的。一般来讲,存在两种不同的原因而引起两种不同性质的差异,一种是本质性差异,即由于工艺、内在或外来因素,或实验条件的改变所引起的结果差异,另一种是随机差异,即由于生产、试验过程中受偶然因素影响所导致的结果差异。上述两种因素的共同作用就形成各种各样误差。
显著性差异就是依据实际抽样结果,计算得到的样本统计量与总体参数的差异。若其超过了一定范围,说明所发生的差异,除随机因素之外还存在其他差异因素。因此,可以据此拒绝总体的变动纯粹由于随机原因所引起,即总体和样本之间存在显著性差异。
二、基本概念
1.假设检验
一个命题只有以操作性定义来表述,并转换成定量指标才能被检验。如某批次产品的重量为200克,或某地居民某频道电视节目收视率为30%,某地居民对政府养老政策支持率为78%等都可作为假设检验。而如大陆板块学说,宇宙爆炸学说这些假设都是定性问题,难以进行操作性定义,也难以转换成定量指标,所以无法进行统计学检验。
2.假设检验和置信区间估计
假设检验和区间估计有着不可分割的联系。若以一定的概率把握程度估计总体不合格品率,这是参数估计问题,或者区间估计问题;如果要以一定的概率水平,通过样本资料来判断该批产品是否合格,这是假设检验问题。事实上,这两个问题对同一个实例用的是同一个样本,同一个统计量,同一种分布,因而可由区间估计问题转换成假设检验问题,也可由假设检验问题转换成区间估计问题。
假设检验可以看成是区间估计中置信区间的另一种表达方式。换言之,可以用置信区间估计技术来处理有关假设检验问题。置信区间是在一定的概率保证程度下,利用样本资料计算得到的关于总体参数可能存在范围;而假设检验是对总体参数所做的假定,有可能落在置信区间之外,也有可能落在置信区间里面。在同一样本、同一统计量、同一分布的情况下,落在置信区间之外的假设可以判定为具有显著性差异,不能接受;而落在置信区间里面的假设则不能说它存在显著性差异,因此不能拒绝它,必须等获得更多的信息以后再做决定。因此,可以将置信区间看做是所有可以接受的假设集合。
3.显著性水平(Level of Significance)
假设检验的基本思想是:首先对所研究的命题提出一种假设——无显著性差异的假设,并假定这一假设成立,然后由此导出其必然的结果。如果能证明这种结果出现的可能性很小,那么我们就有理由用反证法认为原假设是错误的,从而拒绝接受这个假设。否则,就没有理由拒绝原假设,而认为原假设是可容的。也就是说,在假设检验中运用的是概率反证法原则,其理论依据是基于人们在实践中广泛使用的“小概率事件原理”,即小概率事件在一次实验中几乎是不可能发生的推断(就如1%以上的大奖,在一次摸彩中是摸不到的,如果摸到了,那该奖的兑奖面就可能不止1%,很可能是10%或以上)。如果在一次试验中事实上又发生了,那么就可以认为原假设不正确,拒绝接受。应强调的是,拒绝原假设并不是因为存在逻辑上的矛盾,或实际上不可能存在这种假设,仅仅是因为它存在的可能性很小,小到在一次试验中几乎是不可能出现的。
在假设检验时,没有不变的显著性水平标准。常用的标准有α=0.05、α= 0.01或α=0.001,默认值为0.05。在任何显著性水平下,都可以检验某个假设。但是,即使选择可以接受的最小概率标准,仍然存在着假设为“真”而被拒绝的可能性。在检验一个假设时,选择的显著性水平α愈高,零假设为“真”而被拒绝的概率也愈高。
“在5%的显著性水平下检验一个假设”表示,假定假设的总体参数正确,那么样本统计量与总体参数差异过大者,容量为100的样本中不应超过5个。如果样本统计量与总体参数差异过大,就认为这个样本不可能抽自假设总体,所以拒绝原假设。如果假设是正确的,那么显著性水平则表示某个界限以外的样本平均数所占的比例。
在进行假设检验时,事先确定一个可允许的做为判断界限的小概率标准非常重要。这个小概率标准就是统计假设检验中的显著性水平。在假设检验过程中,依据显著性水平的大小把概率分布划分为两个区间,拒绝区间和接受区间。假如给定小概率标准α=0.05,凡概率小于5%的我们都称之为小概率事件,都属于拒绝区间,而1-α=95%,属于接受区间。若计算概率落入接受区间,原假设成立而无显著差异;落入拒绝区间,拒绝原假设而认为有显著性差异。显著性水平α所对应的概率度T称为α的临界值,记为T(α)。例如α=0.05时,临界值T(α)=1.96,常称概率小于0.05的事件为小概率事件。因此,可直接利用概率表查找临界值作为判断依据。
应该注意的是,统计上的显著性差异与实际生活、工作中的显著性是不一样的。在假设检验中,设定显著性水平的目的是为了判别或比较两个总体之间是否存在差异,如果两个总体间的差异超过了总体内在的变异性,那么认为它们之间差异具有统计上的显著性。但这种统计上的显著性有可能并不一定对实际生产经营或商业性活动产生多大影响。
4.假设的命题
假设检验是从总体参数所做的一个假设开始,包括原假设H0和备择假设H1。
(1)原假设(Null Hypothesis)H0
在统计学中,要对总体的某种假设(论断)做出判断时,常对相反的假设、需要推翻的假设进行统计检验,称这个假设为原假设,记作H0。原假设H0一般表示无显著性差异、等于某数等,故又称虚无假设或无差假设。如要检验某城市新市民的月经济收入是否等于平均收入2200元。可事先设置假设,该市新市民的月经济收入等于全市居民平均收入2200元。然后从这城市中按随机抽样的方法抽取新市民并计算其平均收入,以此来检验所做假设的正确性。用符号表示为,H0:INCOME=2200元。
(2)备择假设(Alternative Hypothesis)H1
备择假设是与原假设对立的假设。若抽样调查分析的结果表明,有充分的理由否定原假设H0的真实性,而拒绝接受原假设,选择其对立的假设——备择假设。如当原假设
H0:INCOME=2200元被否定后,可采用的备择假设为H1:INCOME≠2200元,意思是“新市民的月经济收入平均不等于2200元”。
应该注意的是,建立假设的目的是为了推翻原假设,如果不能推翻原假设,仅仅表示“没有足够的证据来推翻原假设”。这么做的原因是,反证法认为“推翻原假设”比“证明原假设”容易,仅需少数证据就可推翻原假设。所以,备择假设H1往往是实际需证实的假设。
假设检验的方法。首先,提出一对关于总体参数相互对立的假设,然后根据样本的信息对所提出的假设进行检验和抉择。原假设和备择假设对总体参数值的陈述在逻辑上是对立的,有真有伪,二者必具其一,在假设检验中判断假设真伪的惟一依据是样本统计量。原假设是决策者有意推翻的假设,但只要样本数据不能提供与原假设显著矛盾的信息,就得承认它的成立,它是在检验过程中始终被假定为真实的假设,即整个假设检验过程都是在原假设成立的基础上进行的。而备择假设则是决策者试图从样本信息中找到“征兆”以支持其真实的假设。但它只有在样本数据提供出与原假设显著矛盾的信息时,才能被认为成立。
5.双侧相伴概率和单侧相伴概率
若H0取等号,检验过程给出的是双侧相伴概率(接受区间1-α,拒绝区间α/2);若H0取“大于等于”或“小于等于”符号,要求单侧相伴概率(接受区间1-α,拒绝区间α),即相同概率下单侧相伴概率拒绝区间是相应双侧相伴概率拒绝区间的2倍。而等号仅能出现在H0中,因为仅当这一假设成立,才能建立表达式,进行后面分析。如要证明某市农民工每天工作时间hr是否高于8小时(真正要证明的是大于8小时);农民工每月经济收入income是否低于当地平均水平2500元,即可做如下假设,前者称作右侧检验,后者称作左侧检验:
H0:hr≤8小时 H1:hr>8小时
H0:income≥2500元 H1:income<2500元
不管是单侧检验还是双侧检验,原假设H0一定带有等号,备择假设一定没有等号。真正想证明的一定放在备择假设内,因为推翻原假设比承认原假设更容易。推翻了原假设就承认了备择假设。
图7.1 双侧、单侧检验的拒绝域分布
(a)双侧检验;(b)左则检验;(c)右侧检验
6.两类错误
无论接受或拒绝假设,都不可能做到百分之百的正确,总会伴有一定的错误。在统计学中把可能出现的错误归为I类错误和II类错误。当原假设H0正确而被拒绝时,作称作第一类错误,犯第一类错误(以真为假)的概率记作α。当原假设H0不正确而接受时,称作第二类错误(以假为真),犯第二类错误的概率记作β。这两类错误是相互替补的,犯第I类错误的概率增加,必将造成第II类错误概率减少;反之亦然。只有增加发生第一类错误的概率时,发生第二类错误的概率才会降低。一般的做法是控制α概率为5%,而不管β的数值。比如警察抓小偷,错放小偷(以真为假)的概率为α,而抓错人(以假为真)的概率为β。α与β是矛盾的,控制前者,后者将增加。一般仅关注前者的错误概率,因为“以真为假”所花费的社会代价大,而对于β一般是不加以控制。
7.采用哪种分布
假设检验有参数检验与非参数检验之分。参数检验是只对总体未知参数进行的检验,如总体均值检验和总体比例检验;非参数检验是在总体分布形式未知或知之甚少的条件下所进行的检验。不同的抽样组织方式所采用的检验方法有所不同,第二节讨论参数检验问题。第三节讨论非参数的假设检验问题。参数检验分平均数参数检验、成数参数检验和方差检验等。
三、假设检验的基本程序
假设检验和参数估计不一样的是,前者有固定的程序。无论是总体平均数和总体成数检验都是如此。统计假设检验方法大致可总结为下述几个基本步骤。
第一步:建立统计假设。即根据已知的信息,在经过周密考虑之后提出原假设H0和备择假设H1。其中,备择假设H1是检验中要予以证实的假设,如果原假设被拒绝了就等于接受了备择假设,备择假设也称为原假设的对立事件。
第二步:选择检验的显著性水平,在原假设成立的条件下,由被检验统计量的分布求出相应的临界值(一般为0.05或0.01,默认值为0.05),该临界值即为原假设的拒绝域和接受域的分界线。
第三步:确立检验统计量,并依据样本信息计算检验统计量的实际值。这是检验中最为关键的一步。假设检验并不是直接通过样本观察值,而是通过由样本所构造的适当的统计量来进行的。而这一切是在原假设成立的条件下,推算出其概率分布状态。
第四步:将实际求得的检验统计量取值与临界值进行比较。若计算的统计量大于临界值、统计量的概率小于临界值(P<α=0.05),则落入拒绝域中,拒绝原假设H0,接受备择假设;如果样本统计量的值小于临界值、概率大于临界值(P>α),则原假设落入H0接受域中,可选择“没有足够的证据拒绝原假设”,拒绝备择假设。其中最关键的是第一步和第三步。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。