在实际中,常常会遇到比较两个总体均值或比较两种处理效应的问题,这就需要分别从两个总体中抽取样本,我们称之谓两样本问题。本节在两个正态总体的假定下,考虑两样本问题,包括均值的比较和方差的比较。
(一)比较两个正态总体均值的假设检验
设正态总体分别是来自这两个总体的独立样本。记
考虑双边假设问题:
显然,当原假设成立时,两样本均值取值应比较接近,即取值偏小,因此我们可取检验统计量为,为了确定检验拒绝域或计算P_值,我们分几种情况进行讨论。
1.当和已知
由抽样分布定理6.3.1和正态分布的性质知,检验统计量。当成立时,。我们采用Z检验,可得拒绝域为
其中为给定样本观察值时检验统计量的取值。
在实际应用中和往往是未知的,我们先考虑比较特殊的情形,即两总体的方差相等时。
2.当但未知
首先,利用合样本对参数给出无偏估计量
根据第1种情形的讨论,我们可取检验统计量为
由抽样分布定理6.3.4知,当成立时,。则检验的拒绝域为
其中为给定样本观察值时检验统计量T的取值。
我们称上述检验为两样本精确t检验。
例8.3.1 在例7.4.5的假定下,检验男生和女生配戴眼镜的平均价格是否有显著差异?
解 设和分别是男生和女生配戴眼镜的平均价格。在两总体的方差相同的假定下,考虑双边假设问题(8.3.1)。将已知资料代入(8.3.2)中,得检验统计量的观察值,
因此,我们有充分的理由认为男生和女生配戴眼镜的平均价格是有显著差异的,由,我们认为女生配戴眼镜的平均价格要显著高于男生。
下面考虑更一般的情形,即两总体的方差不等时。
3.当且未知
此时,我们分别以两样本方差作为和的无偏估计,可取检验统计量为
当两样本容量都充分大时,由大数定律和中心极限定理可得,原假设成立时统计量T近似服从标准正态分布N(0,1)。则检验拒绝域为
其中为给定样本观察值时检验统计量的取值。
对于小样本情形,当成立时,统计量T近似服从t分布,自由度为
或更精确的近似自由度为
我们称上述的几种检验为两样本近似t检验。
注 对于比较两正态总体均值的单边假设问题,类似于前一节的介绍,我们可以分别给出上述三种情形的检验规则,这里不作详细阐述。
例8.3.2 杀虫剂DDT的毒性会引起哺乳动物的肌肉痉挛。研究人员希望了解痉挛产生的原因进行了一项随机对比试验、其中6只中毒的小白鼠为实验组,6只没有中毒的小白鼠为对照组。检验DDT毒性的方法是对小白鼠的神经进行电子刺激。在一般情况下,当神经受到刺激时,电子仪器上会显示出一个明显的尖峰信号,随后的第二个尖峰信号会变得很弱。而中毒的小白鼠的第二尖峰信号显示则要比正常小白鼠强烈得多。所以,研究人员主要观测并测量小白鼠神经受到刺激时,第二个尖峰信号的强度与第一尖峰信号强度的百分比。测量结果如下:
假设两组数据都来自正态总体,试检验杀虫剂DDT的毒性是否会引起哺乳动物的肌肉痉挛?
解 记和分别为试验组(即中毒组)和对照组白鼠的第二尖峰信号强度相对于第一尖峰信号强度的平均百分比。要检验杀虫剂DDT的毒性是否会引起哺乳动物的肌肉痉挛,需考虑右边假设问题
由数据资料可以看到试验组的数据比对照组的数据更为分散,不能认为两总体方差相等,因此需采用近似的t检验。检验统计量为(8.3.3),并取公式(8.3.6)的自由度。由样本资料计算得,t分布近似自由度为,检验统计量观察值为,P_值为,因此,我们有98.48%的把握拒绝原假设,即认为中毒组的白鼠的第二尖峰信号强度是要显著强于对照组(没有中毒组),从而可以推断,杀虫剂DDT的毒性是会引起哺乳动物的肌肉痉挛。
(二)比较两个正态总体方差的假设检验
在前面有关两正态总体的均值比较问题中,当两总体的方差未知时,我们首先需对两总体方差是否相等进行检验,即考虑下列假设问题
取检验统计量为
当成立时,,且此时F的取值既不能偏大,也不能偏小,因此检验的拒绝域为
注 在实际处理两样本问题时,首先要检验两总体的方差是否相等,再进行两总体的均值比较。如果在一定的显著水平下,检验结果两总体方差相等,则采用两样本精确t检验,否则采用两样本近似t检验来比较两总体的均值。
例8.3.3 研究表明钙的摄入量与血压之间存在某种联系,在黑人身上这种联系尤为显著。这样的观察性研究并不能明确它们之间的因果关系,因此,研究人员设计了一项随机比较试验。试验的研究对象是21名健康的男性黑人,随机地抽取其中的10人为实验组,向他们提供为期12周的含钙食物,其余的11人接受等量的安慰剂。试验是各自独立进行的,响应变量为12周后对各试验对象测量其收缩压的下降值(单位:毫米汞柱)。
试利用假设检验的思想作出统计推断。
解 设X和Y分别为服钙组和服安慰剂组的收缩压下降值,并分别服从正态分布和。根据样本资料计算结果如下:
首先比较两总体的方差是否相等,即考虑假设(8.3.7)。检验统计量的观察值为,利用Excel得,即有。同时,由于,利用Excel可计算得P_值为。因此,我们接受方差相等的假设,下面我们采用精确t检验对两组均值进行比较,因,考虑两总体均值的右边检验
两组合样本方差为,检验统计量的观察值为,P_值为。因此,我们作出拒绝原假设的判断,从而有充分的理由认为增加食物中钙的含量是会降低血压。
在Excel中,先利用FTEST函数进行两样本的方差齐性检验,再利用TTEST函数进行两样本的均值比较,例8.3.3的具体计算步骤如下:
(1)将两组数据输入Excel表格中,设数据区域分别为A1,A10和B1:B11;
(2)在Excel表中任选一空白单元格(例如:C1单元格)下拉菜单“插入”选项卡单击“函数”在类别的下拉式菜单中,选择“统计”选项选择“FTEST”在弹出的对话框的“Arrayl”文本框中输入“A1:A10”,“Array2”文本框中输入“B1:B11”点击Enter键C1单元格即可显示P_值为“0.52329”(双侧概率),因此认为两总体方差相同。
(3)在Excel表中任选一空白单元格(例如:C2单元格)下拉菜单“插入”选项卡单击“函数”在类别的下拉式菜单中,选择“统计”选项选择“TTEST”=在弹出的对话框的“Arrayl”文本框中输入“A1:A10”,“Array2”文本框中输入“B1:B11”,“Tails”文本框中输入“1”,“Type”文本框中输入“2”点击Enter键C1单元格即可显示P_值为,“0.041317”,因此作出拒绝原假设的判断。
例8.3.4 对§8.1节中的例8.1.3作出统计推断。
解 设X和Y分别为每分钟男、女的脉搏次数,并分别服从正态分布和,由已知数据计算得
样本方差明显大于,我们先考虑比较两总体方差的假设检验。检验统计量的观察值为,利用Excel可计算得P_值为。因此,我们认为两总体方差显著不相等,我们需采用近似t检验对两组均值进行比较。因,考虑两总体均值的左边检验
检验统计量的观察值为,t分布的近似自由度为,P_值为。因此,我们作出拒绝原假设的判断,即有充分的理由认为女性平均每分钟脉搏次数要多于男性。
Excel中例8.3.4的具体计算步骤如下:
(1)将两组数据输入Excel表格中,设数据区域分别为A1,A16和B1:B13;
(2)在Excel表中任选一空白单元格(例如:C1单元格)下拉菜单“插入”选项卡单击“函数”在类别的下拉式菜单中,选择“统计”选项选择“FTEST”在弹出的对话框的“Arrayl”文本框中输入“A1,A16”,“Array2”文本框中输入“B1,B13”,点击Enter键C2单元格即可显示P_值为“0.018026”(双侧概率),因此认为两总体方差不相同。
(3)在Excel表中任选一空白单元格(例如:C2单元格)下拉菜单“插入”选项卡单击“函数”在类别的下拉式菜单中,选择“统计”选项选择“TTEST”在弹出的对话框的“Arrayl”文本框中输入“A1:A16”,“Array2”文本框中输入“B1,B13”,“Tails”文本框中输入“1”,“Type”文本框中输入“3”点击Enter键C2单元格即可显示P_值为“0.016028”(采用较精确的自由度的t检验),因此作出拒绝原假设的判断。
表8.3.1 正态总体均值、方差的检验法(显著性水平为α)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。