第二节 单因子方差分析
单因子方差分析所涉及的因子只有一个,而这个因子又具有多种水平。分析的目的在于判断多种水平之间的差异是否显著,以及哪种水平为最优水平。
一、方差分析的程序和方法
(1)设计试验方案、搜集试验数据。若将考察的因子用A表示,则A1,A2,A3……Aγ,表示试验所选择的水平(不同的状态或方案),xij表示试验获得的数据。如[例9.1]中有三种水平:A1,A2,A3,A4,A5,每种水平有5个试验数据(n1=n2=n3=5,其可以不相等)。用表9.1来表示。
由此求得组平均值:总平均值22.33。
(2)建立原假设H0。即假定各组(方案)均值相等,其差异主要是由于随机误差的原因;其对立的原假设是备择假设H1,假定各因子水平的均值不相等。单因子方差分析就是要在这二者中作出判断。
(3)计算方差,编制方差分析表基本过程
①求各组的样本平均数:
②求第i组及所有各组内的误差平方和:
③求各组组间误差平方的总和:
④求各组样本平均数的平均数(总平均数):
⑤计算组内离差平方和:
⑦计算组间方差(S12)、组内方差(S22)和总方差(S2)。计算式如表9.3所示。
⑧编制单因子方差分析表,格式见表9.4。
表9.3 单因子方差分析表
各组组内误差平方和分别为:10,40,18。
各组的组内误差平方和:Q1=10+40+18=66。
全部数据总离差平方和:Q=Q1+Q2=68+23.3=91.3(见表9.4)。
表9.4 方差分析表
(4)计算统计量F,作F检验。上例F=S12/S22=2.06,显著水平α= 0.05,在F分布表中查得F0.05(2,12)=3.89<F=86.3,F<F0.05,所以没有理由拒绝原假设H0,即认为三种不同文化程度的妇女初婚年龄没有显著性的差别。
(5)计算效应值,选择最优水平。
本例大学及其以上文化程度者初婚年龄最高,初中及其以下文化程度的妇女初婚年龄最早,表明文化程度越高初婚年龄越高,学习推迟了初婚时间。
二、方差分析的基本思想
从本例看,方差分析是把全部数据的离差平方和分解为两大部分。一部分是可控因素的影响(因子水平不同)造成的离差平方和——组间离差,一部分是不可控因素(随机因素)影响造成的误差平方和——组内离差。据此计算的因子方差与误差方差之间的差异越大,随机因素影响(组内离差)则越小,因子各水平的(组间)差异就越明显,反之则相反。对于ni(每组样本)不相等时,可以同样计算。
三、范例分析
[例9.3]某灯泡厂用四种不同配料材料制成的灯丝,生产四批灯泡。在每批灯泡中随机地抽取若干个灯泡测其使用寿命(单位:小时),数据列于表9.5中。现在想知道,对于这四种灯丝生产的灯泡,其使用寿命有无显著差异。
表9.5 四种不同配料方案制成灯丝的灯泡寿命(单位:小时)
解:本例是一个样本容量不等的单因子方差分析。
显著性水平α=0.05,查表F0.05(4-1,26-3-1)=F0.05(3,22)=3.05
各水平的误差平方和分别为:22771,84080,46688,24550。
组内误差平方和:Q1=22771+84080+46688+24550=178089。
全部数据总离差平方和:Q=Q1+Q2=178089+39802=217891
表9.6 方差分析表
续上表
由于F0.05(3,22)=3.05>F=13267/8095=1.639,说明没有足够的证据拒绝原假设H0,即组间并不明显大于组内误差。或者说,有95%即(1-α)的把握认为,四种配料生产的灯泡质量没有显著差异。虽然其中第一、第三种配料生产的灯泡平均使用时间较长、质量较好,而第四种配料质量较差。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。