5.2.4 正交实验设计结果的方差分析
1.因子的显著性检验
上例中采用极差分析的方法可确定各实验因素对目标影响的大小,对各个因素的作用大小进行排序,但不能回答每个因素对目标值的影响在统计上是否具有显著性。要回答这个问题,需要利用方差分析(Analysis of Variance,ANOVA)和统计检验来比较各实验因素的显著性强弱。
如果问题中只考虑一个因子,这样的方差分析称为单因子方差分析。如果问题中要考虑两个因子,这样的方差分析就称为双因子方差分析。当然,还可以有三因子、四因子、更多因子的方差分析。
我们先来看单因子方差分析。
问题 设某个指标的取值可能与一个因子A有关,因子A有r个水平:A1,A2,…,Ar。在这r个水平下的指标值,可以看作是r个相互独立、方差相等的正态总体ξi~N(μi,σ2),i=1,2,…,r。
在每一个水平Ai下,对指标做t(t>1)次重复观测,设观测结果为
它们可以看作是总体ξi的样本。即
问:因子A对指标的作用是否显著?
检验因子A的作用是否显著,相当于要检验假设H0∶μ1=μ2=…=μr是否成立。
SSi=反映了各水平Ai的内部指标取值的差异程度,这种差异完全是由误差引起的,而SSe正是所有SSi的总和,所以称为误差平方和。
SSA=t反映了各水平之间指标取值的差异程度,如果因子A的作用不显著,各水平下对应的指标差异很小,即,,…,近似相等,与差异很小,SSA的值也比较小;如果因子A的作用显著,各水平下对应的指标差异很大,即,…,与的差异很大,SSA的值就会偏大。因此SSA的大小反映了因子A作用的大小,称为因子A的平方和。
可以证明,总平方和SST、误差平方和SSe和因子平方和SSA之间存在如下关系
由SSA、SSe可以计算出统计量MSA=(称为因子A的均方)和MSe=(称为误差均方),定义因子A的显著性检验统计量
若FA>Fr-1,n-r(α),可拒绝原假设,即认为因子A在1-α置信水平下作用显著;否则,接受原假设,认为因子A在1-α置信水平下的作用不显著。
2.不考虑交互作用的正交实验设计
不考虑交互作用的正交实验设计和数据处理,可按下列步骤进行。
(1)选正交表Ln(rm)
选择的原则是:r要等于因子的水平数;m要大于或等于因子的个数;n是实验次数,要尽可能小。
例如,问题中有4个因子,每个因子都是2个水平。选正交表时,首先要选r=2的表。这样的正交表有L4(23),L8(27),L16(215),…,在L4(23)中,m=3,小于因子个数4,所以不符合要求。L8(27),L16(215)中的m=7,15,…,大于因子个数4,符合要求。在符合要求的正交表中,应选择实验次数n尽可能小的那个表。最后选定正交表L8(27)。
(2)设计表头
将各因子安排在正交表的各列上方,每个因子占1列,称之为表头。在不考虑交互作用的正交实验设计中,表头上的因子可以任意安放。表头上不放因子的列,称为空白列。
(3)按照设计做实验,取得实验观测值
正交表的每一行代表一种水平组合,对每一种水平组合做一次实验。按照第k行的水平组合所得到的第k次实验,所得到的观测值记为Xk,正交表共有n行,所以,一共要做n次实验,共得到n个实验观测值:X1,X2,…,Xn。
(4)在正交表的每一列中,求出与各水平对应的均值,以及这一列的平方和
设我们考虑的是第j列。在这一列中,表示水平的数字1,2,…,r,每一个都重复出现次。设与这一列中的数字1对应的那几行的实验观测值之和为W1j,与这一列的数字2对应的那几行的实验观测值之和为W2j,…,与这一行中的数字r对应的那几行的实验观测值之和为Wrj。将W1j,W2j,…,Wrj分别除以,就得到与这一列中各水平对应的均值=
从出发,求出这一列的平方和SSj=,其中是总均值。具体算法是,把,…,看作样本就是样本均值,SSj就是样本方差乘以n[或修正样本方差乘以]。
(5)列方差分析表,作显著性检验
其中,SST=)2是总平方和。SSA,SSB,…,分别是表头为A,B,…的各列的平方和。SSe=SST-SSA-SSB-…-SSAB-…是误差平方和。可以证明,SST=,即总平方和等于各列的平方和之和,所以SSe就是空白列的平方和之和。
fT=n-1是总自由度,fA=fB=…=r-1是各因子的自由度,fe=fT-fA-fB-…是误差自由度。
MSA=,MSB=,…,是各因子的均方,MSe=是误差均方。
可以证明,若因子A的作用不显著,则FA=服从自由度为fA、fe的F分布,即FA<FfA,fe(α);若因子A的作用显著,则统计量FA的值会偏大,即FA>FfA,fe(α)。所以,像在方差分析中一样,只要给定显著水平α,就可以用F分布检验因子A,B,…的作用是否显著。
(6)寻找最优水平组合
对每个因子,在以它为表头的那一列中,比较各水平的均值的大小,可以确定哪一个水平最优。
由于不考虑交互作用,所以只要将各因子的最优水平组合起来,就是最优水平组合。
下面看一个实际例子。
例5-3 某化工厂为提高产品的收率,进行3因子3水平正交实验。所取的因子和水平分别为
A(反应温度,℃):分80,85,90三个水平。
B(反应时间,min):分90,120,150三个水平。
C(用碱量,%):分5%,6%,7%三个水平。
要求进行不考虑交互作用的正交实验设计,检验因子A,B,C的作用是否显著(显著水平α=0.05),并且找出最优水平组合。
解:(1)选正交表。按照r=3,m≥3,n尽可能小的原则,选用L9(34)。
(2)设计表头。将因子A,B,C安排在第1,2,3列。
(3)按照要求设计做实验,取得实验观测值。实验得到的观测值如表5-4所示。
表5-4 L9(34)正交实验表及其结果
(4)求各列与各水平对应的均值和各列的平方和。计算结果如表5-5所示。
(5)列方差分析表,做显著性检验。
表5-5 表5-4实验结果的方差分析
因为FA=34.33>19.0=FfA,fe(α),所以因子A作用显著。
因为FB=6.33<19.0=FfB,fe(α),所以因子B作用不显著。
因为FC=13.00<19.0=FfC,fe(α),所以因子C作用也不显著。
(6)寻找最优水平组合。
对于因子A,因为A1的均值=41,A2的均值=48,A3的均值=61,其中最大,所以A3是最优水平。
对于因子B,因为B1的均值=47,B2的均值=55,B3的均值=48,其中最大,所以B2是最优水平。
对于因子C,因为C1的均值=45,C2的均值=57,C3的均值=48,其中最大,所以C2是最优水平。
把3个因子的最优水平组合起来,就得到最优水平组合(A3,B2,C2),即反应温度为90℃,反应时间为120min,用碱量为6%。
由于因子B很不显著,即反应时间的不同对于收率没有显著的影响,为了节省反应时间,也可以考虑把反应时间缩短为90min,选用水平组合(A3,B1,C2)。而因子C的作用也不是十分显著,即用碱量的不同对于收率没有太大的影响,如果希望节省用碱量,还可以把用碱量改为5%,选用水平组合(A3,B1,C1)。
得到最优水平组合后,还可以在该水平组合下或在其附近再做几次实验,看看该条件是否确实最优,是否还可以改进,进一步得到更好的结果。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。