1.1.1 试验设计的内涵
试验设计(design of experiment,DOE)也称为实验设计,是以概率论和数理统计为理论基础,经济地、科学地安排试验的一项技术。通过对数据资料进行正确的整理、分析,可以揭示事物的本质特性及内在联系,进而使人们得以能动地认识世界和改造世界。试验设计和统计分析是互为前提和条件的。只有理解、掌握了一定的统计分析原理和方法,并结合坚实的专业知识和必要的实践经验,才可能正确地进行试验设计。反过来,只有在试验设计正确的基础上,通过对试验所获取的数据资料进行正确地统计分析,才可能真正揭示事物的本质特性及内在联系,得出可靠的结论,进而正确地指导实践。
1.1.2 试验设计与数据处理的发展历史
试验设计自20世纪20年代问世至今,其发展大致经历了3个阶段,即早期的单因素和多因素方差分析、传统的正交试验法和近代的调优设计法。到目前为止,本学科经过了90多年的研究和实践,已成为广大技术人员与科学工作者必备的基本理论知识。实践表明,该学科与实际的结合,在工农业生产中产生了巨大的社会效益和经济效益。
20世纪20年代,英国生物统计学家及数学家费歇(R.A.Fisher)首先提出了方差分析,并将其应用于农业、生物学、遗传学等方面,取得了巨大的成功,在试验设计和统计分析方面作出了一系列先驱工作,开创了一门新的应用技术学科,从此试验设计成为统计科学的一个分支。20世纪50年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,在方法解说方面深入浅出,为试验设计的更广泛使用作出了巨大的贡献。
我国从20世纪50年代开始研究这门学科,并在正交试验设计的观点、理论和方法上都有新的创见,编制了一套适用的正交表,简化了试验程序和试验结果的分析方法,创立了简单易学、行之有效的正交试验设计法。同时,著名数学家华罗庚教授也在国内积极倡导和普及“优选法”,从而使试验设计的概念得到普及。随着科学技术工作的深入发展,我国数学家王元和方开泰于1978年首先提出了均匀设计,该设计考虑如何将设计点均匀地散布在试验范围内,使得能用较少的试验点获得最多的信息。
随着计算机技术的发展和进步,出现了各种针对试验设计和试验数据处理的软件,如SAS(statistical analysis system),SPSS(statistical package for the social science),Matlab Origin和Excel等,它们使试验数据的分析计算不再繁杂,极大地促进了本学科的快速发展和普及。
1.1.3 试验设计与数据处理的意义
在科学研究和工农业生产中,经常需要通过试验来寻找所研究对象的变化规律,并通过对规律的研究达到各种实用的目的,如提高产量、降低消耗、提高产品性能或质量等,特别是新产品试验,未知的东西很多,要通过大量的试验来摸索工艺条件或配方。
自然科学和工程技术中所进行的试验,是一种有计划的实践,只有科学地试验设计,才能用较少的试验次数,在较短的时间内达到预期的试验目标;反之,不合理的试验设计,往往会浪费大量的人力、物力和财力,甚至劳而无功。另外,随着试验进行,必然会得到大量的试验数据,只有对试验数据进行合理地分析和处理,才能获得研究对象的变化规律,达到指导生产和科研的目的。可见,最优试验方案的获得,必须兼顾试验设计方法和数据处理两方面,两者是相辅相成、互相依赖、缺一不可的。
在试验设计之前,试验者首先应对所研究的问题有一个深入的认识,如试验目的、影响试验结果的因素、每个因素的变化范围等,然后才能选择合理的试验设计方法,达到科学安排试验的目的。在科学试验中,试验设计一方面可以减少试验过程的盲目性,使试验过程更有计划;另一方面还可以从众多的试验方案中,按一定规律挑选出少数具有代表性的试验。
合理的试验设计只是试验成功的充分条件,如果没有试验数据的分析计算,就不可能对所研究的问题有一个明确的认识,也不可能从试验数据中寻找到规律性的信息,因此试验设计都是与一定的数据处理方法相对应的。试验数据处理在科学试验中的作用主要体现在以下5个方面:
①通过误差分析,可评判试验数据的可靠性。
②确定影响试验结果的因素主次,从而可抓住主要矛盾,提高试验效率。
③确定试验因素与试验结果之间存在的近似函数关系,并能对试验结果进行预测和优化。
④获得试验因素对试验结果的影响规律,为控制试验提供思路。
⑤最优试验方案或配方的确定。
试验设计(experiment design)与数据处理(data processing)虽然归于数理统计的范畴,但它们也属于应用技术学科,具有很强的适用性。一般意义上的数理统计的方法主要用于分析已经获得的数据,对所关心的问题作出尽可能精确的判断,而对如何安排试验方案的设计却没有过多的要求。试验设计与数据处理则是研究如何合理地安排试验,有效地获得试验数据,然后对试验数据进行综合的科学分析,以求尽快达到优化实验的目的。因此,完整意义上的试验设计实质上是试验的最优化设计。
1.1.4 试验设计基本术语
1)总体与样本
根据研究目的确定的研究对象的全体称为总体(population)。其中的一个独立的研究单位称为个体(individual),依据一定方法由总体抽取的部分个体组成的集合称为样本(sample)。例如,研究某企业生产的一批罐头产品的单听质量,该批所有罐头产品单听质量的全体就构成本研究的总体;从该总体抽取100听罐头测其单听质量,这100听罐头单听质量即为一个样本,这个样本包含有100个个体。含有有限个个体的总体称为有限总体(finite population)。例如,上述一批罐头总体虽然包含的个体数目很多,但仍为有限总体。包含有无限多个个体的总体称为无限总体(infinite population)。例如,在统计理论研究中服从正态分布的总体、服从t分布的总体包含一切实数,属于无限总体。在实际研究中还有一类总体称为假想总体。例如,用几种工艺加工某种产品的工艺试验,实际上并不存在用这几种工艺进行加工的产品总体,只是假设有这样的总体存在,把所得试验结果看成是假想总体的一个样本。样本中所包含的个体数目称为样本容量或样本大小(sample size)。例如,上述一批罐头单听质量的样本容量为100。样本容量常记为n。通常,n≤30的样本称为小样本,n>30的样本称为大样本。统计分析通常是通过样本来了解总体。这是因为有的总体是无限的、假想的,即使是有限的但包含的个体数目相当多,要获得全部观测值须花费大量人力、物力和时间;或者观测值的获得带有破坏性,如苹果硬度的测定,不允许对每一个果实进行测定。研究的目的是要了解总体,然而能观测到的却是样本,通过样本来推断总体是统计分析的基本特点。为了能可靠地从样本来推断总体,这就要求样本具有一定的含量和代表性。只有从总体随机抽取的样本才具有代表性。所谓随机抽样(random sampling),是指总体中的每一个个体都有同等的机会被抽取组成样本,然而样本毕竟只是总体的一部分,尽管样本具有一定的含量和代表性,但是通过样本来推断总体也不可能百分之百的正确。有很大的可靠性,但有一定的错误率是统计分析的又一特点。
2)参数与统计量
为了表示总体和样本的数量特征,需要计算出几个特征数。由总体计算的特征数称为参数(parameter);由样本计算的特征数称为统计量(statistic)。常用希腊字母表示参数,如用μ表示总体平均数,用σ表示总体标准差;常用拉丁字母表示统计量,如用x 表示样本平均数,用S表示样本标准差。总体参数由相应的统计量来估计,如用x 估计μ,用S估计σ等。
3)准确性与精确性
准确性(accuracy)也称准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。设某一试验指标或性状的真值为μ,观测值为x,若x与μ相差的绝对值x-μ 小,则观测值x准确性高;反之,则低。精确性(precision)也称精确度,是指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。若观测值彼此接近,即任意两个观测值xi,xj相差的绝对值xi-xj 小,则观测值精确性高;反之,则低。准确性、精确性的意义如图1.1所示。图1.1(a)中观测值密集于真值μ两侧,其准确性高,精确性也高;图1.1(b)观测值密集于远离真值μ的一侧,其准确性低,精确性高;图1.1(c)观测值稀疏地散布于远离真值μ的两侧,其准确性、精确性都低。
图1.1 准确性与精确性的关系示意图
调查或试验的准确性、精确性合称为正确性。在调查或试验中应严格按照调查或试验计划进行,准确地进行观测记载,力求避免人为差错,特别要注意试验条件的一致性,除所研究的处理外,其他供试条件应尽量控制一致,并通过合理地调查或试验设计努力提高试验的准确性和精确性。由于真值μ常常不知道,因此准确性不易度量,但利用统计方法可度量精确性。
4)随机误差与系统误差
在试验中,试验指标除受试验因素影响外,还受到许多其他非试验因素的干扰,从而产生误差。试验中出现的误差分为两类:随机误差(random error)与系统误差(systematic error)。随机误差也称抽样误差(sampling error),这是由于许多无法控制的内在和外在的偶然因素所造成,如原料作物的生长条件、生长势的差异,以及食品加工过程中机械设备运转状态的偶然变化等。这些因素尽管在试验中力求一致但不可能绝对一致。随机误差带有偶然性质,在试验中即使十分小心也难以消除,但可通过试验控制尽量降低,并经对试验数据的统计分析来估计。随机误差影响试验的精确性。统计上的试验误差是指随机误差,这种误差越小,试验的精确性越高。系统误差也称片面误差(lopsided error),这是由于供试对象的品种、成熟度、病程等不同,食品配料种类、品质、数量等相差较大,仪器不准、标准试剂未经校正,药品批次不同、药品用量以及种类不符合试验的要求等引起。试验中的系统误差是无法估计的,因此应当通过试验设计彻底消除之。观测、记载、抄录、计算中的错误等也将引起误差,这种误差实质上是错误。系统误差影响试验的准确性。图1.1(b)、(c)所表示的情况就是由于出现了系统误差的缘故。一般来说,只要试验工作做得精细,系统误差容易克服。图1.1(a)表示克服了系统误差的影响,且随机误差较小,因而准确性高、精确性也高。
1.1.5 试验设计的基本原则
1)重复原则
重复是指在试验中每种处理至少进行两次以上。重复试验是估计和减小随机误差的基本手段。一般来说,重复次数越多越好。重复试验的目的是估计和减小随机误差。
2)随机化原则
随机化原则就是在试验中每一个处理及每一个重复都有同等的机会被安排在某一特定的空间和时间环境中,以消除某些处理或其重复可能占有的“优势”或“劣势”,保证试验条件在空间和时间上的均匀性。
3)对照原则
对照原则包括空白对照、安慰剂对照、实验条件对照、标准对照、历史或中外对照。
4)区组原则
人为划分的时间、空间、设备等实验条件,称为区组。区组因素也是影响实验指标的因素,但并不是实验者所要考察的因素,故也称为非处理因素。
【相关链接】
试验设计还有哪些常见术语?
(1)试验指标(experimental index)
在试验设计中,根据试验的目的而选定的用来衡量或考核试验效果的质量特性,称为试验指标。
(2)试验因素(experimental factor)
试验中,凡对试验指标可能产生影响的原因,都称为因素。通常把试验中所研究的影响试验指标的因素称为试验因素;把除试验因素外其他所有对试验指标有影响的因素称为条件因素,又称试验条件。
(3)因素水平
在试验中,为考察试验因素对试验指标的影响情况,要使试验因素处于不同的状态。把试验因素所处的各种状态称为因素水平,简称水平。
(4)试验处理
试验处理简称处理,在单因素试验中,试验的一个水平就是一个处理。试验处理是指事先设计好的实施在试验单位上的一种具体措施。
反思与练习
1.试验设计与数据处理的意义是什么?
2.试验设计基本术语及其含义是什么?
3.试验设计的基本原则是什么?
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。