第三节 实验中的研究变量
一、变量的含义
变量,是实验研究中的一个专用术语,与常量是相对的概念,指在质或量上可以变化且可以测评的概念、因素、条件和属性,换言之,变量就是会变化的、有差异的因素。(12)
变量会随着条件、情景的变化而在数量或类型上发生一定的变化,又称“因子”或“因素”。教育实验控制方法的思路是:对实验变量进行严格的界定,有效地操纵和运作。那么变量可以分为哪几类呢?
二、变量的类型
教育实验的变量是指与实验有关的条件、现象或特征,按其在教育实验中的作用,可分为自变量、因变量和无关变量。一项成功的教育实验应当准确把握这三个要素,即操纵自变量、观测因变量、控制无关变量。(13)
(一)自变量
自变量,又称“刺激变量”,是引起或产生变化的原因,是研究者操纵的假定存在因果关系中的原因变量,即研究者施加于被试的可以操纵的教育影响。当两个变量存在某种联系,其中一个变量对另一个变量具有影响作用,我们称那个具有影响作用的变量为自变量。
自变量的变化水平完全取决于研究者的操纵与设计。例如,研究学生智力与学业成绩的关系,学生智力的高低影响学业成绩,那么智力就是该项研究的自变量,是研究者要操纵的原因变量。
研究者能否成功地操纵自变量,使之真正有效地作用于被试,是实验成功的关键之一。操纵自变量有两层意思。
一是要使自变量发生合乎实验要求的变化,通常有两种变化状况:一种变化是从无到有的变化,即从没有这种教育影响(教育措施)到有这种教育影响(教育措施),如实验中对控制组不作评价和对实验组作评价;另一种变化是有这种教育影响,但在形式上、层次上有差异,如实验中有三个实验组,分为表扬、训斥和静听三个层次,以体现其变化。不管是哪一种变化,操纵自变量就要使自变量发生变化。
二是要使自变量真正有效地作用于被试,以期引起被试的变化,即要把自变量具体化为几个可以操作的教育方案并加以实施。比如,在实验中将关于学生加法练习的评价态度分为表扬、训斥、静听(不直接进行评价)及不作任何评价这四种不同形式,并且设计了四种不同的教育方案,在方案中对每一种形式都作了具体规定,这样的实验就具有可操作性。
(二)因变量
因变量又称“反应变量”、“输出变量”、“依变量”、“实验结果”。它是通过自变量的作用而发生变化的结果变量,是自变量作用于被试后产生的效应,是研究者要测定的假定的结果变量。其中一个变量对另一个变量具有影响作用,我们称那个被影响的变量为“因变量”。例如,我们想研究噪声对学习效果的影响,噪声就是自变量,研究者可通过改变噪声的持续时间或强度等来操纵这个变量;而学习效果则是因变量,它是噪声这个自变量作用于被试后产生的效应,是研究者要测量的结果变量。
因变量是一种假定的结果变量,它是实验变量作用于实验对象之后所出现的效果变量。比如实验研究中学生加法练习的成绩就属于因变量。科学地观测因变量是教育实验成功的又一个关键。为了解自变量对因变量是否有影响,除了要操纵自变量,使之发生变化外,还必须观测因变量是否也随之发生了变化。这需要考虑几个问题。其一是要确定观测哪些因变量。自变量作用于被试后,被试可能在许多方面发生了变化,其教育效果往往可表现在许多方面,究竟从哪些方面来观测教育效果,在实验前必须明确。其二是如何对因变量进行测定。教育效果的测定项目确定后,需考虑通过怎样的方式把这些项目的效果测定出来,是口头测定、书面测定,还是操作测定;是个别测定,还是集体测定。使用口头测定的要拟订发问提纲和记录方式,使用书面测定的要制订好问卷,使用操作测定的要准备好器材、拟订操作要求。其三,当项目和测定方式确定后,还要确定如何评定成绩,是采用等级评定,还是打分数,等等,各种评定标准及试卷的得分标准都须具体明确。
(三)无关变量
无关变量也被称为“干扰变量”、“控制变量”,是指与特定研究目标无关的非研究变量,即除了研究者操纵的自变量和需要测定的因变量之外的一切变量,是研究者不想研究,但会影响研究进程的,需要加以控制的变量。例如,研究两种不同的教学方法对学生学业成绩的影响,在这里教学方法是自变量,学业成绩是因变量,除此以外其他各种因素都是无关变量。无关变量在这项研究中,可能会有教学时间、教学环境、学生的智力、原有的知识基础、家教辅导等各种因素,这些因素会干扰自变量和因变量的对应关系。当这些因素与自变量——教学方法的作用混杂在一起时,往往导致人们难以确定两种教学方法效果的优劣,无法判断最终的研究结果(因变量)是来自教学方法(自变量),还是来自教学时间、教学环境、学生的智力、原有的知识基础、家教辅导等其他各种因素(无关变量)。如果研究者能有效地控制这些无关变量,研究结果就会比较明确可靠。
通常,无关变量又可以分为以下两类:第一类,绝对无关变量,即与教育活动无关或违反教育规律的因素;第二类,除了绝对无关变量之外其余的都是相对无关变量。相对无关变量会对实验结果带来很多的影响。因此,在教育实验中,实验者应该设法控制相对无关变量对实验因变量的作用,以防止或减少它对教育实验结果的干扰。
三、变量的控制
教育研究中,“控制”这个术语表示研究者对整个研究过程的把握与操纵。从广义上说,控制表示研究者能够操纵或选择自变量的变化水平,选择因变量及测量因变量的方法,控制研究过程中的无关变量。从狭义上说,控制是指对影响自变量和因变量之间对应关系的无关变量的处理和控制。控制在教育研究过程中具有重要作用,它是决定研究结果是否真实可靠的重要因素。(14)
(一)自变量的控制
自变量的控制,是指在研究过程中对刺激变量的操纵变化。对自变量控制的好坏,将直接影响研究的成功与失败。
1.给自变量规定操作定义
操作定义就是对实证性概念或变量加以操作化的过程。对自变量要有一个能进行操作的明确的概念,即操作定义,其目的是为了便于在实验研究中对自变量进行操纵,实现自变量具体化。如果自变量模糊不清,随意变动,就会对实验结果的真实性造成影响。
2.注意刺激物选择操作的严密性
不论何种实验,为了引起被试的反应,都必须给予一定的刺激物、刺激情境或材料,其关键问题就是所选择的刺激物是否正是引起因变量反应的自变量。
3.实验自变量之间的独立性
教育实验中,既有单因素实验,又有多因素实验。在多因素实验中,要求各个实验自变量之间必须有本质的区别,即彼此独立。
(二)因变量的控制
因变量的控制,就是要达到反应变量确实能够反映受测者真实的身心反应。
1.规定好反应变量的操作定义
在教育实验中,需要对因变量进行确立和分解,使其从模糊到清晰、从笼统到精细。对于一些概念性的因变量,尤其要对其进行操作性定义,使其变得具体可操作,能够用一个客观的指标来表示因变量。
2.因变量应具备的特点
为了便于观察和测量,作为反映实验因变量的指标,应具备以下特点。
(1)有效性,即指标要能反映实验目标,可以预期它会随自变量的变化而变化。
(2)客观性,所选的指标是客观存在的,是可以通过一定的方法观察到并具有可验证性。
(3)数量化,即指标能够数量化,便于记录、数据处理和统计分析。
(4)灵敏性,即反映因变量的指标对于自变量的变化应有较高的分辨能力。自变量发生变化,因变量也要随之发生变化,防止出现“天花板效应”和“地板效应”。
3.反应指标的平衡
因变量的不同指标具有不同的含义,适用的条件也不一样,因此研究者需要根据研究的内容和实际情境,选择最有效的反应指标。常用的因变量的观测指标主要有以下几类。
(1)准度,即反应的正确数量。它在观测被试的知识和能力方面的发展状况时常常用到,如某种能力水平的得分等。
(2)速度与灵敏度,即在单位时间内完成任务的数量,如阅读、打字的速度等。
(3)难度水平,即完成任务作业的困难程度,观测学生的知识和能力水平,必须考虑试卷和问题的难度。
(4)频率,即某种行为单位时间内出现的次数。
(三)无关变量的控制
为了保证教育实验的效度,研究者需要通过若干方法消除或最大限度地削弱对未产生直接效果的变量(即无关变量)的影响。
1.消除
控制无关变量的最彻底的方式是不让无关变量介入到研究情境中去,完全排斥在自变量和因变量对应关系之外。例如研究智力(IQ)对短时记忆(STM)的关系,研究者意识到:短时记忆除了受到被试的智力影响外,也可能受到被试的年龄、性别、教育程度、环境因素(如噪声)的影响,为了消除噪声这一无关变量的影响,研究者对被试短时记忆的测量放在隔音室进行。
2.恒定
有些无法排除的无关变量,可以采取使这些变量在研究过程中保持恒常不变的方法,即所有的被试都接受相同的无关变量,把变量变为常量。如要比较两种不同教学方法效果的优劣,当研究者意识到教师的性别、年龄、相貌、语言风格、业务水平等无关变量会对教学方法的效果带来影响时,可以让一位老师担任实验班和对照班的教学,这样教师的性别、年龄、相貌、语言风格、业务水平等无关变量对这两个班来说保持相对恒定。
采用恒定方式控制无关变量的通常包括:对实验条件的控制,同一时间、同一地点、同一主试进行;对研究对象的控制,选择智力、性别、年龄、程度相同的被试进行;对实验过程的控制,按照同一的研究程序、同一的研究步骤进行。
3.均衡
当无关变量无法消除,也不能保持恒定时,研究者可以采取均衡的方法来控制无关变量。通常的做法是设置实验组和控制组,让无关变量产生的作用对实验组和控制组都一致,都保持平衡。也就是说,实验组和控制组在实验条件上都相同,唯一不同的是实验组接受实验处理,而控制组不接受实验处理。设置控制组的方法是控制无关变量常用的方法,它可以控制很多无关变量,且简单、方便。
恒定控制与均衡控制有相似之处,只是控制手段不同。采用恒定控制时,无关变量在组内及组间都没有变化;采用均衡控制时,无关变量在组内有变化,但是变化所产生的作用在各组间是相等的。例如,通过随机取样获得被试20人,其中男性12人,女性8人,要分成两组进行实验。由于性别可能会对因变量产生作用,所以需要控制这个无关变量。当然可以采用恒定控制的方法,以男性或者女性为被试,但这样会减少样本数量,同时也会限制实验结果的概括性,这时可以采用平衡控制方法。将男性12人随机分成两组,一组为实验组,一组为控制组;女性8人也随机分成两组,分别加入实验组和控制组。这样每一组内性别变量有变异(6男4女),而两组间的性别为平衡均等。
4.抵消
有些实验研究,被试需要在各种不同的实验条件下接受重复测量,由于重复测量,练习、迁移、干扰、疲劳、热身等作用会影响因变量的测量效果,研究者可以采用抵消的方式来控制这类无关变量。例如在一项关于比较A、B两种训练方法的效果哪个更好的实验研究中,A、B两种训练方法无论哪个先做,都会对后做的效果产生影响。研究者可以采用一组按照A、B顺序安排实验,另一组则按照B、A顺序安排实验,最后将两组A的实验结果相加,两组B的实验结果也相加,再对A、B进行比较,得出结论。如此设计可以抵消实验顺序的影响。
5.随机
随机是科学研究必须遵循的基本原则。随机化控制是研究者最常用的控制无关变量的方式,也是最有效的控制无关变量的方式。随机化指被试的随机取样、随机分组、随机分配实验处理等。通过随机化可以控制大量的无关变量,通过随机化可以把研究中的很多差异平均地分配到每个个体身上去,从而创造均等。只要在研究中采用随机化程序,无论是已知的还是未知的无关变量,无论无关变量会产生什么样的作用,它对实验组和控制组的影响都可以假定为是相等的。对无关变量的控制,研究者应该首先考虑采用随机化控制,尤其是在无法确定有哪些无关变量会对研究结果造成影响,或不能确定采用什么方法控制无关变量时。
6.盲法
被试之间存在个别差异,这种差异会对研究结果造成影响,当然要严格控制。有时,被试知道自己在实验组或了解实验真实意图,就有可能作出反常行为,这会影响实验结果。如表现出情绪高涨,加倍努力,或设法迎合研究者的口味等,从而影响实验效度。有时主试也是无关变量,也会对研究结果造成影响。如主试的年龄、性别、身份、地位、态度、情绪等都会影响被试的学习、记忆、学业成绩、心理测量等。甚至主试的偏见、期望不但会影响作为人的被试,也会对动物的行为产生作用。当主试知道谁在实验组,谁接受了实验处理,就可能会有意无意地给予某些暗示,赋予某种期望,从而影响研究结果的客观性。
盲法是指采用隐蔽手段,控制实验参与者的偏差或期待的一种控制无关变量的方法。在实验中,如果被试不知道自己在参与实验或正在接受某种实验处理,称之为“单盲”。例如,给儿童吃治疗多动症的药,看效果如何,为了在班级里进行观察比较,有些儿童吃药(实验组),有些儿童服安慰剂(控制组),只有老师知道谁吃了药,谁服用了安慰剂。这种方法使实验组和控制组的实验情景同一化,可以避免被试可能产生的霍桑效应。
如果主试和被试都不知道哪些人接受实验处理,哪些人没有接受实验处理,也不知道实验设计者真实意图,称之为“双盲”。例如,研究者将治多动症的药和安慰剂分别装进药袋,药袋上写上儿童姓名,要求老师分发,让儿童服用。主试(老师)和被试(儿童)都不知道药物处理的真相,教师自然也就无从产生任何期望效应,这样研究者可以准确地观察实验处理的真实效应。
在教育研究过程中,无关变量的控制还有很多方法。例如:采用不同的实验配组形式和不同的实验设计模式对无关变量进行控制;采用多主试或电脑主试对实验者效应进行控制;还可以采用统计手段对被试间的个体差异进行控制等。总之,从无关变量的来源上,控制可以从三个方面考虑:一是对研究的外部环境和条件进行控制;二是对被试的个体差异进行控制;三是对研究者或主试在实施研究中可能产生的实验者效应进行控制。
四、研究变量
(一)确定研究变量
在定义研究变量之前,先要确定研究变量的类型。
1.确定主要变量
所谓主要变量是指与研究目的直接有关联的变量。通常研究的主要变量大都在研究标题中有所显示。如:小学生一日学习时间的调查;家庭社会经济地位与学生学业成就的相关研究;小学语文创造性教学对学生写作能力的影响研究。(15)
如果是实验研究,那么研究的主要变量通常为实验处理(自变量)和实验结果(因变量)。
如果研究题目中没有显示主要变量,则可到关于研究目的、待答问题、或研究假设的叙述中去寻找主要变量。如:课程改革的整体实验研究;教学中应用“动手做(hands on)”的实验研究;主体性教学改革的实验研究。
在确定研究的主要变量后,还要进一步了解变量的性质。如果是描述性研究,其主要变量可以看作是独立的、不相关的个别变量。如:教师对新教材认同情况的调查研究;上海市小学五年级语文识字量调查。
如果是相关性研究或因果性研究,则要确定哪个变量是自变量,哪个变量是因变量。如:上海市小学生识字量与语文学业成绩的相关研究;学习时间与学习内容的关系研究;学生记忆力与学业成绩的关系研究。
2.确定相关变量
相关变量是指与研究目的无直接联系,但如果纳入研究中,会使研究结果更严密、更可靠的变量。通常有两种变量可以称为相关变量:一是背景变量;二是调节变量。
背景变量主要指被试的一些基本特征,这些特征又与研究的主要变量有关,如学生的性别、年级、年龄、家庭背景、居住地区等。如果是以机构或团体为研究对象,则其规模大小、所在地区、成员结构等可以作为背景变量。但并非所有背景变量都要探讨,要选择与研究目的联系密切的纳入研究框架。
至于调节变量本身就是一种自变量,能影响主要的自变量和因变量之间的关系,因此须纳入研究。
3.确定控制变量
控制变量指在研究过程中必须加以控制,才能提高研究结果可靠性的变量。通常在一项研究中可能干扰或混淆研究结果、需要加以控制的变量很多,研究者必须将那些重要的干扰变量和混淆变量表示出来,加以控制。即使这样,也肯定会有一些未能控制的变量——一方面,这是由于我们可能认识不到这些变量,另一方面可能是对这些变量无计可施。
(二)定义研究变量
在给变量下定义的实际过程中,抽象性定义可以涵盖研究变量所属的基本特征,解释范围较大,具有普遍性,但往往失之笼统,无法据此测量和操纵研究变量。操作性定义对变量的界定清楚明确,便于操纵和测量,但往往只能涉及变量的少数特征,具有明显的排他性,难以表达完整意义。给变量下定义比较理想的方式是,先用抽象性定义描述变量的基本特征,然后再用操作性定义规定操作程序和测量指标,这样便于把握操作性定义的方向和意义。(16)
1.抽象性定义
抽象性定义是根据概念或假设的特征来界定研究变量的内涵。它是用一个概念来界定另一个概念,这种定义的主要特点是在定义中凸显被界定变量的本质特征。
1)经典的定义方法
给一个研究变量下一个抽象性定义的经典方法主要有以下几种。①确定该研究变量的上位概念。如“教师”的上位概念选用“职业”。②归纳法,运用从个别到一般的分析过程,抽取同类事物的共同属性,从而确定本质特征。比如,专门从事教育教学工作就是“教师”这一研究变量的本质特征。③将变量的本质特征与上位概念整合成概念性定义。如“教师”是“专门从事教育教学工作的职业”。
2)从文献中寻找合适定义的方法
有些研究变量,已有研究者对其进行了深入研究,有关的理论和定义也都很成熟。这些定义都是已经经过实验验证后,被人们所接受的,具有一定的科学性和严谨性。研究者在进行相关的研究时,可以查阅相关的文献,了解各个理论家对某一研究变量的定义,然后根据自己研究设计的对象和特点,有针对性地选择适合自己研究的定义。
3)自行定义的方法
许多研究变量是由研究者创生的变量(如创造性综合学习教学法),这是研究者理论上的变量,这类变量的内涵,实际上是研究者的理论假设,因此这种方法定义的变量还具有或然性和多样性。
抽象性定义涵盖较多研究变量所属的特征,适用于思辨分析和质的研究。但是教育活动是复杂的,教育的对象是内心世界复杂的人,因此许多教育现象具有模糊性,研究者难以把握其本质的特征。此外,无法根据抽象性定义测量或操纵研究变量进行调查问卷设计和实验研究的设计,而且没有操作性,不利于开展实验活动,不便于量化研究。
2.操作性定义
操作性定义是指根据可观察、可测量或可操作的特征来界定研究变量的定义,即将研究变量的抽象化形式转变为可以观察、测量和操作性的具体形式。它详细说明研究者要观察、测量和操作研究变量的程序和活动,是研究者开展研究活动的一种指南。
1)操作性定义的基本特征
在教育研究中,好的操作性定义有以下几个特征:①操作性定义应该是可观测的、可重复的、可直接操作的;②操作性定义所提示的测量或操作必须可行;③操作性定义的指标成分应分解到能直接观测为止;④操作性定义最好能把变量转化成数据形式,凡是能计数或计量的内容都是可以直接观测的;⑤用多种方法形成操作性定义,既可以从操作入手,也可以从测量入手。
在对因变量进行操作性定义后,具有以下一些优势:①能客观准确地测量变量;②为他人重复验证实验结论提供了具体的做法;③便于别人和同行之间的学术交流。
2)操作性定义的方法
(1)条件描述法。条件描述法通常是通过陈述测量操作程序来界定一个概念,是对所解释对象的特征或可能产生的现象进行描述,对要达到某一结果的特定条件作出规定,指出用什么样的操作去引出什么样的状态,即规定某种条件,观察产生的结果。例如,要给“饥饿”下一个操作性定义,饥饿是一种自身感受,那么怎样才算饥饿了呢?心理学家用条件描述法给饥饿下了一个操作性定义:饥饿指连续24小时没进食物的状态。这样,每个人都能进行实际操作来感受饥饿了。
(2)指标描述法。指标描述法通常是通过陈述测量操作标准来界定一个概念,是对所解释对象的测量手段、测量指标、判断标准作出规定。例如,“青少年”可以界定为“年龄在7岁以上,18岁以下的人”。
(3)行为描述法。行为描述法通常是通过陈述测量结果来界定一个概念,是对所解释对象的动作特征进行描述,对可观测的行为结果进行描述。例如,心理学家为了用饥饿的小白鼠做实验,给“饥饿”下了一个行为描述的操作性定义:饥饿指一分钟内压低杠杆10次以上而获取食物的小白鼠。只有达到这样行为频率的小白鼠才属于饥饿状态。
3)给变量下操作性定义应注意的问题
首先,对研究课题中重要的变量要下操作性定义,如研究假设中涉及的变量、在整个研究中起关键作用的新概念、新名词等。
其次,应根据研究目的、内容及变量的性质来下操作性定义。操作性定义要与变量的原意相符,要与抽象性定义的内涵和外延相符。
再次,操作性定义的设计要具体、明确。所提示的测量或操作必须具有可行性,要使别人能理解操作内容和过程并能重复验证。操作性定义的指标成分应分解到能直接观测为止。
最后,操作性定义在使用过程中应该是独特的,它是研究者为了研究需要而规定的特殊解释,并非是对变量的全面的、唯一的解释。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。