8.4 实验正确性的诸影响因素
与其他几种研究方式相比,实验研究在确证自变量和因变量之间的因果关系方面具有相对优势。但这也同时意味着实验研究在各种必备条件、操作程序、环境控制等方面比其他研究方式要严格得多。在实际的实验中,实验的正确性归结起来主要受来自以下几个方面的影响。
8.4.1 实验环境、手段等前后不一致的影响
与自然科学的研究对象不同,社会科学的研究对象常随时间而变化,上面我们提到的研究对象的成熟等因素就是自然科学中所没有而社会科学中又司空见惯的现象。具体来说,即研究的环境、手段等在前测和后测时的不同对实验正确性的影响。
在影响实验正确性的诸多因素中,实验环境、实验手段由于其易变性应引起我们的特别关注。由于时间的差别,进行前测和后测时所具有的环境也常常是不同的。即使用的是一份同样的问卷,在同样的地点,由同样的研究人员参与,有时也会造成前、后两次测量在某些方面、某些细节、某些条件上出现差别,从而给实验对象带来不同的影响。比如说,研究者和实验对象在前、后两次测量时的心理状态不同,对实验人员和实验对象的指示不同,对实验说明的方式不同,实验的物资设备、工具不同,或者实验时间的控制、要求的掌握不同等,都是形成实验环境不一致的原因,它们都会使前、后两次测量的结果中,掺杂进一些不属于实验刺激影响的效果。因此,意识到这种不一致的方面及其影响,并努力通过控制使它们尽可能地一致起来,就成为研究者从实验设计到实验的最终完成都必须努力做到的。
我们现在就实验环境和实验手段的变化分别进行讨论。
首先我们来看重大历史事件的影响。重大历史事件的影响是和实验的历时性相关的一个对实验正确性的影响因素。由于大多数实验设计都需要进行前测和后测,并且常常是对实验对象在实验刺激前后的态度、观念、价值和行为进行测量,而前测和后测之间又往往会相隔相当长一段时间,短则一周、半月,长则半年、一年,因此,出现在前、后测结果上的差异除了实验刺激所造成的影响外,还有可能是发生在这一段时间中的某些重大事件所造成的影响。比如,在我们进行一项涉及大学生对人工智能现状发展潜力的态度实验过程中,发生了“深蓝”在象棋对局中赢了世界象棋冠军这样的历史性重大事件。那么,在实验后测中实验对象对人工智能的看法上的得分显然会受到这一重大事件的影响。用实验的语言来说,就是除了原来实施的实验刺激以外,研究者所无法控制的政治的、社会的、经济的、文化的重大事件也成了另一个新的“实验刺激”,而当这个新的意外刺激能够称得上是“历史性的”时,其影响肯定可想而知。所以在这种出现某些与实验内容关系密切的重大事件的情况下,实验对象在态度、观念、价值及行为上所发生的变化,不一定全部是由于实验刺激的作用所致,很可能是由实验刺激与其他因素共同作用的结果。虽然彻底分清楚实验刺激的结果和其他事件的结果颇为困难,但清楚地认识到这些局限之处却是研究者完全可以做到的。
其次是一个关于实验环境的变化和测量工具的影响的例子。研究者希望通过研究检验某项工作丰富化方案对提高公共部门行政效率的作用。但是,在此方案实施期间,该公共部门引进了一套新的办公设备,因此混淆了工作丰富化方案对行政效率的影响,使得因变量行政效率变化的原因复杂化了。此处,新的办公设备的引进就可看成是一种实验环境的变化或复杂化对实验正确性的影响。另外一个例子,在公共管理实验中,研究者希望考察公共管理培训对行政管理人员行政效率提高的影响,如果前测所使用的公共管理能力试题比后测所使用的简单,则被试公共管理能力(因变量)的变化有可能是测量工具的不同引起的结果,而非公共管理培训(实验刺激)的效果。
8.4.2 来自于实验对象的影响
来自于实验对象的影响有很多种,比如实验对象的各种异常反应和行为、实验对象选择的影响、实验对象的成长与成熟、实验对象中的传播和模仿、补偿性竞争以及控制组被试的自暴自弃等。
实验对象的各种异常反应和行为无疑会较大地影响实验的正确性。最常见的来自于实验对象的异常反应就是实验对象在实验过程中中途退出实验。我们以经典实验为例,在实验组与控制组分别接受前测之后,假如实验组内的某些可能比较固执或可能比较敏感的实验对象,觉得实验刺激本身即是对自己或者对某些群体的一种冒犯,因而拂袖而去,便会对实验结果的正确性产生很大影响,使得资料的统计分析的科学性大打折扣。
实验对象选择的影响也比较普遍。由实验的特定目标、特定逻辑、特定方式所决定,实验对象的选择通常不是像调查研究那样从某一总体中随机抽取,而大多是采取下列三种方式之一:自愿参加、征募参加、强制参加(征募参加指的是用类似于招工的方式以一定的报酬来招聘实验对象;强制参加指的是使用学生、犯人等“被控制的群体”作为实验对象)。问题在于,这三种方式所得到的实验对象都不能很好地代表一般公众。这是因为,自愿者往往比一般人更热衷于科学研究,具有比一般人高得多的社会参与意识和较强的冒险精神;被招聘者则往往具有在经济上比较紧张的特点;至于研究人员所容易控制的学生或犯人,他们与一般人之间的差别和不同就更是显而易见。由此,实验对象的代表性、实验结果的推广就都有了限制。
实验对象的成长、成熟指的是在实验的前测和后测之间,实验对象在生理上、心理上的成长、成熟及其对实验对象所带来的变化。无论参与实验与否,人们总是在不断地成长,至少我们可以说人经常是在变化的。这种变化对实验结果也会造成一定的影响,在与某些主题相关的实验中,这种影响还会相当大。尤其当实验进行的时间较长时。
实验对象中的传播和模仿(Diffusion or Imitation of Treatments)指的是在实验过程中,假如实验控制组可以相互沟通,实验组的被试就有可能把一些实验刺激传递给控制组的被试,这样,控制组也受到了实验刺激的影响从而不再是真正的控制组了。受了“污染”的控制组便失去了控制组设立的本来意义。这种现象在实验组和控制组的被试为同一个班级的同学时经常容易发生。
补偿性竞争(Compensatory Rivalry)。在现实生活里参与实验时,被剥夺了实验刺激的控制组成员可能通过更加努力地工作进行补偿。假设数学教学计划是实验刺激,控制组被试可能比从前更用功地学习数学,企图打败那些接受“特殊”实验刺激的同学。同样,这也是一种常见于学校实验环境中的一种现象。
控制组被试的自暴自弃(Demoralization)。与上面提到的补偿性竞争相反,当控制组被试觉得受到差别待遇时,也可能因此自暴自弃。这不但会对控制组后测的得分有影响从而损害整个实验的正确性,而且这种对控制组被试个人本身的不良影响也是一个不容忽视的伦理道德问题。
8.4.3 来自于实验实际实施者的影响
实验实际实施者也可能对实验的正确性造成影响,比如常见的补偿(Compensation)现象。在现实生活里做实验,例如一项关于新的具体教育方法的实验,在实验的实际实施者(此处可能就是学校里的老师)看来,控制组的被试相比实验组的被试好像是被剥夺了有价值的东西。在这种情况下,实验的实际实施者就有可能有意或无意地为控制组的被试提供某种“力所能及的补偿”。而在很多试验中,实验的具体的实际的实施者都不是实验的设计者和研究者,这种现象就很好理解了。我们举一个例子。在检验新药效果的实验中,医院里的医护人员可能感觉到对不起那些没有接受新药治疗的控制组被试,而对他们在护理上格外“和蔼关爱”。如此一来,控制组就不再是严格意义上的控制组了。
8.4.4 初试—复试效应的影响
初试—复试效应的影响是和实验本身的如下特点密切相关的:实验方法的基本逻辑要求实验中的前测和后测的形式、内容应该是完全一样的。这样才能保证前测和后测测量工具的一致性和测量结果的可比性。然而,初试—复试效应的影响也正是滋生于实验方法的这一特点之上。也就是说,如果实验中一测再测,肯定会影响人的行为,进而混淆实验的结果。假如我们把问卷发给一组人来测量其偏见,在做后测时,被试可能已经对偏见问题变得很敏感,在回答问题时会变得更加深思熟虑。事实上,他们可能已经猜出我们正设法测量他们的偏见,而且由于很少有人喜欢袒露偏见,因而会竭力表现出他们自己认为比较为社会主流价值观所赞同的态度,从而影响后测的正确性,模糊了实验刺激的效果。研究对象的这些猜想、揣摩、反应可是自然科学的研究对象所不具备的,这也是为什么社会科学虽然采用了自然科学的研究方法,却难以在各自的学科内部取得自然科学所取得的那种重大进步的原因之一。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。