3.2.3 实验材料处理
本小节主要描述实验材料的筛选、实验工具与程序及数据收集与分析部分。
3.2.3.1 实验材料的筛选
第一次先导实验的材料包括48个惯用短语,研究者将这48个短语编成微型词典(mini-dictionary),并配有三种不同的练习册(practice booklets),但实验结果表明,目标短语数量太多,因此,第二次先导实验只保留了24个短语,以下描述的是材料选取的具体过程。
最初选取目标短语主要基于四个标准:(1)学习者没有学过的短语,即学习者不知道短语的整体意义;(2)组成惯用短语的单词都是学习者学过且词频高的,均属英语专业四级词汇以内,以保证学习的焦点是整个词组的形式和意义,而不是单个词汇;(3)尽量避免英汉语言形式和概念基础均相同的短语;(4)将短语分成透明度很高、透明度高、透明度中及透明度低四类,每类包括12个短语。
根据两组中国高级水平英语学习者对140个习语的判断,筛选出48个目标短语。为了保证短语有一定的区分度,140个短语主要选自几种分类:Gibbs和Nayak(1989)从句法固定性和语义分解性等方面对习语进行了几种分类(正常可分解的、非正常可分解的、不可分解的;透明的、不透明的;句法固定的、句法生成的;字面意义形式恰当的及字面意义形式不恰当的;Titone 和 Connine(1994)从熟悉度、组构性、预测性和字面意义四个方面描述的171个习语表达;Steinel等(2007)从学习者视角分出的透明度与意象性高、中、低的各三类习语。
选取了具有一定区分度的140个短语后,采用七级量表透明度判断问卷调查方式,由两组人群评定等级,一组是北京某外语类高校英语专业博士生49人(实收49份),为高水平1组;另一组是2009年教育部外国语言学及应用语言学研究生暑期学校高校教师67人(实收67份,但实际采用57份),为高水平2组。通过描述统计,选出两组平均值在范围上接近的四类(共48个短语,每类12个):透明度很高(如,burn one‟s bridges)、透明度高(如,swallow one‟s pride)、透明度中(如,be down in the dumps)和透明度低(如,steal one‟s thunder)。同时,尽量达到DMDX测试对平均词长的要求,保证四组短语的平均词长基本一致。在此基础上,将这些短语编成一个微型词典和三种不同的练习册。
第一次先导实验选取短语的数量太多,时间难以控制。其中第一频次最长时间用去107分钟,第二频次最长时间花费82分钟,连续进行了三个多小时。在访谈中,受试者提出内容太多、时间太长,两频次后已经十分疲惫。因此,第二次先导实验将目标词从48个减至24个,比第一次先导实验减少了一半,每类6个。同时,根据两组高级英语水平学习者对七级量表判断的平均值(分别为6.5-5.5,5.5-4.5,4.5-3.5,3.5以下),分出四类透明度不同的短语,再通过配对样本t检验证明每两类短语之间均具有显著性差异(见表3-2),最后,同样编成一个微型词典和三种练习册。
表3-2 第二次先导实验两组受试者透明度配对样本t检验
3.2.3.2 研究工具与程序
为了调查任务类型、任务频次以及透明度对短语学习的影响,在第一次先导实验中采用了不同的研究工具。
如表3-1所示,第一次先导实验包括三个阶段:前测、实验和即时后测。前测在实验一周前进行,实验加后测连续进行了两频次,近三个小时,实验包括阅读加填空、阅读加造句和阅读加选择三项任务,每次实验后,紧接着是惯用短语知识后测,第二频次结束后,还包括DMDX心理反应时测试及访谈。
(1)实验材料
第一次先导实验的48个短语在微型词典中被分成三部分,每部分包括16个,透明度很高、高、中和低的短语均匀分布在各部分,其中对每个短语都附有中英文注释和两个例句,短语是按照第一个单词的首字母排序的;三项任务的练习册根据微型词典的三部分编写而成,但短语的顺序是任意的,这与词典中不同。任务1的练习册要求受试者填写目标短语,每个目标短语有两道练习,在每部分方框内包括4个干扰短语,该练习的指示语是“Fill in the blanks with one of these phrases in the box.One phrase can be used at most twice.”;任务2的练习册要求受试者用目标短语造一个句子,在指示语后是正确句子和错误句子的示例,强调新句不能过于简单,须有一定语境,体现出恰当的短语意思;任务3的练习册要求受试者根据句子意思从A、B、C、D中选择正确的选项,每个短语只有一道练习。第二次先导实验仍然将微型词典和三项任务的练习册都分成相应的三部分,但每部分只包括8个目标短语。
(2)心理反应时测试与访谈
由于第一次先导实验没有严格控制每类短语的总词长,在某种程度上影响了受试者对短语的反应时间。此外,三小组受试者在三台电脑上同时操作,其中包括手提式和台式电脑,电脑配置不同也可能对实验结果产生影响。最后结果显示,数据中的错误率较多,且缺失部分短语的反应数据,说明受试者没有作出反应。
访谈为半结构式,主要围绕研究问题,内容还包括受试者估计掌握了多少目标短语,她们是如何努力记忆的及在平时学习中的词汇和短语的学习情况等。
第二次先导实验程序与第一次先导实验基本相同,但在两方面有所调整:第一,由于在第一次先导实验中,完成阅读加选择任务的时间与其他两项任务的时间相差太多,因此,在第二次先导实验中,尝试增加了选择题的难度和选项,即从选择短语改为选择短语释义,并将A、B、C、D四个选项增加至A、B、C、D、E五个选项;第二,又增加了另外一项阅读加写作任务——改述句子。
3.2.3.3 数据收集与分析
第一次先导实验的数据收集经过三个步骤。首先,一周前进行词汇水平测试和惯用短语知识测试,时间分别为55分钟和35分钟。
实验集中在一个晚上,进行了约三个半小时(7:25―10:50)。9名受试者按照班级分为三个小组,并随机分配了三项任务,组2完成任务1,阅读加填空;组3完成任务2,阅读加造句;组1完成任务3,阅读加选择。先发给受试者微型词典,只能看一遍,要求不能反复看。收回后再发练习册完成任务,没有规定完成任务的时间,分别按照自然速度进行,具体安排见表3-3:
表3-3 两次先导实验数据收集程序
注:m表示分钟。
我们可以看出,第一次先导实验整个过程进行了两频次,最后一次还包括采用DMDX心理反应时短语判断任务,主要是为了调查学习者对短语反应的熟练程度。实验结束后,又对其中的三名受试者进行了访谈。
第二次先导实验与第一次先导实验的不同之处主要体现在三个方面:第一,任务和后测进行了三频次;其次,鉴于第一次先导实验中受试者反应的错误率过高,在第二次先导实验中将DMDX练习项增加至15个,且为避免电脑配置的影响,四名受试者在同一台电脑上完成上机操作任务;最后,第一次先导实验是先让受试者阅读词典,收回词典后,再做练习。而在第二次先导实验中,受试者在规定时间内词典阅读和练习任务同时进行,完成练习任务后,最后进行后测。从表3-3中可以看出,任务1、任务2和任务4在每频次所花费的时间相差不大,但任务3仍少用了近三分之一的时间。
对短语知识的数据分析采用的是词汇知识等级评分量表(2),但该量表没有提供一种精确描述词汇习得过程的方法(Schmitt,1998;Read,2000)。有些研究者试图进行修订(严辰松、段士平,2004;周卫京,2007),周卫京(2007:147)修改的新等级评分量表(见表3-4)更具区分度,表达的意义更全面,所以本研究的两次先导实验均采用该量表进行评分,分数依次从0到5,包括9个等级。
表3-4 词汇知识等级评分量表
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。