第七节 教学测试——英语教师的必修课
教学测试是教学过程的有机组成部分。作为外语教师,除了完成日常教学工作以外,进行经常性的语言测试也是一项非常重要的工作。测试是对教学的检验,是教学的一面镜子,能让我们及时地发现教学中存在的问题和不足,从而改进教学。对于学生而言,科学的测试更是一种促进学习的动力。通过测试,学生可以从中获得成功感,增强学习的信心,或者发现自己的不足,奋起直追。测试对教学的反拨作用客观存在,但有积极与消极之分。前者有利于教学,而后者则会给教学带来负面影响。测试的种类很多,平时的教学测试属于哪一类?如何命题才能做到科学、规范?试卷如何分析、如何讲评?这些问题实实在在地摆在每一位英语教师的面前。本节就这三个问题展开讨论,提高认识,以期把教学测试工作做得更好。
一、教学测试的归属
要回答“教学测试属于哪一类”这个问题,首先必须对教学测试的目的和种类有所了解。
1.测试的目的
《普通高中英语课程标准(实验)》(教育部,2003)对教学评价的目的是这样描述的:“1)通过评价使学生在英语课程的学习过程中不断体验进步与成功,认识自我,建立自信,调整学习策略,促进学生综合语言运用能力的全面发展;2)使教师获取英语教学的反馈信息,对自己的教学行为进行反思和适当的调整,促进教师不断提高教育教学水平;3)使学校及时了解课程标准的执行情况,改进教学管理,促进英语课程的不断发展和完善。”
测试是评价的一种方式。由此可见,测试的目的主要是让学生体验进步与成功,同时让教师获得反馈,了解学情,进行反思,从而有针对性地调整教学行为,对后续教学作出改进。
2.测试的分类
高兰生(2002)根据不同用途将英语测试分为以下七种。
(1)进步测试(progress tests)。主要用于检查学习的进展,了解学生是否掌握了所学内容,如小测验、记成绩的提问等。其主要特点是测试内容范围窄,形式灵活、多样,通常题量不大。
(2)学业成就测试(achievement tests)。主要用于考查学生在相对较长阶段内或最终阶段的学习成效,如单元测试、期中考试、期末考试等。其特点是要参考某种教学大纲命题,测试内容较多,题量较大,覆盖面广,但不宜超纲。
(3)水平测试(proficiency tests)。水平测试是一种不以某一课程或教学大纲为依据的一般语言能力测试(陈军洲,2005),常被用来进行各种选拔,美国的TOEFL,英国的IELTS,我国的高考、PETS等均属于此类测试。其特点是包括语言共核(common core)、文化(culture)和满足特定选拔需要的语言内容,并要求有较好的区分能力。
(4)能力倾向测试(aptitude tests)。也叫潜能测试,用来预测学生学习某种外语的潜力和天赋。其理论基础是:学习语言的能力取决于语言能力、语法能力和推理能力(陈军洲,2005)。此类测试主要是用来判断考生未来学习的专业方向。
(5)诊断性测试(diagnostic tests)。以确定学生实际应用能力与课程目标之间的差距为目的,以便使教学能够针对学生需求的测试,如小测验或单元测验。其特点是测试的结果不影响学生的成绩,不事先透露测试的真实意图。题项应有利于暴露问题,有利于找出问题的原因。
(6)分级测试(placement tests)。其目的是为了按测试的成绩分班、分级,使下一阶段的教学能顺利进行。区分能力是它的重要指标,因此,试卷总体难度要适宜。试题太容易或太难都会给分级带来困难。
(7)评价测试(assessment)。为实现形成性评价的目标而进行的测试,形式多样。其主要任务是帮助学生肯定自己已经取得的成绩,发现问题,树立信心,为取得新的进步而努力。主要特点是学生参与评价活动,强调学生自我评价。
3.教学测试的归属
从上面两节的叙述可见,高中英语教学测试——包括单元测试、期中、期末测试等——的主要目的是让学生体验成功与进步,让教师获得教学效果的反馈信息,从而对自己的教学进行反思并作出调整,更好地进行后续教学。要想真实地了解学习的效果如何,就应该让学生考出真实的水平,而不是把学生考倒。因此,教学测试的内容应该与教学的内容密切相关,即教什么就考什么!而不应该考、教分离,相去甚远。高中英语教学测试主要属于成绩测试和诊断性测试,或“形成性评价”,是在一个单元、阶段的初步教学完成后进行的评价;主要测试单元内容的掌握程度,以利于教学的改进和完善;试题内容范围小,知识点相对集中,以单元知识点为主,试题密集,以便学生巩固所学知识,加深对所学知识的掌握和理解(赵宁燕,2004)。
二、试题的命制
1.命题的科学性与规范性
科学、规范地命题是试题质量的保证,其中内容效度是最重要指标。如果试卷缺乏内容效度,那么测试就失去了意义,必然给教学带来负面影响。因此,试题测试内容切合教学实际是保证试卷科学性的前提。另一个影响试题质量的因素是试题本身的正确性和难易度。没有正确性就没有科学性可言,命题者必须慎之又慎,杜绝试题本身出现差错。
命题的规范性主要体现在命题的计划性,杜绝随意性。命题的规划根据教学内容、学生认知水平、测试形式和题量等要素制订。规范的命题可防止命题的随意性和盲目性,保证测试的效度、难度和区分度等测量指标,是科学性的具体体现。没有规范性就很难保证科学性。
试题的科学性和规范性具体体现在以下几个方面:1)测试内容切合教学实际,与所教学内容密切相关,教什么就考什么;2)试题本身正确无误,难易适中,能让学生考出真实水平,体验成功;3)主观题、客观题比例恰当,体现语言应用的真实性。题量合理,能让大多数学生有足够的时间完成答题。不因时间不够而丢分。
2.双向细目表
双向细目表是保证命题过程科学性和规范性的重要工具。双向细目表是二维的,纵向列出考查内容,横向列出考查目标,表中分布详细的考量,所以叫作双向细目表。根据测试目的和测试内容编制的双向细目表是科学命题的依据,有助于克服主观随意性;是检验内容效度的依据,保证测试内容的效度;也是评价教学质量的依据,可用于评价教学质量(陈晓姿,2006)。
典型的双向细目表如表4-3(引自崔允漷,邵朝友,2007)。
表4-3 双向细目表
表中六个考查目标实际上就是布鲁姆的认知目标分类。其中记忆属于知识水平,其余目标属于能力水平。新修订的布鲁姆目标分类非常完整,被认为是认知目标分类的权威(崔允漷,邵朝友,2007)。
3.试卷编排的合理规范
“试卷各部分的编排顺序也影响着考生的测试行为。”(Bachman,1990)
1)试卷编排合理,便于答题,这是试卷表面效度的保证。如完形填空应尽量编排在试卷的同一面上,以便于答题。各大题的编排顺序不必刻意模仿高考试卷,应以方便学生答题为原则。
2)试卷符合英文排版规范,如A、B、C、D选项上下对齐(利用tab键可轻松地做到上下对齐,如用空格键则难以做到),选项长度不宜相差过大等。英文排版规范这一点尤其应引起命题者的注意,因为在实际操作中,排版欠规范的现象普遍存在,常常被忽视。
三、试题分析与讲评
从某种意义上说,没有试卷分析就没有完成测试(黄锐,2002)。试卷分析主要包括试题分析和试题讲评两个方面。
1.试题分析
试题质量的评价指标主要有效度、信度、难度和区分度等。就教学测试而言,重点应关注内容效度和难度这两项。
效度(validity)是衡量测试质量的重要标准,是指考试达到其预期测试意图的程度(黄锐,2002)。没有效度就无所谓信度,如果效度很低,那么信度再高也没有意义。例如,单项填空题答案唯一,信度很高,但用此来测试学生活用词汇的能力就缺乏效度。其中最重要的是内容效度(content validity),即测试内容是否包括了所要测的语言技能、语言结构等有代表性的要素。内容效度可利用命题双向细目表进行检验(李煜祥,1999)。
难度(difficulty)即试题的难易程度,也叫易度值(facility value),它的数值越大,说明试题的难度越低;数值越小,则难度越高。难度为1表示全都答对,难度为0表示全都答错,难度为0.5则表示一半答对,一半答错。平时的教学测试难度不应太大,应以大多数学生能答对为宜。
试题难度的计算方法比较简便,客观题、主观题难度值的计算公式分别为:
区分度(discrimination)指测试成绩能区分考生水平的程度。区分度好的试题能把不同水平的学生有效地区别开来,以便择优录取。鉴于平时的教学测试不是为了选拔,因此不必过分注重区分度。难度为0.5的试题区分度最佳,但平时的教学测试难度通常设定在0.7—0.8,区分度不可能达到最佳状态。
2.Excel在分析中的应用
除评估测试有效性和试题难度外,求平均分、标准差、排名次、分数分段统计等工作均可利用Excel软件轻松完成。下面介绍几种实用的工具。
(1)数据汇总统计。利用Excel“工具”菜单中的数据分析工具可轻松地计算出平均分、中位数、众数、标准差、方差、峰值、偏度、全距/区域、最大值、最小值等多种常用数据,非常便捷。操作步骤依次选择“工具”菜单→“数据分析”→“描述统计”,在对话框“输入区域”键入数据起讫单元格的位置,如:B1:B46。选择“标志位于第一行”。在“输出区域”键入统计表起始位置,如:B48。选择“汇总统计”,确定后即出现汇总统计表。
若首次使用该功能,则“工具”菜单下没有“数据分析”选项,可在“工具”菜单下点击“加载宏”选项,选择“分析工具库”,回车确定即自动安装。
(2)排名次(ranking)。选中要填写名次的单元格(通常选第一位学生),在英文状态输入公式,例如“=RANK(b2,b:b,0)”——其中“b2”表示分数在b列第2格,“b:b”表示对b列分数排序,“0”表示降序(即最高分为第1名)——然后回车确认,就会出现该分数在整列中的名次。将光标移到该单元格右下角直至出现黑十字“+”,按住鼠标左键往下拖动即可自动得出其他分数的名次。利用“表格”菜单下的“排序”选项也可排名次,但会出现同分数不同名次的现象,而用RANK函数则可避免这一现象。
(3)直方图(histogram)。直方图可直观地显示分数的分布情况。首先将数据分段,并确定各段上限,如59、69、79、89、100等,并按升序排列在同一栏中。然后依次选择“工具”菜单→“数据分析”→“直方图”,在对话框“输入区域”键入数据起讫单元格的位置,如:B2:B46。在“接收区域”键入分段上限起讫单元格的位置,如:E2:E7。在“输出区域”键入图表的起始单元格位置,如G2。其他内容可根据需要选择。若选择“累计百分率”,则会在直方图上叠加累计频率曲线;若选择“图表输出”,则会同时显示分数的分段统计表。确定后即生成相应的直方图表,图表可作调整和文字修饰。
3.试题讲评
科学的试题讲评是帮助学生查漏补缺、归纳复习、培养答题技巧和提高学生运用能力的重要环节(王丽娜,2008)。为使试卷讲评达到预期的目的,应遵循以下几条原则。
(1)及时性原则。在测试后的较短时间内,学生对自己的答题情况记忆相对比较清楚,时间一长,学生做题时所产生的思维火花消失殆尽,关注的热情就会明显降低。因此,试题讲评一定要做到趁热打铁,及时将结果和答案反馈给学生。这是取得良好讲评效果的一个重要因素。
(2)针对性原则。试题讲评不宜也不必面面俱到,而是通过统计分析,筛选出学生普遍出错的试题或重点试题进行讲评,从而保证试题讲评课的高效率和实用性。使试题讲评课起到巩固、复习和拓展知识的作用。必要时可补充一些与错题相关的同类练习,以进一步巩固所学知识,培养综合运用能力。
(3)互动性原则。让学生参与试题分析、发表见解,既是授生以“渔”,又可广开言路。事实上,学生的思路比教师广,有时见解有独到之处,教师和同学都能从中得到启示。有的学生还会提出质疑,提出反驳的理由等,这对于培养学生的思维能力有益无害。既能调动学生的积极性,又可使讲评更贴近学生的心理。同时,教师可从中发现学生出错的真实原因,从而将学生引导到正确的思路上来。只有充分发挥学生的主体作用,将讲评课由传统的“一言堂”变为师生交流、生生交流的“群言堂”,才能使讲评课取得最佳效果(王丽娜,2008)。
测试对教学的反拨作用(backwash effect)既可能是积极的(positive),会促进教学;也可能是消极的(negative),会不利于教学。要想测试发挥积极的反拨作用,首先应该树立正确的测试观念,即让学生考出水平,体验成功,而不是将学生考倒。其次应做到科学、规范地命题,使测试效度高,难度适中。同时体现教测相辅,教什么就考什么,而不是相反。试卷的讲评要及时,有针对性,强调互动,使讲评课成为复习、巩固、拓展知识、培养能力的良机。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。