首页 理论教育 非标准化成绩测量

非标准化成绩测量

时间:2023-03-06 理论教育 版权反馈
【摘要】:计算机软件使用形成性评价的结果去尝试预测学生在标准化成绩测试中离达到国家标准的距离,形成性评价也同样能够帮助学生们记录自己的学习进展情况。对于学校的领导者来说,在利用形成性评价时拥有清晰的、令人信服的愿景是非常有帮助的。

第五章 使用形成性评价提升教学

有很多种类的评价体系可协助教师测量学生一年以来的学习效果,而不再是等待每年进行一次的标准化成绩评价的结果。这些正在形成中的评价体系或者说所谓的形成性评价系统,其理念就是为教师持续提供与学生相关的信息,这样可以帮助教师们诊断出学生需要提高的特定领域,使教师得以改进教学。形成性评价也可以为强大的专业发展提供根据,这些专业发展与学生特定的学习目标相关。在这一章里,你将会学到形成性评价以及它们在学校改进过程中的作用。

情境再现

作为罗斯蒙特学校的新校长,你了解学生在标准化成绩测试中的表现有多重要。学校员工们已经具有一套固定的知识体系,并且他们知道学校如何为适当年度进展承担起责任,但是,员工和领导团队同样明白标准化成绩测验一年只有一次,并且它不能提供充足的关于诊断学生在学年进程中是否掌握了学习目标和对象的信息。此外,教师们也无法收到关于跨年级和跨学科的共同困境的反馈。教师们也渐渐注意到标准化测试的局限,并且对其他形式的评价方法产生了兴趣,这些评价方法能够测量出年终标准化测试无法顾及的地方。因此,我们开始探索将形成性评价和其他非标准化测量方法纳入到学校改进过程中来的途径。

非标准化成绩测量

我们在之前的讨论中提到,学校对学生的学习富有责任。尽管年末考试是测试成绩的一种方式,教师们经常开展的测验也被用来测量学生的学习。这些非标准化测量经常被用于终结性评价机制,对学生掌握课程目标和学习内容的情况进行最终评判,比如决定学生的最终成绩。这种测量方式通常称为掌握性测量。

然而,这些教师开展的非标准化评价也经常用于形成性的反馈。其他的形成性评价包括学区测验计划和档案袋评价。形成性的评估、评价以及测量方法可持续提供学习过程中的反馈。形成性评价既能为教师也能为学生提供有关学生学习进展和内容理解方面的反馈,它可以提供需要额外练习或者重教的内容信息。它是教和学过程的重要组成部分,为学习内容是什么以及什么内容没有被掌握提供详细的反馈。在这个意义上,形成性评价对于诊断学习差距、帮助教师关注和设计教学是非常有帮助的。

除了教师开展的评价,其他能够估计学生学习结果的形成性评价还包括学区和学校开发的测试。最近学区也开始接受商业化的形成性评价系统,并且这些评价系统也与国家标准相关。

即使标准化成绩测试在基于数据的决策中扮演着重要的角色,持续的课堂评价也必须用于不断监督和反馈以推动教学的改变。标准化成绩测试和形成性教学评价应携手推动教学,并且两类评价方式都是基于数据的决策过程不可或缺的一部分。两类评价方式的区别是:终结性评价如标准化测试,意味着对学习的评价;而形成性评价是为了学习而评价。

之前我们提供了关于标准化评价测试是如何用于发现学生还未掌握的知识领域和技能的例子,形成性评价同样能够用于诊断特定的课程目标和技能的掌握情况。形成性评价所收集的信息能帮助教师计划教学以及发现学生还未掌握、需要再教的地方,这样形成性测试能够重新评估特定的课程目标已经被掌握的程度。形成性评价应该是教和学过程中不可缺少的一部分,且能够提高学习效果。事实上,已经有研究表明,它是提高学生学业成绩的一种强有力的机制(Black&Wiliam, 1998a,1998b)。

形成性评价是由教师或者当地的教师群体来制订和编写的,它能够根据学区水平在校外供应商如教育商业公司的帮助下加以完善。如前所述,形成性评价用于评估学生在学年中的表现,以进行教学干预计划。因此,如果形成性评价没有在一个具体的课程单元中多次实施,那么必须在一学年中多次组织形成性评价。

形成性评价提供的信息也可以用来决定学校中的教师专业发展的领域和主题,因此,在学校中发展协作机制实施形成性评价的好处就是,利用这些信息去关注专业发展和提高教师队伍质量,以共同制订教学计划完成教学标准,应对在年级中或跨年级中出现的问题或造成的困难。

学区层面的形成性评价经常使用电脑报告机制来帮助教师们辨别哪些学生群体挣扎在某一测试标准上,哪些学生最急需补救性的帮助,同时促进协作。一些美国公司正将形成性评价的理念发展为预测性评价(predictive assessments)。计算机软件使用形成性评价的结果去尝试预测学生在标准化成绩测试中离达到国家标准的距离,形成性评价也同样能够帮助学生们记录自己的学习进展情况。

研究显示,那些使用学生评价结果去指导教学的学校在提高学生成绩方面取得了一定进展(Snips,Doolittle,&Herlihy,2002)。然而,仅仅实施形成性评价是不够的。对形成性评价最好的使用是在它们能促进教师间的对话并且关注专业发展的时候。“对学生评价结果进行辨别仅仅是第一步,第二步是对可能的解释开展头脑风暴,第三步是制订和实施有效策略以总结出最令人信服的解释。这常常需要对其他的数据进行收集和审查,比如学生写作样例和学生的考勤模式”(Sharkey&Murnane,2006,p.576)。换言之,形成性评价的使用,像其他数据一样,需要甄别问题的技术。

实际上,许多研究暗示着在利用数据和学校的学习文化之间有着强大的关联。数据的使用同时也是个授权过程(Chrispeels,Brown,&Castillo,2000),它开启了学校教育者之间的对话使其加强合作(Feldman&Tung,2001),并且增进各部门间的协作(Nichols&Singer,2000)。

总之,对持续的形成性评价的利用有助于记录进展以及持续诊断教和学的过程。形成性评价能够用于:

●监控和评价学生的进展。

●通过课程内容、年级水平、学生团体、教师团体来甄别特殊的学习需要。

●根据《一个都不掉队》法案要求分解数据、进行比较。

●筹划专业发展并且鉴别出那些能够支持和帮助其他同伴的教师。

●改进和监控教学实践。

●计划和实施差别化教学以满足个别学生的需求和学习目标。

●对学生的学习情况进行反馈并且使他们建立学习目标(Boston,2002;

Guskey,2003)。

对于学校的领导者来说,在利用形成性评价时拥有清晰的、令人信服的愿景是非常有帮助的。框5.1介绍了一个愿景的例子,这个非常清晰的愿景是关于为什么以及如何在学校中利用形成性评价。

框5.1 孟菲斯市公立学校的愿景表述

形成性评价体系的愿景

●验证及确保教学目标能够实现并且在必要的时候能够促进教学。

●监控学生的学习以及我们自己的教学实践。

●辨别学生的个性化成长、课程教学结果、学校协作计划的需要以及学区专业发展的焦点。

●促进学校的课程与学区课程以及国家框架的连贯和一致。

来源:孟菲斯市学区(Memphis City School District)http://www.mcsk12.net/admin/tlapages/literacy_sec/renlearning/index.asp

形成性测试

图5.1提供的是从商业公司开发的形成性测试中搜集的一组信息。图中提供的例子与田纳西州标准相关。

图5.1 一家商业公司提供的形成性数据的例子

来源:孟菲斯市学区(Memphis City School District)http://www.mcsk12.net/admin/tlapages/literacy_sec/renlearning/documents/assessmentMaster_Teacher_Manual.pdf

这些信息是基于被评估的特定标准而组织起来的,比如下文:“学生有能力去选择、限定并提炼主题”或者“学生有能力将段落进行重组以写成结构良好、前后一贯的文章”。从这份评价中我们了解到有6名学生没有达到第一个标准。其中两名学生丢掉了评价这一标准中的两项内容,其他四位丢掉了这两项内容中的一项。请注意评价第一条标准的内容仅仅有两项,因此,教师应该利用其他一些信息去判断这些学生在多大程度上对既定的标准存在困难。其他的信息应包括学生作品、写作的真实案例、教师开展的测试和评价等。

基于课程的测量(curriculum-based measurement)

基于课程的测量(以下简称CBM)是形成性评价的一种类型,它用于持续的进程监控并且已经成为广泛的科学研究的主题。CBM是一组标准化且验证时间较短的测试,它被教师用于鉴别学生是否需要额外的和不同形式的教学(Fuchs& Fuchs,n.d.)。CBM目前已被应用于阅读、拼写和数学教学上,最初它适用于有学习障碍的学生,但是现在已被越来越多地应用于一般受教育的学生。关于CBM的研究表明,当教师使用这种形成性评价时,学生们学得更多,教师们能更好地进行教学决策,并且学生们也更加注意自己的学业表现(Fuchs,Deno,&Mirkin,1984)。

就像研究者琳恩(Lynn)和道格•法克斯(Doug Fuchs)总结的那样,基于课程的测量是不同于被称为“掌握性评价”的常规课堂测量:

在掌握性评价的使用过程中,教师们检测的是单一技能的掌握情况,并且当这种技能被掌握以后,教师们按照顺序去评价下一项技能,在学年中的不同时段对不同技能进行评价。由于测试的本质和难度随着学生不断掌握的情况而发生变化,在学年中不同时段的测试分数就无法互相比较。这使得量化或者描述学生进步幅度无法实现。再者,掌握性评价的可靠性和合法性尚属未知,它无法提供关于学生是否能保持之前所掌握的技能方面的信息。(n.d., p.1)

与掌握性评价相比,基于课程的测量进行技能的评估,能够涵盖每学年中课程的不同知识点。这些形成性评价采用不同的项目内容,持续地评价那些需要在学年内掌握的技能,使得“学年中不同项目所获得的分数能够与判断学生能力是否增长进行对比”。“CBM是以动态形式存在的,因为这种评价方法对短期教学干预(即4—6周)的效果十分敏感,它们就是评价改变的”(Shinn,2002,p.675)。

就像图5.2中的例子表示的那样,CBM能用于监控整个班级的教学进程。它能够筛选并且辨别出哪些学生需要额外教学或者不同形式的教学。对于那些无法从常规教学项目中获得进步的学生来说,可以应用替代性的教法以及教学策略。图5.2中CBM评价的结果表明有些学生(一小部分)需要减法的额外教学。另外,班级中有很多同学将会从乘以两位数的额外教学中受益。

教师课堂评价

课堂评价像测验、考试、布置的任务以及学生完成的其他作品,都能够为改善教和学提供重要的信息(Guskey,2003a)。为了得到有用的数据来源,伽斯蒂提出了三个需要在课堂评价中解决的特殊问题:第一,评价的内容应该既与课堂的教学重点相一致,又与州和学区标准相配合。第二,这些评价应该为教师提供有帮助的信息,有助于他们辨别出哪些内容教得好,哪些内容需要重教。第三,这些评价“必须拥有高质量的矫正教学来弥补这些评价鉴别出的任何学习错误”(Guskey,p.7)。因此,像所有的形成性评价案例那样,简单地将学生作品分等级并不能改善教学,教师们必须依照数据采取行动。

图5.2 基于课程的测量在数学课应用的总结

来源:Fuchs,L.S.,Fuchs,D.,&Courey,S.J.(2005).Curriculum-based measurement of mathematics competence:From computation to concepts and applications to real-life problem solving.Assessment for Effective Instruction,30(2),33-46.

档案袋评价

档案袋评价是利用学生作品对学习情况进行评价的另一种方法。档案袋收集学生的作品,证明学生的掌握情况和成绩,它通常包含了学生的自我反思以及教师对他们的评价。档案袋评价经常被称为真实性或者基于表现的评价,因为这些评价是基于学生作品所展示出的真实内容,而不是基于一次测验。真实性评价是“根据学生完成类似于现实生活中的任务的表现所展开的学业成就评价”(Popham,2006,p.233)。档案袋评价法不像测验那样,仅仅局限于一段时间内所学到的知识,它反映了随着时间的推移学生作品和项目的累积情况。根据西北评估协会(Northwest Evaluation Association)所述,档案袋是“有针对性地收集那些能展示学生的付出、进步与成绩的作品。这些收集到的作品必须包括学生在学习内容上的参与、选择的标准、质量的标准以及学生进行自我反思的证明”(Paulson,Paulson,&Meyer,1991)。档案袋和其他学生作品也为教师和学生围绕教育结果建立一种共识提供了机制。在此需要注意的是:档案袋中应该包含哪些内容?哪些算是学生学习和取得成绩的证明?用于档案袋评价计分和评估的指标有哪些?

档案袋评价并不是随意地收集作品,它由不同学科中与特定的学习目标相关的作品组成。档案袋中的内容记录了学生的学习和成长,它所涵盖的内容超过了书面作业比如项目、视频、录音带等。建立档案袋评价方法是学习和评价过程中不可或缺的一部分,因为它意味着教师与学生间的合作。

有效地实施档案袋评价的关键是建立档案袋的评估和反馈机制。档案袋以及档案袋中特定的学生作品,都是由学业成绩的评价指标来评估。评价指标是“用于评价学生习得的知识和技能质量的评分指南,它有三个基本组成部分:评估的标准、质量的定义以及评分的策略”(Popham,2006,p.238)。学业成绩的评价指标通常以矩阵方式列出评价标准:从杰出的到不被接受的不同水平的学业成绩都在矩阵之中。关于哪一水平、哪一类型的作品满足学业成绩评价指标的具体细节,也是每一项评价指标的组成部分。这个指标体系也充当了学生的指路牌,这样他们能够完善学习任务并自行评价他们的作品。框5.2提供了一个关于数学成绩的评价指标的例子。

积极共享的反馈是档案袋评价方法的重要方面。学生们可以进行个人和小组的反馈会议,会上可以讨论学习进展并且设定接下来的学习目标。如此看来,档案袋评价方法扮演着形成性反馈的角色。在学期末或者学年末,档案袋还可以作为学生作品的最终积累成果用于终结性评价。因此,档案袋为学校提供了另一个佐证:是否所有的学生都达到了学习和成绩的高标准。

框5.2 数学成绩评价的评分指标

4 数学知识:表明对问题的数学概念的完全理解,能够运用恰当的术语和符号正确运算。无差错地解决问题。策略知识:辨别和指明重要因素之间的关系,使用支持性的证据按照先后顺序呈现解决问题的步骤。沟通交流:清晰、完整地解释问题解决的过程,并且呈现较强的问题解决的支持性证据。可以使用图表来支持解释。

3 数学知识:表明对问题的数学概念能大部分理解,能对大多数术语和符号正确地运算。整个问题解决中存在小错误。策略知识:辨别和指明大多数重要因素之间的关系,大部分的解决问题的步骤都伴随着较多的问题解决的证据支持而有序地进行。沟通交流:对问题解决过程进行合理的完整解释,在解决问题的支持上有一些缺陷。使用图表来支持解释。

2 数学知识:表明对问题的数学概念能部分地理解,存在运算错误,术语和符号残缺不全。问题中可能存在大量的计算错误。策略知识:辨别和指明部分重要因素之间的关系,解决问题的步骤不够完整,缺少先后顺序或者支持的证据。沟通交流:合理地尝试着去解决问题。对问题解决过程的解释存在支持材料的欠缺和模糊。使用的图表也缺乏支持或者表意不明。

1 数学知识:表明对问题的数学概念能理解一小部分,存在运算错误,术语和符号都不正确,存在大量的计算错误。策略知识:无法辨别出重要的因素,问题解决的步骤欠缺、不够恰当、并且/或者没有顺序性。沟通交流:对于问题解决有一定尝试。对问题解决过程的解释模糊不清或者不够恰当。使用的图表表意不明并且有可能曲解问题。0 数学知识:表明无法理解问题的数学概念。策略知识:问题解决策略是欠缺的或是无关紧要的。很少或是没有证据表明其尝试了解决问题。沟通交流:解释与问题无关。

来源:Sandra Burvikovs,苏黎世湖公立学校,伊利诺伊州

提高教师使用形成性评价的能力

作为学校的领导者,你应该尽力改善条件,使促进教学改进的形成性数据得到有效利用。在教师群体中提高数据使用的三个必要方面是:专业发展、支持数据的氛围以及相互合作(Wyman,2005)。

专业发展。领导者不能臆断教师们都是知道如何使用形成性数据的,而且领导者也不能臆断教师们了解如何将终结性和形成性数据与教学决策相关联。通常教师们对于“从信息的棱镜中查看自己的教学技能和学生的学习情况”毫无准备(Wyman,2005,p.301),将有关数据使用的专业发展内容根植于当地学校持续、常规性的教师工作中是异常重要的。尽管地区性或者大规模的专业发展机会能有所助益,但用于教学改进的数据的成功应用,仍然需要教师之间的互动以及对以下这些内容的探讨:数据、数据的应用及具体的关于如何选择教学以适应不同学生个体需要的建议。那些能对其他教师提供即时支持的教师对于提高教师领导者使用数据的能力来说是重要的一环。怀曼(Wyman,2005)提出课堂指导者、数据帮助者和数据导师的重要性。当然,在帮助教师接触形成性评价和其他数据报告时会存在技术上的需求,但是这些帮助的大部分重点是为了教学决策的制定去解析和使用数据。实际上,最新的研究表明,教师们并不是“数据恐惧者而是他们在与数据为伍改善具体的课堂实践方面没有先进的经验”(Ingram,Louis,&Schroeder,2004,p.1280),显然这方面专业发展的需求需要认真考虑。

支持数据的氛围。领导者既需要了解数据的使用,也需要鼓励和支持教师为了教学改进而使用数据。出于这种考虑,建立信任的氛围是至关重要的。正如英格玛和他的同事注意到的那样(Ingram et al.,2004),如果“存在审判性的结果和惩罚性的报复”,教师将不愿意使用数据(p.1276)。很多学校由于其文化所限,不愿意成为问题发现模式的学校,但这正是支持教师利用数据的关键。与通过强有力的支持数据文化的领导来克服障碍相比,英格玛和他的同事区分了四种对于教师利用数据的文化阻碍。第一种阻碍是很多教师对他们教学的效果有自己的主张,并且这些主张与来自外界的信息和数据并不一致。第二种阻碍是教师根据自己的直觉随心所欲地做决定。第三种阻碍或许是学校对于这一问题还存在分歧:哪些数据在改进教学和学生学习上是有意义且重要的。第四种障碍是有些教师将自己的教和学生的学割裂开来,这样就忽视了有用且重要的数据。

学校领导者对这些潜在阻碍的关注能够改善领导与教师、教师领导者之间的关系,从而帮助克服这些阻碍。例如,当讨论一位特定的学生时,要求教师展示数据将会提升使用数据的文化,而不是倡导逸闻趣事和直觉。学校领导者应该为教师创造机会和时间,去分享他们是如何使用数据的、数据使用是如何改变教学实践的以及学生们收获了哪些内容。这些机会将通过协调年级和学科组、纵向配合的综合组、关注特殊问题或方法的小组(如家庭参与和安全)得到发展。需要重视的问题是在数据使用上,要为教师提供时间和空间以支持彼此。

相互合作。支持数据与一所学校文化的理念密切相关,它是一种主张:共同合作对于教师接受使用教学改进的数据是非常重要的。教育改革的相关研究已经注意到,合作是实施和支持教师实践改变的关键因素,使用数据也是如此。那些能够转变观念和实践方式并且分享挫折和困难的教师更有可能既接受实践又坚持使用它。合作有许多形式,最显著的形式是召开会议和进行讨论,探讨关于具体数据的含义以及如何使它们用于改进教学。其他形式的合作包括亲临教师的课堂,去看看教师如何依据形成性评价的结果开展差异化教学。教师们也可以在发展形成性评价测量中建立合作,比如通过设计学生的作业来澄清那些影响学生学习并掌握具体知识领域的不正确的信息、或者完善评价学生写作的指标。

数据合作是在教师和管理者中分配权力的一项有效策略(Copeland,2003)。寇普兰将那些在问题发现和数据使用策略中的先进学校形容为团队合作的典范。

(这些学校)可以成熟地接纳数据收集、分析、反思和改变的往返过程……目前,对基于标准的学生成绩的期待是普遍的而非例外。变革领导力来自于学校内部生发的探究过程。教师们关于学生如何跨越不同群体、不同年级行事的新知识能够使他们看到其需要改进的教学方式以及他们需要的资源。(p.387)

结 论

只要使用形成性评价来反映教师的教学实践和学生的学习经历,它便是一款强大的基于数据的决策工具。这一章为我们提供了一些关于学校和课堂数据,如学生学习的形成性评价的使用建议,强调了在形成性评价中建立整个学校系统的愿景的重要性以及对不同目标的清晰的理解,形成性数据的使用可以为这些目标效力。此外,这一章描述了特殊类型的形成性评价的益处,比如基于课程的测量。学校领导者应该帮助教师掌握形成性评价的意图和使用方法,然而,对领导者来说同样重要的是为了达到形成性评价的目的,为教师创造和支持使用课堂评价的条件。专业发展、支持数据的氛围以及合作的机会都是支持形成性评价使用的重要因素。

讨论问题

1.请评论你或者你学校中的教师目前使用形成性学生评价结果来指导教学的程度。

2.本章列出了七条形成性评价用法的总结。请沿着规模从小到大的顺序,评估一下在你的学校中这七个维度的实现情况。

3.请精心创建一个类似于框5.1中那样的形成性评价系统的愿景,该愿景要适合你的学校或者学区。

4.当描述教师课堂评价时,我们探讨了对课堂评价的开展有帮助的三个特殊问题。请评估这三个领域的问题在你的学校中当前效果如何,并且建立目标以提高其中一个领域的成效。

5.请列出与使用档案袋评价相关的两项益处以及两项挑战。

6.这一章探讨了能促进教师使用数据的三个方面内容:专业发展、支持数据的氛围以及相互合作。请在三者中选择其一,描述一下学校领导者能够为实施这一内容为教师使用数据创造便利的一些具体办法。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈