到目前为止,我一直在将教学和考试进行比较。如果您只是匆忙间扫了一眼本书的封面,您起码会知道这是一本关于评价的书。如果您是一位细心的读者,您可能就会忍不住要问:这位作者的意图究竟是什么呢?我将学习的到底是测验(test)还是评价(assessment)呢?评价是否只是考试的一个时髦表述呢?简言之,作者的目的是什么?这些疑问都是合理的,下面我要做的就是为您解答这些问题,我将努力使我的答案具有说服力,并且能够产生鼓舞人心的影响力。
几乎每个人都能历数学校中开展的各种类型的测验。的确,今天绝大多数的成年人,在他们读书的时候都经历过教师组织开展的多次测验。包括:期末考试、期中考试、单元检测、通识性测验(pop quizzes),以及(在公平情况下的)各种非正规的小测验(mom quizzes)等。所有这些测验都有一个共同的特点:它们都表明教师想要了解学生到底掌握了哪些内容。更确切地说,教师之所以要开展测验,就是想要确定学生对他所教授的知识和技能的掌握程度。对教师而言,了解学生掌握了多少内容是完全值得称道的行为。如果教师能够准确地评估学生目前的学习状况,那么之后就能够更有效地调整教学活动,以帮助学生更有针对性地获得提高和进步。
以上段落曾提及形式多样的测试形式,例如我们大多数人经历过的小测验和考试,从历史发展的角度都可以将其归为纸笔测试。在许多年前,当我还是一名学生的时候,我所遇到的最常见的三种测试形式分别是:主观题、多项选择题和正误判断题。一直到大约十几年之前,这三种形式仍然是课堂中最为流行的。
但最近这些年,外界的压力迫使教育工作者需要不断扩大测验的概念,以使学生的发展状况不是单纯地由传统的纸笔测验所决定,而是取决于更多样的评价方式。之所以要求教育工作者开发多样化的测验技术,不是为了追求表面上的繁荣,而主要是因为明智的教育工作者已经认识到:纸笔测验不能对学生的所有学习活动进行准确的衡量。例如,一名教师想要确定学生在面试情境下的口头表达能力,那么,非常明显的是使用正误判断题来检测根本不能说明问题。
正是因为纸笔测验有其局限性,不可能用来衡量所有有价值的学习成果,而许多人一谈到测验,又往往会自然而然地联想到纸笔测验。所以为了能够更精确地描述问题,如今“评价”这个词被越来越多的教育工作者和测量专家采用。评价是教师们进行教育测量的一个更为广义的描述符,这个描述符不仅指代传统的纸笔测试,而且涵盖了种类更多的测量方式。以下给出一个适用于教育背景的关于评价的操作性定义:
教育评价是一种正式的方法,旨在判定学生在一些教师关注的教育变量上的状况。
为了避免您被这个相对陌生的概念所迷惑,让我们先来简单分析一下它所涵盖的基本要素。值得注意的是:我们谈论的这种评价是基于“教育变量”的前提来判断学生的发展状况的。变量主要是指经常变化的事物(我相信您能够指出所有熟悉的变量)。例如,我们发现在教育过程中,学生之间存在很多差异:他们对某一课程内容掌握的情况不同,他们对某项技能的熟练程度不同,而且他们对于学校的积极态度也有相当大的不同。这些就是教师通常需要考查的问题,因而也就构成了教师想要测量的“教育变量”。如果教师的教学重点集中在工业革命上,那么,教师可能希望评价学生习得了多少关于工业革命的知识。在这种情况下,教育变量就是学生对关于工业革命内容的掌握程度。如果老师感兴趣的是学生对自己的书面写作技巧是否有信心,那么学生的写作信心就成为了一个教育变量。教育评价就是考核类似的一些变量。
我们的操作性定义还指出,教育评价是考查学生状况的一种正式的方法。作为人类,我们基于各种各样的情形,经常会作出一些非正式的判断。例如,我们可能会得出这样的结论:在超市的收银台前插队交钱的女子缺乏教养,跌跌撞撞爬楼的男子举止笨拙。这些判断都是非正式的。同样,教师也会对自己的学生作出一些非正式的评价。例如:根据学生在课堂上头几分钟里闷闷不乐的表现,教师就可能认定这个孩子性格古怪。这类非正式的评价虽然对教师可能产生一定的帮助,但是它们不能算作教育评价。
例如,在我担任高中教师的时候,我曾通过非正式的方法认定雷蒙德·哥特(Raymond Gonty)对我所教的美国政府课程根本不感兴趣。我之所以得出这个结论,主要是因为雷蒙德经常在我的课堂上睡觉。而且到后来,他甚至每到上我的课就带着一个枕头走进教室,这让我更加坚信自己的判断是正确的。
与以上评价不同,本书当中您将阅读到的这种教育评价是一种正式的评价,也就是说,这是一种依据学生的知识、技能、态度等变量来有意识判断学生状况的评价。您将体会到这种教育评价绝不仅仅是教师个人的主观“印象”,它是一套系统的关于判断学生状况的评价方法。
因此可以说,评价是对教师所必须进行的各种考试和测量工作的一个宽泛的、相对的、不严格的称谓。这种称谓也提醒教育工作者,关于学生状况的测量应该包括、但不能仅仅限于纸笔测试,评价是一个囊括了各种类型考试和测量的词汇。在本书接下来的内容当中,您将发现尽管我使用评价这个术语,但我也会经常使用考试和测量。我并不想试图区分它们之间的细微差别,相反,我将努力把它们当作一个词来使用。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。