第十章 分层次的教育评价
教育评价是根据一定的目的,运用科学的技术和方法,对教育现象及其效果进行价值判断的活动。
以色列著名教育学家利维(A.Lewy)曾把教育评价的历史划分为三个时期。(1)(1)古典的考试型时期。教师主要以口头提问的形式,检查学生是否已理解所学知识以及对知识的记忆情况。(2)心理测量占统治地位的时期。始于20世纪20年代,以纸笔测试为主要形式,把心理测量工具运用于学校成绩测验中。至今这种以测验和测量为主的学业成就评价仍然在发挥着作用。(3)后现代时期。 20世纪80年代以来,对心理测量原则的适切性提出质疑,以开放性的结论以及“评价”(assessment)的概念代替以前的“评估”(evaluation)的概念,提高了教师在评价中的权威。
美国评价专家古巴和林肯(E.G.Guba&Y.S.Lincoln)在《第四代教育评价》一书中,把教育评价的发展分为测验和测量时期、描述时期、判断时期和建构时期四个阶段。(1)测验和测量时期(19世纪后半期至20世纪30年代)。这个阶段经历了约80年的时间。 1897—1898年,美国学者莱斯(T.M. Rice)曾对3万多名小学生进行拼字测验,以检查拼字教学时间对学习效果的影响。推动了教育测验问题研究的发展,莱斯也因此被称为教育测验的创始人。1916年,斯坦福大学教授推孟(L.M.Terman)主持修订了比奈(Alfred Binet)的智力量表,首次引用了德国人斯登(W.Stem)提出的智商概念,使心理测验达到较为成熟的阶段。这一时期,教育测验已发展成为包括智力测验、学历测验、人格测验三种不同性质的测验,到1928年为止,标准心理测验和学历测验已达3000多种。这一时期,评价的本质是以测验或测量的方式评定学生对知识的记忆或使用。(2)描述时期,也称泰勒时期, 20世纪30年代至50年代。从1932到1940年,美国进步主义教育协会进行了长达8年的课程内容改革实验研究,并组成了以课程论专家泰勒(R.W. Tyler)为首的评价委员会,以评价其研究成果。泰勒及其同事经过长期研究,正式提出了“教育评价”的概念和“行为——目标”评价模式。泰勒认为,评价教育效果,不能只测量学生的某些能力和特征,而应根据教育目标评价学生发展成长的进程和水平。评价应是一个过程,不仅要报告学生的成绩,更要描述教育结果与教育目标的一致性,从而发现问题,改进课程教材和教育教学方案、方法。因此,评价从本质上讲是“描述的”,即描述教育结果和教育目标的一致程度。人的行为是复杂的,有的可以量化,有的难以量化,所以,除了测验外,还需要用其他的各种评价手段来检查教育效果。(2)泰勒把具体的评价过程分为四个步骤:首先,确定教育目标;其次,依据预先规定的教育目标中期望学生变化的那种行为去设计评价情境;再次,选择和编制能引发教育目标所期望的那种行为的评价工具;最后,依据预定的教育目标分析、评价学生最终的行为。以目标为中心,通过具体的行为变化来判断教育目标的实现程度,是泰勒教育评价观的主旨。(3)判断时期(20世纪50年代至70年代)。20世纪50年代后期,教育评价理论得到较大的发展,泰勒的目标评价模式受到质疑,学者们从不同的角度提出了新的评价理论。如斯塔弗比姆(Stufflebeam)的“ClPP”模式、斯克瑞文(M.Seriven)的“目标游离模式”、斯塔克(R.E.Stake)的“应答模式”等,这些模式是对泰勒目标模式的进一步发展,教育评价由此进入判断时期。教育评价发展的判断时期以艾斯纳(E.W.Eisner)、斯克瑞文(M.Scriven)、斯塔克(R.E.Stake)等为代表,其核心观点是:评价在本质上是判断,评价是价值判断的过程。主张评价者不仅要运用测量手段去收集各种信息,还要根据一定的价值取向判断教育,追求教育的多元化发展。1975年,比贝C.E.Beeby首次提出了价值判断的问题,他把评价定义为:“系统地收集信息和解释证据的过程,在此基础上进行价值判断,目的在于行动。”(3)比贝强调评价要对教育活动的价值做出判断,包括对教育目标本身做出判断,使评价活动有助于决策的科学化,对实际工作有指导意义。评价的判断时期是对描述时期的超越。它走出了描述时期价值中立的误区,确认了价值判断是评价的本质,确认了评价的过程性。(4)建构时期, 20世纪60年代末、 70年代初至今。 20世纪70年代以后,许多学者对教育评价理论与实践的研究更加深入,对过去教育评价所出现的弊病进行了广泛的批判。认为传统的评价理论注重目标达成度、追求客观性和科学化,无视人的情感、主体性、创造性和不可预测性。(4)这一时期的教育评价提倡价值多元、全面参与和共同建构。以古巴和林肯为代表,他们认为,评价本质上是一种心理建构,并在实证的基础上,引进了定性的研究方法。强调了评价过程中评价者之间以及评价者与评价对象之间的互动,提倡在评价中充分听取不同方面的意见,更加重视评价对象在评价中的作用,并把评价看作是一个由评价者不断协调各种价值标准间的分歧、缩短不同意见间的距离、最后形成一致看法的过程。 20世纪80年代以后,评价从以决策为中心转向以人为中心。这种以人为中心的评价强调将完整的有个性的人当作自己的对象,并努力通过评价促使受教育者的充分发展。这种评价注重质的分析,带有较强的主观色彩。评价一般在相互信任和良好的人际氛围中进行,评价注重民主性,把学生看作是评价的主体,注重学生的自我评价。评价重视学生对评价的参与感和自我体验,努力养成学生自我分析、自我评价和自我调节的习惯和能力。
从教育评价的历史发展来看,教育评价的发展从测量到评价,其评价过程由封闭转为开放,评价内容由片面转为全面,评价的价值观念和评价的功能也由单一转为多元。 20世纪90年代以来,教育评价领域出现了许多新的评价形式,如表现性评价(performance assessment)、真实评价(authentic assessment)、档案袋评价(portfolio evaluation)、动态评价(dynamic assessment)、另类评价(alternativeassessment)、脚手架评价(Scaffolded assessment)等。教育评价正历着范式的变革:从心理测量模型向着更广泛的教育评价模型转换。
我国的教育评价理论研究起步较晚,但自20世纪80年代以来,教育评价的理论和方法研究有了一定的发展。在这些年来,我国教育评价在引进、吸收、消化国外先进成果的基础上,无论是在评价实践上,还是在评价理论研究上都取得了一定的成就,也取得了一定的共识。一是在评价功能上,要有利于促进学校全面贯彻教育方针,促进学生的健康成长,促进教师专业水平和综合素质的提高,促进教育事业的快速发展;二是在评价的内容上,要体现多元化。既要重视学生的学习成绩,也要重视学生的思想品德以及多方面潜能的发展,注重学生的创新能力和实践能力;既要重视教师业务水平的提高,也要重视教师的职业道德修养;既要重视学校整体教学质量,也要重视在学校的课程管理、教学实施等管理环节中落实素质教育思想,形成生动、活泼、开放的教育氛围。评价标准既应注意对学生、教师和学校的统一要求,也要关注个体差异以及对发展的不同需求,为学生、教师和学校有个性、有特色的发展提供一定的空间。具有代表意义的是,上海在2011年年底在全国率先推出的义务教育质量“绿色评价”体系。这个体系包括了“学生学业水平指数;学生学习动力指数;学生学业负担指数;师生关系指数;教师教学方式指数;校长课程领导力指数;学生社会经济背景对学业成绩的影响指数;学生品德行为指数;学生身心健康指数和跨年度进步指数”等十项“绿色评价”指标,属于上海市承担的国家教育体制改革试点项目。三是在评价方法上,着眼于多样性。除考试或测验外,积极探索多渠道的信息收集、多角度的深入透视、多因素的组合参与的评价办法,使评价成为教育行政部门、学校、教师、学生、家长和社会共同参加的交互活动。要研究制定便于评价者普遍使用的科学、简便易行的评价方法,探索有利于引导学生、教师和学校进行积极的自评与他评的评价方法。推进定性与定量评价、过程与终端评价、基础与发展评价的密切结合,提高评价的科学性,增强评价的权威性。四是在评价的理念上,重视发展性评价。发展性评价是一种依据目标,重视过程,及时反馈,促进发展的评价,强调个性化和差异性,注重在个体的成长中进行动态评价。着眼于学生个体过去和现在的比较,着重于学生成绩和素质的增值。承认人与人之间的发展存在差异,通过差异分析发掘适合个人发展的教育方法,从而激发学生的学习热情、求知欲望,促进学生快速全面地发展。这是一种以促进发展为目的,关注发展变化过程,促进评价对象增值的形成性评价。在评价过程中注重发挥评价的改进与激励功能,注重发挥学生、教师和学校的主体作用。
多元化的评价重在拓宽评价视野,提高评价的科学性;多样化的评价力求评价的有效性,强调改善评价方式与评价目标的匹配性;发展性评价注重发挥评价在诊断与改进中的作用,重视原有基础上的增值。
分层次的评价是建立在分层次管理理念基础上的评价行为。分层次管理的主要目标是针对群体中的差异性状况,以现实基础为前提,分别确定各自的目标,采取与各层次相适宜的措施,使各层次的管理对象在原有的基础上都得到提高。它的基本价值观是承认差异性、推动在原有基础上的发展、关注增值。这和发展性评价的理念是不谋而合的,核心价值观也是完全相同的。所以,分层次评价主要参照发展性评价的理论,结合分层次管理的特点,构建评价体系。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。