国外关于学校评价改革的研究

时间：2023-03-11 理论教育版权反馈

【摘要】：在所有类别的教育改革中，学校改革当仁不让地成为“教育改革的核心”。而学校评价正是学校质量保障的重要途径。其基本特点在于以“协商”为基础，评价者与评价对象共同建构评价过程，为发展而评价，以评价促发展。发展性教育的评价思想的提出，使学校评价的价值取向发生了较大的转变。很长时期以来，许多国家的学校评价其实就是外部评价。在这种大背景下，有关学校评价内容的指标研究就成为世界教育学术研究的核心问题之一。

一、国外关于学校评价改革兴起的研究

自20世纪80年代以来，人类社会正在进入全球一体化和以知识的创新与应用为重要特征的知识经济时代，社会变革和发展的速度不断加快，教育面临的冲击也越来越大。世界各国各地区为谋求自身更强的竞争力和可持续发展，兴起了一股教育改革的浪潮，以提高教学教育的质量和效能。在所有类别的教育改革中，学校改革当仁不让地成为“教育改革的核心”。人们相信只有当地方层级的学校行动起来时，教育的改进力量才会增强。

从全球学校变革的实质来看，不同国家或地区的学校变革，在回应社会变革的挑战时，主要有两个路径：一方面从市场化、私营化和地方分权等策略入手，重视和鼓励学校与学生的个别表现和竞争，强调成本和结果，倾向于将资源分配给较成功的学校和能力较强的学生；但另一方面不少政府也通过国家课程、考试能力标准、教师评价、学校评价等措施，加强对学校的“质量保障”（Quality Assurance）。

学校质量保障的潮流很快推广至美国、芬兰、挪威、澳大利亚等国家，并迅速影响至亚洲的一些地方，比如中国香港在1997年发布的《教统会第七号报告书》，就建议建立一个“内外相控学组，推行保障教育质量”的政策。完善的学校质量保障机制，通常通过外控保障和内控保障两种途径，来保证学校的教育质量。而学校评价正是学校质量保障的重要途径。正如斯塔弗尔比姆（D.L.Stufflebeam）所说的，“评价最重要的意图不是为了证明，而是为了改进（注：斯塔弗尔比姆著，陈玉琨译，施良方校：《方案评价的CIPP模式》，载《教育学文集.教育评价》，第301页）”。然而，长期以来，以泰勒模式为首的前三代评价观，采用“预定式的评价”（Preordinate Evaluation），强调评价的鉴定、选拔和奖惩功能，而忽视了评价的根本目的在于改进学校工作。20世纪80年代，倡导民主协商，为改进工作而评价的第四代评价观的兴起，掀起了西方国家的“评价改革运动”，以美国、英国为首的一些发达国家开始摒弃那种注重鉴别和奖惩的教育评价制度，逐渐采用发展性教育评价。

发展性教育评价思想，是一种以构建主义哲学观为基础的评价理论，最早是由英国伦敦大学教育学院的纳托尔（Latoner）和克里夫特（Crift）于20世纪80年代初提出的，是一种以教育的发展为评价对象，又以教育的发展作为目标的评价。其基本特点在于以“协商”为基础，评价者与评价对象共同建构评价过程，为发展而评价，以评价促发展。它有别于原有的选拔性评价和水平评价，是在发展的整个过程中进行的，旨在促进被评价者不断发展的评价。

发展性教育的评价思想的提出，使学校评价的价值取向发生了较大的转变。在评价的目的上，由侧重鉴别和选拔转向侧重发展，从关注结果的评价，转向关注诊断性评价和过程性评价；在评价的内容上，注重全面质量管理，从办学的理念与目标、办学条件、领导与管理、课程与教学、教师队伍建设、学校办学效益等多个方面进行全面、综合的评价；在评价方法上，强调多样化，注重把定量评价与定性评价结合起来；在评价主体上，强调评价主体多元化，重视自评与互评的作用，强调评价对象的参与性，改变过去那种自上而下、评价对象被动接受结果的状态等等。

二、关于学校内部评价与外部评价关系的研究

很长时期以来，许多国家的学校评价其实就是外部评价。有的评价由视导人员执行（如英国及其他一些欧洲国家），有的则是通过州、地区的认证机构来完成（如美国等）。外部评价对于监督学校的办学绩效、激励教师和校长更加努力地改进学校教育有着非常重要的作用，但是也存在着一些弊端，比如不熟悉学校的发展脉络、容易对学校成员产生威胁等。近年来，随着校本管理运动的展开，许多国家逐步重视通过内部评价或者说是以自我评价来支持学校的自主发展。自1992年内伏（Nevo）提出内外部评价的“学校本位评价（School-Based Evaluation）”概念之后，许多有关学校本位评价的议题多环绕在内外部评价结合或是评价者与教师的合作过程上。斯塔弗尔比姆（1994）整理《教育评价研究》（Studies of Educational Evaluation）期刊，认为在学校评价中有八项重要的趋势，其中一项即为内伏的“内部与外部评价的结合：学校本位评价的个案研究”。内伏（1995）认为，外部评价容易造成学校成员的内在教育价值观的冲突，但在内部评价机制的建构过程中，学校成员多缺乏评价的基本概念，因此，他开始探究如何通过赋权增能（empowerment）的力量，协助学校自助机制的建立，寻求与外部评价的沟通途径，并在以色列的教育系统中实施。后来他在其著作《校本评价与学校发展》（School-Based Evaluation：A Dialogue for School Improvement）一书中，对学校本位评价有了更清晰的认识。他认为，学校本位评价并非内部评价的同义词，也不是外部评价的反义词，而是两者之间的联系，其关系为互补，而非对立。

三、关于学校评价主要内容研究

20世纪90年代后期，随着“以校为本”和“学校重建”改革的不断深入，学校产生了自我积极发展的动力，但缺少自我识别与诊断的工具与能力。在这种大背景下，有关学校评价内容的指标研究就成为世界教育学术研究的核心问题之一。世界各国、各地区以及经济合作与发展组织（Organization of Ecnomic Coperation and Development，OECD）、欧盟统计中心（EUROSTAT）、国际教育成就评价协会（International Education Association，IEA）等国际性组织都在致力于学校指标的研究与开发工作，并在各自评价指标的基础上制定了相应的评价方案。

（一）欧洲学校教育质量评价试点计划SEP

1997年欧洲制定的学校教育质量评价——“欧洲试点计划”为参与评价的各国提供了通用的学校自我评价框架（Self-Evaluation Profile，简称SEP），它包括4个领域、12个方面：①输出层面：学术成就、个人与社会发展、学生流向；②课堂层面：学习时间、学习和教学的质量、学习困境的支持；③学校层面：作为学习场所的学校、作为社会场所的学校、作为专业场所的学校；④环境层面：学校和家庭、学校和社区。不同的学校可以根据上述这几个方面并结合学校的实际情况，对自身进行全面的剖析，找出自身的优势和劣势，确立近期重点改进和评价的内容，以促进学校的进一步发展。

（二）经济合作与发展组织（OECD）的发展性学校评价指标框架

经济合作与发展组织的教育评价专家在综合研究影响学校改进与发展的主要因素基础上，于1996年提出了一个学校评价的指标框架。详见表2-1。

表2-1　OECD学校评价的指标框架

（注：OECD.Center for Educational Research and Innovation（CERI）—Schooling forTomorrow[EB/OL].http：//www.oecd.org/dataoecd/41/58/35393911.pdf1998-04-06/2004-01-15）

资料来源：OECD的《教育研究与革新中心——明日的学校》（Center for Educational Research and Innovation（CERI）—Schooling for Tomorrow）。

（三）英国伦敦大学教育学院萨蒙斯的发展性学校评价指标体系

英国伦敦大学教育学院的萨蒙斯（P.Sammons）在其著作《学校效能：在21世纪走向成熟》（School Effectiveness：Coming of Age in the Twenty-First Century）中概括了高效能发展性学校的11项指标，详见表2-2。

表2-2　高效能发展性学校评价的11项指标

（注：Sammons.P.School Effectiveness：Coming of Age in the Twenty First Century[M].Lisse，the Netherlands：Swets&Zeitlinger，1999：195）

资料来源：作者根据Sammons，P.School Effectiveness：Coming of Age in the Twenty First Century整理。

（四）美国“蓝带学校”评价标准与“新美国高中”计划

20世纪80年代以来，美国联邦和各州政府为了提高教育质量，表彰先进学校，设立了名目繁多的学校评比项目，其中最有影响的就是“蓝带学校（Blue Belt School）”和“新美国高中计划（New American High School Initiative）”。

蓝带学校是“卓越”（excellence）教育与“均等”（equality）教育的典范。学校若能脱颖而出受到表彰，必须展现并提供对所有学生卓越教育的承诺。蓝带学校计划欢迎达成这些目标及克服困难并有显著进步的学校提出申请。蓝带学校的申请条件是：公私立学校必须成立满5年才能申请，且受过表彰的学校5年后依然符合申请的资格。通常州教育厅选拔公立学校并向教育部推荐，美国私立学校协会推荐私立学校，另外联邦印第安事务局、国防部则分别推荐所属学校，之后由教育部召集全国小组进行评鉴，经评审小组（National Review Panel，由约100名杰出的中小学教育、中学后教育专家组成）讨论，认为比较好的学校将接受为期两天的实地考察和核证，实地考察人员由富有经验的教育专家，包括已被评定为蓝带学校的校长构成，考察结果以报告的形式递交国家评审专门小组，经小组审议合格的学校由该专门小组推荐给美国的教育部长。教育部长亲自向学校授予蓝带学校的荣誉称号，并在学校里树起蓝带学校的旗帜。

申报标准有定性和定量指标两部分，定量指标包括入学率、巩固率、参加公开考试的分数等，定性指标是根据评审小组制定的标准进行评价的。具体来说，包括以下8大项目：①学生的重视与协助；②学校组织与文化；③挑战性的标准与课程；④教学活动；⑤教育专业；⑥领导及教育活力；⑦学校——家庭——社区伙伴关系；⑧成功的指标。

评审小组根据以上标准把所有申请评为蓝带学校的等级分为：模范、优秀、合格、薄弱和不适当，只有模范和优秀等级的学校才能得到表彰。

在美国，除了综合性学校表彰之外，每年也有指定的重点项目，这些重点项目是某些学校需要大力改进的部分，或是教育部正在某些方面挑选最有效的模式，学校可选择某项重点项目参加评比。比如1996年，联邦教育部着手推动“新美国高中计划”，选拔推广符合21世纪需要的高中，兼顾学科与技能的学习以及升学与就业的准备。具体而言，该计划旨在激励学校在采用挑战性学业标准之外，能够协助学生习得沟通及问题解决能力、计算机应用及其他科技知识，并顺利升学及就业的优异高中；这些高中均与社区、父母及高等教育机构建立伙伴计划，并在五年期间展现学生的学业成绩的持续进步。

（五）新加坡政府推行“卓越学校模型”的学校评价模式

为了实现国家愿景——“思考型学校，学习型国家”（Thinking School，Learning Nation，简称TSLN），新加坡政府要求学校努力发展成优秀学校，赋予它们更多的自主权，可以灵活响应学生的需求。并鼓励校长将自己作为他们学校的CEO，带领员工管理学校系统，产生预期的教育成果。为了支持这种变化，自2000年以来政府已经改变了学校评价方式，要求学校使用新的“卓越学校模型”（School Excellence Model，SEM）做好自我评价。学校督导使用对学校不完全透明的措施督导的时代已经不复存在。显然引进SEM很重要且需要及时支持“思考型学校，学习型国家”（TSLN），这还是一个政策变化，将深深影响学校的管理方式。

“卓越学校模型”（SEM）是学校自我评价模型。该模型借鉴各种商业组织的质量模型，譬如欧洲质量管理基金会（European Foundation of Quality and Management，EFQM）、新加坡素质奖（Singapore Quality Award，SQA）模型以及美国的教育版本所使用的波多里奇国家质量奖模型（Malcolm Baldrige National Quality Award，MBNQA）。它有意识地努力使SEM和SQA相匹配，以便各个学校能按照国家基准来定位组织是否卓越。SEM的目的是提供一种方法，客观地确定和衡量学校的强项和需要改进的地方；为客观识别提供一种方式，测量学校的改进强度和改进范围。它还有利于按同类学校确立基准，刺激可以对学校整体素质和教育系统最终质量产生积极影响的改进活动。

卓越学校模型是由一系列核心价值观驱动的，它定义了SEM的目的和形式。核心价值观强调富有目的的学校领导的重要性、把学生放在首位、把教师作为素质教育的关键，等等。SEM承认以学生为中心的步骤在带来持续结果中的重要性。SEM也承认，结果超出学术成果之外。虽然学校的学习成绩仍然是重要的，但是提供品质教育和全面教育的学校就是一所优秀学校。在“卓越学校模型”中，要求那些满足目标的优异成绩，能够持续数年，并显示出积极的趋势。前提是相信一个优秀的学校不会仅仅产生一次性的好成绩。SEM框架有两大类——“促成”和“结果”。“促成”的范畴包括文化要素、过程要素和资源要素，关注的是如何实现结果。“结果”所关注的是学校已经实现或正在实现什么。针对学校评价，SEM包含了9个质量标准（注：Sammons.P.School Effectiveness：Coming of Age in the Twenty First Century[M].Lisse，the Netherlands：Swets&Zeitlinger，1999：195）：

（1）领导：学校领导和学校的领导体制如何处理价值观念并把重点放在学生的学习和优秀成绩上，以及学校如何解决其对社会的责任。

（2）战略规划：学校如何设定明确的涉众战略方向，制定行动计划以支持其指示、部署计划和跟踪表现。

（3）员工管理：学校如何开发和利用其员工的全部潜力创建一所杰出的学校。

（4）资源：学校如何有效和高效地管理其内部资源及外部伙伴关系，以支持其战略规划和进程操作。

（5）以学生为中心的进程：学校如何设计、实施、管理和提高关键工序以提供全面教育，并致力于增强学生幸福感。

（6）行政和业务成绩：成果。

（7）员工成绩：学校正在完成什么和全体教职工的培训、发展及斗志有关的（成果）。

（8）伙伴关系和社会成绩：学校在实现什么与其合作伙伴和社会大众相关的（成果）。

（9）关键绩效成果：学校在为学生的全面发展所极力完成的工作，尤其是在学校能够达到理想教育成果的程度上。

SEM基本上描述了一所杰出的学校：领导们给员工带头、制定战略和部署资源。所有这些都被系统地送入明确确定的以学生为中心的过程，此过程已设定目标且有绩效监控和管理。这些“推动者”在全体员工和利益相关者（涉众）的满意度以及对社会影响产生的成果，都有助于完成学校业绩并使其更卓越。

使用SEM做评价时，模型需要以下证据：

（1）模型为系统化并持续改进质量而定义的标准健全完整的方法；

（2）这种方法的系统部署和执行程度；

（3）定期评价、方法审查及其部署，都基于取得成果的监测和分析，以及正在进行的活动；

（4）规划和实施改进活动；

（5）一系列适当的并具有挑战性的绩效目标；

（6）在三到五年内业绩持续改进；

（7）一个针对同类学校的表现基准。

因此，这评价过程针对每个标准，评价者考虑到如何做好上述已经实现的几点——在适当条件下，分数越高，成绩越好。

值得注意的重要的一点是，评价过程明显需要证据来证明某一成绩。不允许评价者基于他们的直觉或感觉来打分。

因此，即使一所学校相对某一特定标准被认为表现良好，但如果没有这方面的证据，该模型不允许因特设成绩而比分超出。此外，一所学校为了得高分，除了有明确的与证据有关的标准外，还必须有持续改进的证据。趋势分析信息是必需的。

学校不仅可以采用SEM来衡量学校有多好，也可以使用SEM作为整体发展和管理框架，这就为学校积极参与能力建设提供了一个框架。它帮助学校找出需要改进的地方，并为学校挖掘创新优势。新系统强调以自我评价作为主要机制来推动学校改进的重要性。自我评价是一个参照商业卓越模型的组织活动，并对结果进行全面、系统且定期的内部审查。波特（Porter）和唐纳（Tanner）坚持认为自我评价不仅是测量持续改进的一种手段，而且也是一个将全面质量管理集成到正常操作的极好机会。一个来自教育部的外部团队大约五年一次地使用相同标准对自我评价结果进行验证。

与SEM相关的是学校总体规划奖，共有3个级别的奖项。第一级包括给学校每年为本年度所取得成果颁发的成就奖。第二级包括最佳实践奖（BPA），它承认在“推动者”范畴内学校的高分。还有永恒成就奖（SAA），它承认在“结果”范畴内学校有持续好的成绩。奖项的最高级别是学校优秀奖（SEA），该奖项表扬学校卓越的教育过程和结果。就像任何其他的工业或商业部门组织一样，学校也可申请新加坡素质奖（SQA）。除5年一次的强制性外部验证外，学校可能需要附加的外部验证以取得获取这些奖项的资格。

新加坡教育系统引进的SEM在新加坡学校的领导和管理方面有重大影响。在激烈的校际竞争背景下，学校领导者的心智模式，应与SEM作为一种自我评价工具的意图保持一致和平衡，而不是校际比赛的另一个场地。SEM的整体方法也意味着，学校领导的管理方法需要系统化。一所好学校的SEM提出的高需求，意味着更高层次的学校领导比以往任何时候都更需要把学校带到一个新的卓越水平。

追求学校卓越既是一个过程，同时也是一个目标。SEM只不过是过程中一个到达目标的工具。因此，学校应注重SEM的实质内容而非形式。否则，即使完全实现，SEM分数可能成为目标本身，而学校卓越成为一个副产品。为了使学校卓越具有意义，学校领导应专注于将学校卓越作为期望的结果，让SEM得分作为旅程产品。

任何奖项都是继续努力的鼓励，而不是旅程的结束。通过这种方式，SEM将真正成为优秀学校一个有用的参考框架，以引导确定需要改进的地方。学校的卓越之旅将由实质推动，而非形式使然。

SEM象征着新加坡学校与教育部（Ministry of Education即MOE）相互关系的一次根本改变。SEM代表从学校只从总部接收和执行法令的旧模式中分离出来。SEM形成平台的一部分，在由教育部定义的广泛政策参数内学校可以带头实行自己的教育或改革举措。它主要是一种自我评价的工具，而不是为让总部给学校分级。这是一个新的心智模式，要让学校领导信奉它还需要一些时间。而使这个新的心智模式要最终扎根，还需教育部官员和学校领导之间有共同的愿景。如果在比赛中SEM被用作学校“考试”或“排名”，那么SEM就失去了其意义和目的。某种形式的竞争和标杆是有益健康的，但若是太多将会使SEM成为一种发展证据的运动，而不是真正为了推动改进。

从理论上讲，SEM是支持学校走向学习和改进的文化。这是符合质量文化特点的，它强调信任和不责备。然而，有压力，因为这样一个新的思维模式还没有完全取代旧的。尽管教育部已经明确表示，SEM是为了自我评价和改进，但一些学校领导可能仍然将模型解释为仅仅是为了控制和审查，认为它有可能影响他们的职业生涯，从而不惜一切代价要得高分。因此，如果没有对SEM的定义和意义达成共同理解，将有越来越多的项目以学校卓越之名而实际仅仅为了满足SEM指定的条件，在整个学校系统进行，作了一场一场的演讲。项目以放量开始。开始时宣传力度很大，但很快，浪漫嘎然而止，热气褪去。宝贵的资源被浪费在整个教育系统。这里的关键问题是，学校对达成优秀的目标是认真的，还是只为它在SEM的得分。这两个目标不是相互排斥的，但在强调方面有一个显著的差异。信奉的目标是学校卓越，但那真是正在使用中的目标吗？实际使用中的目标很可能是“创造”天马行空式的学校管理框架，或其他得到可让外部评审员给他们一个奖项的证据。此外，学校卓越是一次漫长的旅程，可能需要几年的时间才能收获果实。同时，无论是为排名还是为奖项，学校可能倾向于快速展示好东西。这是一个速战速决的心态——追求速胜。不是保持达到学校卓越目标的努力，而是将目标降低到只求快速得到好的分数。

有鉴于此，学校领导和教育部官员应小心谨慎，不要延续已在系统中发现的激烈竞争，这是非常重要的。SEM不是一个新的竞争领域。一个共同愿景是在表层价值观上，接受SEM是改进学校的自我评价工具，在教育系统中是非常必要的。

四、关于如何促进学校评价实施的研究

发展性学校评价被认为是“学习型学校的前提”，但其激发组织学习的功能却又依赖于以下方面的实现：

（1）学校评价观的转变。学校评价工作的首要目标是努力做到“有所帮助”。也就是说，学校评价不是为了把学校划分为三六九等或是制裁某些学校，而是为了向从业人员提供必要的帮助，督促他们去反思自己的工作。“评价可以帮助教师认识到自己知识的不足，让他们看到顺利展开教学工作而必须具备的各种知识和技能”。

（2）要提供切实、经常的培训和训练。这种培训和训练不仅包括对工具的使用，更包括对评价流程的管理。教职工的培训要求评价服务提供者、外部咨询者和校长付出实质性的努力。

（3）学校对评价的态度可能取决于评价在以成绩为导向的问责制和以学校改进为导向的框架中是否占有一席之地。尽管前者更容易受到抵制，但以改进为导向的评价文化，也同样不可能理所当然地为学校全体人员所接受，而必须经常受到外部评价来激发。挪威的学校自我评价实践表明，校本评价的推进需要外部系统的支持。在挪威的学校评价系统中，校本评价是其中的一个组成部分，这就是从国家层面上确立了校本评价的地位，而国家颁布的校本评价手册的出台也使得实验学校先前在校本评价方面取得的发展得到进一步的巩固。专家以研究者和指导者的双重角色介入，参与概念的界定、方案的厘定、实施过程中的系统调查和及时调整，使学校校本评价得以在一个较高的平台上起步，在可以持续得到反馈和指导的过程中进行。

（4）处理好外部评价和内部评价之间的关系。内外部评价都有其重要的作用，要促成两种评价对话的实现，内伏提出有必要从理念、方法论和交流三个方面达成下述共识：在理念上，评价不许被假设为理解的手段而不是判断的手段：在方法论上，评价不是一件一蹴而就的事情，应该作为一个过程来实施：在交流层面上，评价者和被评价者双方必须是平等的，相互尊敬和信任，并都应为评价结果负一定的责任。

综上所述，从上述国外有关学校评价的研究现状来看，研究主要集中于校本评价和自我评价，研究的重点也是从最初的探讨学校自我评价的目的和意义，转移到探讨影响学校评价实施效果的因素及其解决策略上来。研究方法也主要以个案研究为主。相对来说，我国关于学校评价改革的研究尚处于起步阶段，仅有的一些研究，也是从应然的角度介绍学校评价的意义与模式，缺少将应然的架构付诸于实践的研究，以及从复杂的本土实践中分析在既有的教育脉络中影响学校评价实施的因素和对策。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈