第三节 教育评价理论发展的社会文化基础
从历史的视角分析可以看出,西方教育评价所经历的第一、二、三、四代评价的发展历程,无不渗透着社会文化因素在教育评价的发展中留下的印迹,教育评价理论与技术的发展受不同历史时期社会文化变迁和教育改革需求的影响,评价理论及实践背后有着深刻的社会文化因素的烙印。本节用历史分析的方法来审视整个教育评价理论在其发展过程中,所受当时社会历史时期的价值基础、主流社会文化思潮的影响以及不同时期教育评价理论方法论等的演变情况,试图从深层次去把握世界教育评价理论形成发展的一些带规律性的东西。
一、评价理论的发展及其价值基础的演化
价值和价值观念体系是各种文化的核心和灵魂。价值是“评价”这一术语的根基,教育评价的价值基础是各种具体的评价方法的价值倾向。从教育评价的发展来看,评价模式的价值基础的转换是依据当时的历史条件而发展变化的;与整个社会由一元向多元、复杂的社会价值观的转换紧密相连,评价理论的价值基础也经历了一个从价值屏蔽到价值确定与唯一,再到关注多元价值的过程。
1.教育评价在最初体现为教育测量,是一种与价值无关的活动
从20世纪30年代教育测量运动到教育评价学的诞生,教育质量是一种与价值无关的客观存在,测量等同于评价。形成于上世纪初的教育评价,受当时科学管理运动的影响,在最初体现为教育测量,认为教育活动的“质”和“量”都是可以像企业一样测量,如果形成完整的测量体系,教育体系的管理就可以“科学管理”。早期的评价倾向于关注学生特征的测量,而把课程实施的有效环节—课堂和学校屏蔽起来。
2.从20世纪40年代后期到70年代初期,评价中开始彰显价值,评价活动建立在唯一确定的价值基础之上
30年代泰勒的“八年研究”对美国教育界的影响在于,比起盛行的效率和测验时期,它赋予教育评价一个更新、更广阔的视野。[20]泰勒模式以测量结果作为进行评价的主要基础,它的最终目的是确定某一程序(或课程)是否达到了它所要达到的目标。泰勒八年试验的前期也是希望对课程进行测量的,后来形成“目标导向”评价模式,更多考虑价值因素,开始更多关注事实描述基础上的价值,教育评价得以诞生并将教育测量纳入自己的范畴。这一模式确定了预定的目标规范,关注预期目标的实现。但“目标”被认为是天经地义的“公理”,不需要证明,而这个“目标”就是评价中价值的体现,因此天然地处于“唯一确定的价值”之中。所以,虽然西方文化是主张多元价值的,但教育评价形成后却是建立在价值唯一确定的基础之上的。
泰勒以其研究的结果告诉我们,在预期目标和实际结果之间存在着巨大差异。并将评价拓展到了教育项目质量的评价,人们开始关注课程的有效性。进入20世纪50年代,人们开始质疑课程改革本身是否能满足社会需要,也就是质疑教育目标自身的合理性问题,这就使得人们对目标评价自身的价值产生了反思。对泰勒评价模式的批判指出了评价者应当考虑的几个方面。泰勒模式没有考虑课程之外的效果:它未考虑过程变量,也不考察具体的教学环境(例如,测验成绩较差的原因可能是学生样本的不典型或因为课程实施不正确)。另外,泰勒模式没有考虑学习者的变量,这些变量在课程实施之前可能就已经存在。[21]这些批判和反思带来了教育评价革命性的发展。教育研究者对教育改革实施过程和情境的关注使得参与者的价值立场凸显出来。这时人们关注的并不仅仅是目标的达成,而是在过程之中所具有的繁复情境,关注在各种情境下的参与者特有的价值立场。评价也已经拓展到学生学习、课程设计的有效性之外,进入到教育系统、国家发展计划甚至是政策系统。
从20世纪60年代开始,评价者认识到很多情境因素,如社会政治力量都会影响到项目的实施。评价的价值及其伦理问题已经成为评价领域的重要问题。然而,价值作为“评价”这一术语的根基,引导价值判断作为评价的义务只是在第三代评价出现时才被明确地接受,因为那时价值确立的任务变成了核心的内容。
3. 70年代以后,评价开始关注多元价值的协商与融合,利益相关者的价值诉求成为当代教育评价的重要考量
70年代之后,随着对“目标”的怀疑,西方价值多元的本质得以彰显。重视多元价值取向与二战后美国进入一个复杂多元的现实世界也密切相关。整个60年代后出现的多元教育评价模式的融合和冲突正反映了这一社会现实。在评价过程中,判断的要求与价值多元化几乎是同时出现的。关于价值多元化的课程也在20世纪60年代后期被引进。随着对教育评价模式的批评与反思的不断深入和发展,70年代就已经发现价值多元的冲突并试图在“评价模式”上加以解决。
在文化多元、价值多元逐步被人们认同的背景下,当代教育评价逐步开始关注评价活动中多元利益相关者的价值诉求。由于容纳了相当多的评价对象,人们开始关注评价的价值主体及价值主体的需求问题。在评价过程中开始关注到评价者、被评价者各自的价值立场,力图在制定评价标准、收集评价信息资料、采用评价方法上能够兼顾到更多的价值取向。新近开发出的评价模式,它们的一个共同点就是关注价值的多元化,即确定并保持多元价值的视角。在收集和解释评价信息时,它们会很大程度地依赖于直觉化的过程。[22]评价者也认识到不同的价值主体有不同的观点、不同的倾向,于是“利益相关者”(stakeholder)就成了评价中一个通用概念。
斯塔弗尔比姆检视了美国在20世纪60年代与1999年间出现的22种评估模式的发展,将22种界定的模式区分为假评估、问题/方法取向评估、改善/绩效问责取向评估以及社会任务/倡导(socialmission/advocary)评估。除了假评估之外,其他的模式逐渐趋向平衡的追求严谨、关联与公正。并指出,这些模式表现出强烈的倾向,即注重相关利益群体的参与投入,以及使用多元的方法。[23]
评价实践中应用比较广泛的更新后的CIPP模式也开始关注多元利益相关者的价值诉求。其创始人斯塔弗尔比姆在更新的CIPP模式应用的进一步解释中强调,在CIPP模式中使用的一个关键概念就是利益关系人,亦即包括意图使用评估发现者,可能受评估影响者,期待对评估有所贡献者。如同联合委员会(Joint Committee,1994)的方案评估标准(Program Evaluation Standards),以及豪斯(House)和豪(Howe)的民主审议评价模式、枯巴与林肯(1989)的第四代评价模式一样,评估者应该找出所有相关的利害关系团体,并引导他们在参与解释和共识建立的过程中,可以协助界定评估问题,阐明价值和优点的准则,贡献所需的信息,以及协助解释评估的发现。如此丰富、持续而重要的参与过程,可以使利益关系人了解并重视评估发现和结论,并且据此行动。[24]
二、教育评价理论的发展与主流社会思潮的影响
一定时期的社会思潮对这一时期教育评价发展的影响是不可忽视的,通过分析不同时期的社会思潮来考察它们对教育评价理论形成发展所产生的影响,无疑对把握教育评价理论的发展规律具有重要意义。
1.第一代评价深受20世纪早期科学管理运动影响,是基于科学主义的活动,评价等同于测量
第一代评价的形成深受美国科学管理运动和教育测验运动的影响。在20世纪早期,科学管理的观念在工业和教育管理理论中成为一种强大的力量。这个运动强调系统化、标准化,最重要的是强调效率。全国教育研究学会(NSSE)1914年和1915年的年鉴中的标题最能反映对效率的强调,如《测验教师效率的方法》和《测量学校及学校制度效率的标准和测验》。[25]美国的教育测验所以会在20世纪初形成一种运动,有其发展的历史背景,即德国实验心理学的发展、英国对个别差异的研究和法国对不适应者的临床关心等,这三种研究潮流的汇成,对美国的教育测验运动起了很大的促进作用[26]。受科学管理运动和教育测量运动的影响,第一代评价数据资料的收集从单独的个人收集发展到运用合适的测量工具。评价等同于测量,与价值无关,是基于科学主义的活动,这是第一代评价的特点。
2.第二代评价受实用主义思想的影响,并借用行为主义心理学为其工具,形成对目标达成程度进行描述的评价
1929年至1933年席卷美国、并波及全球的经济危机粉碎了美国30年代“永久繁荣”的美梦;经济恐慌的美国,在他们走进40年代之初,便不得不对社会各方面之演变历史痛加反省,从各部门的根本问题加以检讨。同时这场经济危机也给教育带来了深刻影响。首先,经济的危机导致教育经费的拮据,美国许多学校关门,班级减少,解聘雇员等;其次,工厂倒闭导致失业青少年大量增加、青少年的浮浪等,不断地增加社会与教育的危机。这是给予美国对教育的根本反省与改进的大好机会,促使人们对教育的社会价值、社会效益进行深入的反思,教育的社会效益问题受到了人们的普遍关注。而当时推进美国教育改革的有志者,是以杜威思想为中心的“进步主义教育联盟(PEA)”,这些进步人士秉承“教育是改进社会原动力”的思想,自觉地负起推进美国的教育改造与社会改造之使命。[27]正如同罗斯福新政希望通过“新政计划”以刺激经济的复苏一样,杜威和其他教育改革者也试图革新教育,这股风潮就是所谓进步教育运动,这项运动是实用主义思想的反映,并借用行为主义心理学为其工具。[28]“正是在这一背景下,推动了以课程改革为核心的教育改革研究的开展,八年研究”(1933—1940)即为这种自觉精神的一大表现。泰勒受托主持“八年研究”时,直接参与了进步教育运动。
在“八年研究”实验中,泰勒等人根据严密的分析比较,证明进步学校毕业生优于传统学校,特别是发现知识的兴趣,系统而客观的思考力,应付新事态的能力,社会态度以及学生生活等方面,进步学校的学生均优于传统学校,更值得注意的是大学的优秀者都出身于进步学校。泰勒等人创造设计的对目标达成程度进行描述的教育评价,使得新教育获得实效,证明教育评价能够毫无遗憾地促进新教育的效果。[29]这种基于经济危机形成对教育的反思,采用改革教育达成目标,形成给予描述的评价,孕育形成了以描述为特征的第二代评价。
3.第三代评价深受二战后美国国家主义意识形态的影响,评价更多地关注价值判断,注重为决策服务
第二次世界大战后,美国国家主义意识形态有着广泛而深刻的影响,受其影响,第三代评价更多地关注价值判断,评价更多地为决策服务。二战后,各国都致力于战后经济的恢复和发展,重视人才培养和教育投资。1950年年末,美国针对“苏联卫星事件”,做出强烈反应并投重资在科学、技术与教育方面,以企图超越苏俄在太空科技的成就。当时支配美国的价值是国家安全,教育承担了要协助政府使美国在各个方面都要胜过苏联的使命。美国教育学家梅逊认为:“1950年以后,人们越来越根据教育对于国家的需要和国家的政策所做的贡献来评价学校教育。原先着重关心个人,现在则代之以关心国家。”[30]
从二战结束到70年代末,美国处于“福利国家”政策时期。教育被这一阶段历届总统及联邦政府利用来帮助实现联邦政府的政治职能、经济职能和社会公共职能。在1965年肯尼迪政府“新边疆”和约翰逊政府“伟大社会”的雄心勃勃的社会发展工程中,教育作为人力资源培养的方式而被视为促进经济的重要手段;在约翰逊政府“向贫困宣战”的宏伟蓝图中,教育是联邦政府努力消除贫困、促进平等的“主要武器手段”之一。[31]
从全国性教育改革来看,如果说19世纪末和20世纪初的进步主义教育运动是以社会力量为主,那么可以说从1958年《国防教育法》开始,美国的教育改革从此步入“联邦时代”。伴随而来的问题是,这些金额庞大的计划若未实施绩效问责制度,那么在某些地方的投资就会是浪费。于是罗伯特·肯尼迪参议员及其参议院的一些同僚在国会中修正了1964年制定的“初等及中等教育法案”(Elementary and Secondary Education Act,ESEA),明确地揭示评价是必备条件。联邦政府要求所有接受该法案资助的项目都必须加以评价,由此产生了对评价的需要,国家层面迫切需要关注教育结果的检测与评价,运用科学的教育评价来判断改革的功效问题。评价的重点集中于联邦政府大型的教育项目。在这一时代背景下,人们对教育评价领域当时占据统治地位的以目标为中心的泰勒模式进行了重新审视,结果认为目标导向的评价模式无法满足这一需求,人们开始质疑课程改革本身是否能够满足社会需要,也就是质疑教育目标自身的合理性问题。教育评价研究开始转向试图突破以目标为中心的泰勒评价模式的局限。人们开始关注不仅仅是目标的达成,同时开始关注教育改革实施的过程。
评价实践呼唤对被评对象的优点与价值进行判断,教育评价的重点开始转向了对教育项目的过程和结果进行评价,评价目标本身的合理性、查看投入、检查执行情况以及评价方案预期中与预期外的结果,这些都成为评价的主要关注点。以克龙巴赫、斯塔弗尔比姆为代表的学者认为,教育评价是为教育决策提供信息和依据的过程,评价的目的不在于证明(prove),而在于改进(improve)。CIPP模式正是建立在这种观点的基础之上的。[32]
在这一时期,教育评价的功能得到了扩展,评价不仅仅进行描述,更强调进行判断。20世纪60年代后期到70年代新出现的模式都认为判断是评价的有机组成部分。评价者假定一种价值中立的倾向,对被评对象的优点和价值做出判断。
4. 80年代后期引起关注的第四代评价,受新公共管理运动和人本主义思潮的影响,与多元文化和价值受到重视密切相关
第四代评价的有关思想虽然在20世纪70年代已有所体现,如斯达克的应答模式、斯克里文的目标游离模式等,从这些评价方法的背后,我们或多或少地能发现其尊重价值多元的有关思想,但在技术和操作层面很少在实践中得到进一步的应用。但第四代评价的思想真正引起关注的是80年代后,这与世界意识形态对立结束,多元文化受到重视,新公共管理运动的兴起,社会的市场化、以人为本等有密切关系,第四代评价是建立在一个更强调个性、自由、多样、尊重的时代基础之上的。
20世纪80年代以来,新右派思潮和管理主义的兴起,社会福利和公共服务的私有化和市场化在欧美国家蔚然成风,并且逐步影响其他地区,成为一种全球化趋势。在这一背景下,政府或国家在福利和社会服务的角色上有了根本性改变:从服务的主要提供者变成监控者。为了增加公共政策和社会服务的效率和效能,政府便采用了“新公共管理”或管理主义的思维来管理和营运公营部门。[33]
美国在20世纪80年代以后,在日益突出的低经济增长、高通货膨胀、高财政赤字和高失业率同时存在的“滞胀并行”的背景下,美国政府管理出现危机,引发了“重塑政府”、“再造公共部门”新公共管理运动,80年代初,里根政府发动了一场大规模的放松甚至废除政府管制的变革运动,并由此设计了一种使政府官员不仅对管理过程而且要对管理结果负责的新体制。克林顿政府继续推进政府职能市场化改革的进程,要求把建立一个“工作得更好而花费得更少”的政府作为优先目标,并于1993年提出国家绩效监察(National Performance Reviews),并且强调以公共利益为中心,以公众的满意度为评价标准,坚持顾客导向的价值理念。[34]在政府对教育的管理方面,强调放权和市场机制,实行教育管理民主化,让越来越多的人参与到教育管理中。当教育不再是少数人的活动与特权,而属于大众时,相应地,要求教育评价必须客观真实地反映各方意见,将各方利益相关者的意见和要求直接反映到教育决策中来。这种需求直接冲击了传统的基于价值确定与唯一的教育评价理念。
“20世纪70年代以来,民主社会的每一处角落都趋向多元价值观和多元化的思潮”。[35]这使得人们比以往更多地思考多元价值问题。同时也由于多元价值主体价值诉求的复杂性,各主体之间的价值冲突也就在所难免。当多元化的价值发展到一定的程度,就如经济全球化所带来的价值冲突彰显到一定程度的时候,人们就不得不开始思考价值认同的问题。[36]80年代后,美国教育评价的发展出现的关注多元利益相关者价值诉求的动向,实际上也是美国80年代占主导地位的人本主义教育思潮在教育评价领域的反映,要求社会尊重多元文化的现实,减少对少数民族文化的偏见、歧视和机会不公等问题,平等、公正等社会伦理观念也影响着教育评价活动。此时,越来越引起关注的第四代评价更关心社会的民主、个人在社会中地位的平等,特别是社会不利群体的在评价中的价值诉求和授权的实现。利益相关者达成共识的过程也就是一个各方民主参与、交流、沟通、协商、共同话语建构的过程,体现了社会正义的基本精神。同时,“产生于80年代的公众问责运动,作为一种新的社会思潮和社会力量,在小布什任期内达到了顶峰。”[37]公众问责强调公众对教育信息的知情权,要求大学和相应的组织对公众保持高度的透明度和责任感,这也为高等教育评价要关注多元利益主体的价值诉求起了一定的推波助澜作用。
三、教育评价理论的发展与方法论基础的转换
不同的教育评价模式是不同时期的产物,它们在不同的历史条件下受不同的哲学思潮影响,形成了不同的理论假设,在此基础上形成了对教育评价的基本认识。任何评价理论或评价模式都有一定的哲学基础和方法论前提,不同的评价模式是随着哲学理念的更新和方法论的转换而发展变化的。随着评价理论的发展,其方法论基础也经历了一个转换过程。
1.教育评价的“测量”和“描述”时代:实证主义的方法论
20世纪初,实证主义作为一种时代精神逐渐渗入到教育领域之中,进而也渗入教育评价的发展与改革中,并从方法论层面深刻地影响了教育评价的产生和发展,促成了教育评价研究中科学主义价值取向的形成。[38]实证主义的基本特征是:“将哲学的任务归结为现象研究,以现象论观点为出发点,拒绝通过理性把握感觉材料,认为通过对现象的归纳就可以得到科学定律。”[39]
在西方,从泰勒开始,一直到20世纪70年代,逻辑实证主义的理念和方法规范,在教育评价领域始终占据了主导地位。尽管期间人们对教育的目标究竟作如何理解也争议颇多,如从20世纪初叶便开始的进步主义、永恒主义、要素主义教育和改造主义流派等,围绕究竟是人、社会还是只是本身作为教育目标的聚焦点,众说纷纭,但这些纷争本身从未淡化教育评价作为一种由理性假设、经验事实资料采集到检验的工具性作用特征。
第一、二代教育评价均以实证主义为方法论基础,重视定量分析和经验研究的应用。以豪斯和斯克里文为代表,在评价实践中大量运用了实验、统计分析等量化分析工具,此时侧重于描述事实,侧重事实评价。如第二代评价的典型代表泰勒模式,追求的是科学主义实证化倾向,根据预定目标评价教育教学效果,找出目标与教学实际水平的差距,根据差距进行调整,视预定目标为评价的唯一标准,追求的是科学主义定量化。
2.教育评价的判断时代:人文主义的方法论开始萌芽,但实证主义仍占上风
20世纪50年代末,英国著名科学家和作家斯诺以其敏锐的洞察力察觉到西方社会已形成了以科技知识分子为代表的科学主义和以人文科学知识分子为代表的人文主义两大集团,他称之为“两种文化”。[40]由此,在同一时期(20世纪50年代末),西方社会思想领域出现了科学主义和人文主义两大阵营。人文主义认为人是自由、积极向上、追求卓越或自我实现的;强调个人的独特性和主体性,关心体验个人,坚持人具有不可分割的整体性,推崇人的尊严和价值;强调必须把人类行为置于特定情境中加以理解;重视在调查研究中,在随机观察中,在参与者的会谈和讨论中,获得定性的、而非定量的资料。[41]
受人文主义科学观的影响,泰勒模式之后,教育评价研究中的人文主义文化也开始萌芽。1963年,克隆巴赫尖锐地批评了以往的评价工作,认为以往的评价概念缺乏实用性和合理性,用实验组和控制组的常模参照性测验分数进行比较,是偏重于事后评价。他认为,应把评价作为一个收集和报告对课程设计有指导意义的信息过程,仅报告测验的平均分数而没有报告测验项目及其分析是没有用的。他指出:①评价不仅应关心教育的目标,检验教育目标达到的程度,更应关心教育的决策;②评价的重点应放在教育过程之中,而不是在教育过程结束之后;③评价不是决定优劣的过程,而是作为一个收集和反馈信息的过程。斯塔弗尔比姆在此基础上提出的CIPP模式,更是充分体现了过程评价的思想,他认为,评价不应局限在评判决策者所确定的教育目标预期效果的达到程度,而应该收集有关教育方案实施全过程及其成果的资料,评价是为决策提供信息的过程。他特别强调“评价的最主要目的不是为了证明(prove),而是为了改进(Improve)”。[42]指出过程评价要“通过描述真实过程,持续地与工作人员相互了解,观察其活动,控制评价活动的潜在障碍,保持对意外障碍的警惕,获得已确定的决策的特殊信息”[43],以达到促进评价对象的工作进行有效改进的目的。在评价中,评价者开始注意到与评价对象的充分的交流,反映了人文化的某些特点。但总的来说,科学主义实证化倾向仍占上风,评价者假定一种价值中立的倾向,把研究局限于经验主义或“事实性”现象的调查,该时期的评价研究较多采用田野研究和社会实验的方法。在20世纪70年代以后教育评价中的人文化倾向得到迅速发展,而此时的实证主义却又在新形势下有所发展。
3.教育评价的建构时代:后现代主义和建构主义的方法论基础
后现代主义(postmodernism)是一场发生于欧美上世纪60年代,并于70与80年代流行于西方的艺术、社会文化与哲学思潮。它以反思、批判现代主义文化、理论取向与基础、思维方式等为基本特征,以新的话语和形式解释世界为特点,其要旨在于放弃现代性的基本前提及其规范内容。两次世界大战以及工业文明给西方社会带来的种种弊端使人们对现代主义的信仰产生了怀疑,不再承认任何形式的“权威”现代文化中的机械论世界观已经陷入了危机,所谓的“决定性、稳定性、有序性、均衡性、渐进性、线性关系”等现代科学的基本范畴逐渐被“不稳定性、不确定性、非连续性、断裂、突变”等后现代的观念所代替。在这样一个中心失落、价值多元的时代里,后现代主义主张彻底的多元化,反对任何统一的企图以及将自己的选择强加于别人的霸权。[44]“受后现代主义知识观影响而提出的评价观,最早的是1973年由欧文斯(Owens)和1975年沃尔夫(Wolf)提出的对手式评价(Adversary Evaluation)”。[45]
后现代主义的哲学思维向度对教育评价有重要的方法论作用,后现代主义的否定真理的绝对性和主张价值取向的世俗化有助于我们消解在教育评价中采取过分客观化的评价标准及科学主义简单化的原则。理解是后现代主义的一个重要观点,解释学是后现代思潮的主要理论来源之一,建构是后现代思潮的主要思想之一。
20世纪70年代以后,在社会科学领域,受现象学以及“后现代主义”思潮的影响,“质性研究”在西方逐渐兴盛起来,“质性研究”揭示了“量的研究”所谓客观性后面的虚假性甚至欺骗性,承认研究者价值参与的合理性,尊重研究对象的个别性与独特性,强调情境性,反对“多数”对“实在”的专断。20世纪90年代后,“质的研究呈现出更加多元的状况,更加注重不同人群(特别是弱小人群)的声音,在方法上也更加兼容并包。”[46]
20世纪80年代末,枯巴和林肯提出的第四代评价明显地表现出受后现代思潮的影响。第四代评价将以理解为核心思想的解释学作为一种方法论的哲学基础,并将其思想体现在评价模式具体操作框架中。它根植于建构主义,假定社会现实是参与者不断建构的,存在多重因果关系结构,强调价值多元化,强调评价必须重视利益相关者的感受,及对利益相关者的价值诉求、利益和争执等作出回应性的应答。
从教育评价的发展来看,评价技术的发展与当时各种技术的普遍发展相吻合,并随着评价实践问题的凸显而不断完善和改进。随着评价对象的拓展,评价标准关注多元价值,评价方法也发生了相应的转换,从第一代评价单一的强调被测群体的测验成绩这样的定量方法,过渡到第四代评价关注实践情景、注重采用质的方法收集评价的信息资料。
四、教育评价理论的发展与不同时期社会需求和教育改革需要的影响
1.教育评价理论的发展受不同时期特定社会需求的影响,评价理论的发展得益于一定时期教育改革的需要
教育评价理论的发展受不同时期社会需求的影响,一定的社会条件是教育评价理论得以发展的实践基础。如果我们不理解过去不同时代的社会需求对高等教育评价理论发展的影响,那么也就不能理解当代多元社会发展的需求对高等教育评价理论变革的需求。在前三代评价的发展过程中,每一代都将评价概念向前迈进了一步,并且每一代都在其特定的时代和情境下肩负着自己的使命。人们会对每一代评价进行部分调整,以克服上一代所遇到的难题。
从教育评价发展的历史,我们不难看出,教育评价的理论在西方形成并迅速发展,是与当时的社会发展条件紧密相连的,评价理论的发展得益于社会发展的需要促使教育改革,进而推动了评价的发展。如果没有以合适的分类工具的发展为特征的第一代评价,来自个体的数据收集就不可能系统化。如果没有第二代评价中许多评价对象的扩展——从仅对人的评价扩展到项目、材料、教学策略、组织形式等,评价就会在测量的水平上停滞不前;第三代评价发展到对评价对象的优点(内在的、本质的优点)和价值(外部的、环境的价值)做出判断。
2.新的评价模式是以解决新出现的实际问题和适应现实评价情境为目标而拓展与催生的,关注价值多元已成为我国教育评价模式创新的现实选择
教育评价理论和方法的发展是与实际工作中的现实问题紧密相连的,从历史上看,评价理论和实践工作在许多方面都有联系。有些理论的提出,就是直接来源于实际工作中的现实问题。在最开始实施评价时,人们遇到了困难,于是便开发出早期的评价模式。当新的问题、情境和参与者影响到实践工作的性质时,人们就会继续拓展这些模式和方法,在批判原有模式的基础上,拓展和催生能够适应现实评价情境、解决实际问题的新的评价方法和模式。
3.评价理论的发展和技术的开发是随着不同历史时期人们对教育评价主要目标和本质认识的不同而发展的
从历史上看,各种评价方法的开发者们以及他们的拥护者们——提出的种类繁多的评价设计方式、收集和分析数据的方法,以及解释技术等。这些方式的差异可直接追溯到他们对评价本质的不同认识,及对教育评价主要目标认识的差异。评价模式间的一个明显差异就是人们对教育评价主要目标的认识不同,各抒己见的评价模式的开发者一般都承认教育评价有不同的目的,然而大多数评价模式却只强调教育评价中的某部分目的。
从以上分析可以看出,教育评价作为一种社会活动,它与一定社会的政治、经济和文化发展的宏观背景紧密相连。教育评价理论与技术是在教育实践中产生的,并随着文化的变迁、社会需求和教育改革的发展而逐步地发展与完善。中国教育评价理论的研究必须充分考虑中国特有的政治、经济和文化发展的宏观背景和我国高等教育运行的现实环境。
20世纪70年代末80年代初,在原国家教委的积极鼓励和组织领导下,评价作为高等教育管理的重要手段被重新引进我国高等教育领域。自此,高等教育评价活动迅速发展,目前已经成为推动我国高等教育发展的重要力量,其作用和影响在不断扩大,越来越成为一种高等教育活动的“指挥棒”。与此同时,高等教育评价中的矛盾和争议的问题也越来越突出。本章从引起社会广泛关注的高等教育评价的争议出发,根据政策文本、新闻报道、间接调查报告所反映的结果等经验资料,剖析争议背后所隐藏的问题的根源,并尝试性地提出走出我国高等教育评价价值困境的路径选择与解决我国高等教育评价面临的矛盾与冲突的改革思路。
【注释】
[1]Egon G.Guba and Yvonna S. Lincoln,(1989)Fourth generation Evaluation,Newbury Park,CA:Sage,pp.22-26.
[2]张民选.回应、协商与共同建构——“第四代评价理论述评”[J].外国教育资料,1995,(3):53-59.
[3]Egon G.Guba and Yvonna S. Lincoln,(1989)Fourth generation Evaluation,Newbury Park,CA:Sage,pp.27-28.
[4]Egon G.Guba and Yvonna S. Lincoln,(1989).Fourth generation Evaluation,Newbury Park,CA:Sage,pp.29-31.
[5]Egon G.Guba and Yvonna S. Lincoln.(1989). Fourth generation Evaluation,Newbury Park,CA:Sage,pp.31-38.
[6]Egon G.Guba and Yvonna S. Lincoln.(1990). Fourth generation evaluation:An“Interview”with Egon Guba and Yvonna Lincoln,Evaluation Journal of Australasia,2(3).pp.5.
[7]Egon G.Guba and Yvonna S. Lincoln.(1989). Fourth generation Evaluation,Newbury Park,CA:Sage,pp.35-38.
[8][瑞典]胡森(Husen,T.)等著,张斌贤等译.教育大百科全书(第7卷)[M].重庆:西南师范大学出版社;海口:海南出版社,2006:141.
[9]Egon G.Guba and Yvonna S. Lincoln,(1989). Fourth generation Evaluation,Newbury Park,CA:Sage,pp.40-41.
[10]张民选.回应、协商与共同建构——“第四代评价理论述评”[J].外国教育资料,1995,(3):55.
[11] Egon G.Guba and Yvonna S. Lincoln,(1990). Fourth generation evaluation:An‘Interview’with Egon Guba and Yvonna Lincoln,Evaluation Journal of Australasia,vol.2,No.3,pp.3-14.
[12]Egon G.Guba and Yvonna S. Lincoln,(1989). Fourth generation Evaluation,Newbury Park,CA:Sage,pp.38.
[13]Egon G.Guba and Yvonna S. Lincoln(1989). Fourth generation Evaluation,Newbury Park,CA:Sage,pp.39-40.
[14]Egon G.Guba and Yvonna S. Lincoln.(1989). Fourth generation Evaluation,Newbury Park,CA:Sage,pp.42.
[15][瑞典]胡森(Husen,T.)等著,张斌贤等译.教育大百科全书(第1卷)[M].重庆:西南师范大学出版社;海口:海南出版社,2006:607.
[16][瑞典]胡森(Husen,T.)等著,张斌贤等译.教育大百科全书(第1卷)[M].重庆:西南师范大学出版社;海口:海南出版社,2006:574.
[17]Egon G. Guba and Yvonna S. Lincoln.(1989).Fourth generation Evaluation,Newbury Park,CA:Sage,pp.149-150.
[18]Egon G.Guba and Yvonna S. Lincoln.(1989). Fourth generation Evaluation,Newbury Park,CA:Sage,pp.151-153.
[19]Egon G.Guba and Yvonna S. Lincoln,(1989)Fourth generation Evaluation,Newbury Park,CA:Sage,pp.188-226.
[20][美]斯塔弗尔比姆等著,苏锦丽等译.评估模型[M].北京:北京师范大学出版社,2007:10-11.
[21][瑞典]胡森(Husen,T.)等著,张斌贤等译.教育大百科全书(第7卷)[M].重庆:西南师范大学出版社;海口:海南出版社,2006:140.
[22][瑞典]胡森(Husen,T.)等著,张斌贤等译.教育大百科全书(第7卷)[M].重庆:西南师范大学出版社;海口:海南出版社,2006:589.
[23][美]斯塔弗尔比姆(Stufflebeam,D.L.)等著,苏锦丽等译.评估模型[M].北京:北京师范大学出版社,2007:96.
[24][美]斯塔弗尔比姆(Stufflebeam,D.L.)等著,苏锦丽等译.评估模型[M].北京:北京师范大学出版社,2007:324.
[25][美]斯塔弗尔比姆,斯可里文著,文新华等译.方案的评价:历史的概观[A].载瞿堡奎主编,陈玉琨、赵永年选编.教育学文集.教育评价[C].北京:人民教育出版社,1989:74-75.
[26]李聪明.教育评价的由来[A].载瞿堡奎主编,陈玉琨、赵永年选编.教育学文集.教育评价[C].北京:人民教育出版社,1989:60-62.
[27]李聪明.教育评价的由来[A].载瞿堡奎主编,陈玉琨、赵永年选编.教育学文集.教育评价[C].北京:人民教育出版社,1989:66-68.
[28][美]斯塔弗尔比姆,斯可里文著,文新华等译.方案的评价:历史的概观[A].载瞿堡奎主编,陈玉琨、赵永年选编.教育学文集.教育评价[C].北京:人民教育出版社,1989:77.
[29]李聪明.教育评价的由来[A].载瞿堡奎主编,陈玉琨、赵永年选编.教育学文集.教育评价[C].北京:人民教育出版社,1989:68-69.
[30][美]梅逊.西方当代教育理论[A].载扈中平、刘朝晖.挑战与应答——20世纪的教育目的观[M].济南:山东教育出版社,1995:349-350.
[31]曹雁.美国教育:自由主义体制下的国家主义倾向[J].比较教育研究,2007,(6):7-11.
[32][美]斯塔弗尔比姆著,陈玉琨译.方案评价的CIPP模式[A].载瞿堡奎主编,陈玉琨、赵永年选编.教育学文集.教育评价[C].北京:人民教育出版社,1989:298-301.
[33]戴晓霞,莫家豪等.高等教育市场化[M].北京:北京大学出版社,2004:34.
[34]李莹.教育政策评价的发展脉络及启示[J].中国高等教育评估,2006,(2):23-26.
[35][瑞典]胡森(Husen,T.)等著,张斌贤等译.教育大百科全书(第1卷)[M].重庆:西南师范大学出版社;海口:海南出版社,2006:605.
[36]王俭.教育评价发展历史的哲学考察[J].教师教育研究,2008,(3):1-6.
[37]王昕红.美国高等教育认可制度的演变、结构及权力[J].清华大学教育研究,2008,(6):85-89.
[38]张其志.教育评价的科学观及其方法论的演变[J].中国高等教育评估,2006,(2):27-31.
[39]李冲,杨连生.知识观演进视野中的教育评价理论的嬗变[J].教育理论与实践,2008,(6):86-87.
[40]叶浩生.西方心理学研究新进展[M].北京:人民教育出版社,2004,108.
[41]张其志.教育评价的科学观及其方法论的演变[J].中国高等教育评估,2006,(2):27-31.
[42][美]斯塔弗尔比姆著,陈玉琨译.方案评价的CIPP模式[A].载瞿堡奎主编,陈玉琨、赵永年选编.教育学文集.教育评价[C].北京:人民教育出版社,1989:298.
[43][美]斯塔弗尔比姆著,陈玉琨译.方案评价的CIPP模式[A].载瞿堡奎主编,陈玉琨、赵永年选编.教育学文集.教育评价[C].北京:人民教育出版社,1989:313.
[44]陈向明.质的研究方法与社会科学研究[M].北京:教育科学出版社,2000:43-44.
[45]李冲,杨连生.知识观演进视野中的教育评价理论的嬗变[J].教育理论与实践,2008,(6):86-87.
[46]陈向明.质的研究方法与社会科学研究[M].北京:教育科学出版社,2000:45.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。