几十年来,人口基数为世界第一,文化历史底蕴深厚的中国教育未能培养出多少杰出人才,成为众多人试图揭开的谜,这个谜的关键是教育评价。在实践中,如何评价一个人决定着如何教学,决定着教学是否真的能为一个人成才服务,也就决定着一个人能否成长。若评价离开这个目标,或在偏离这个目标的实现,那么在教育上的投入越多,则损伤越大。几十年来,中国教育正是由于使用过于单一的标准评价教育对象,导致人才成长发展受到严重障碍。
(一)谁是“一个标准”的需求者
1979年6月,刚刚开放的中国曾派一个访问团去美国考察初等教育,回国后写了一份考察报告。同一年,作为互访美国派了一个考察团来中国,也写了一份考察报告。
中国教育考察团的报告中道:美国学生无论品德优劣、能力高低,无不踌躇满志;小学二年级的学生,大字不识一斗,加减乘除还在掰手指头,就整天奢谈发明创造;重音、体、美,而轻数、理、化;课堂几乎处于失控状态,最甚者如逛街一般,在教室里摇来晃去。结论是:美国的初等教育已经病入膏肓,再有20年中国的科技和文化必将赶上和超过这个超级大国。
美国考察团的报告中道:中国的小学生在上课时喜欢把手放在胸前,除非老师发问时举右手,否则不轻易改变;早晨7点钟以前,在中国的大街上见到最多的是学生;中国学生有“家庭作业”,是学校作业在家庭的延续;中国把考试分数最高的学生称为学习优秀的学生,一般会得到一张证书,其他人则没有。结论是:中国的学生是世界上最勤劳的,他们的学习成绩和世界上任何一个国家的同年级学生比较都是最好的。可以预测,20年后中国在科技和文化方面,必将把美国远远地甩在后面。
20年之后,“病入膏肓”的美国基础教育共培养了几十位诺贝尔奖获得者和100多位知识型的亿万富豪,而中国还没有哪一所学校培养出一名这样的人才。35年后,即便是在中国受完高中或大学教育后再到美国留学并工作奋斗不息的人,还没有表现得比美国教育培养出的学生优秀。
上述两份报告一致的预测结果未能成为现实,显示出双方在如何管理学校、如何评价学生方面的信息不完整,其中最值得所有中国教育工作者思考的是评价问题。
考察中国教育几十年的评价实践,单一标准评价教育来源于行政权力对教育的全面管控和包办,包办的范围不只是学校的管理、教学,还包括怎么评价学生、教师和学校。
虽然早就“提出健康第一,学习第二的方针”[142],1954—1955学年也在高中三年级建立学生健康记录卡片制度[143],但因缺少刚性的考核评价,导致中国学生体质下滑的状况长期延续。2000年后,连续多次的学生体质调查表明,中国学生体质呈现总体下降趋势。在品德方面的思想政治教育几乎每年都发文件,提改进措施,学生毕业后成为社会成员,整个社会品德低下的状况引发舆论广泛关注,走出国门便常因此给国人丢脸。
数十年来,中国教育质量的问题一直较多,然而由于多年来中国对教育质量的标准一直没有明晰,较长时期里以政治标准作为教育质量的标准,反复发文件要求加强学生的政治思想教育,即便涉及其他方面,也只是以比较笼统的“红”与“专”和“三好”替代了对学生的科学评价。1979年2月12日,教育部部长蒋南翔回答记者提问时说:“当前学校将着重点转移,就是不学习的要转到学习上来;不注意锻炼身体的要注意锻炼身体;要建立正常的教学秩序。现在还是要三好。”[144]1985年后,教育评价的标准趋于单一,考试成为事实上的唯一手段;考分成为事实上唯一的依据,升学率成为衡量教育质量的压倒一切的标准,教育评价的实践越来越被高考指挥棒左右,其间虽然也采取过高中会考、督导、评估、检查等一些措施,依然没有哪一项能够比升学更强,由此引发教育质量问题较多。
梳理60多年来政府所发的有关教育质量的文件,一方面,政府不断发文解释教育质量,并要求学校按照文件要求的教育质量去办学校;另一方面,由于教育现实的多样性,政府所发文件对教育现实的解释力十分有限。几乎每次发文都不忘强调“加强党对教育工作的领导”,导致专业的教育评价标准难以形成和发挥作用,不断强调的“德智体全面发展”逐渐演变为具有最高解释权的单一标准。
行政管控下的教育评价,由于行政权力的单一性决定了教育评价的单一性。行政当事人为了方便自己的管控,自然会选择单一标准,他们对单一标准有着比任何教育当事人更大的需求。由此衍生到教育实践中就成为学校管理中以官为本,教学中以教为本,评价中以分为本,最终的逻辑是所有教育当事人接受一个共同控制者的管控,这个控制者试图控制所有人,便以一系列的“标准答案”作为对学生成长发展的控制器,迎合出题人意图便能得高分,获得好处,进好学校;否则就会失去机会,造成不少学生在十余年的考试训练中形成趋利性、被动型人格,通过考试的不少学生成为高分低能的精致利己主义者,大大降低了其人本值。
专业评价者也在一定程度上需要相对统一的标准,从比奈西蒙智力量表到现在的各种测量工具都会有相对一致的标准。与行政控制的单一评价不同的是,所有的专业标准不能强加于被评价者,只有当被评价者或需要使用评价结果的某一方认可这个评价方案后才能使用它,不同的专业评价者会设计出各不相同的专业评价标准和方案,总体上构成的是多样性、包容性的评价生态。
同样,个体也在一定程度上需要相对一致的标准,因为每个个体需要将自己与他人进行比较。但个体对这种标准的需求也不是绝对的,甚至可以用不同的标准替代。相对而言,个体更需要多个标准,并从中选择一个比较适合于自己的对自己进行切近的评价,而不愿接受唯一的一个标准对自己强制的评价。
从整个人群的角度看,用一个标准评价所有人的结果是所有的人都不是人才,都难以成才。现实中用单一的标准评价人,培养出的人往往是一种被动人格型的人。这种人往往是老师叫他干什么,他马上就去干了;家长叫他干什么,他也很快去干了。当老师和家长不叫他干什么的时候,他就无所事事,不知道该干什么。这样的人已经很多,已造成国家人力资源巨大的浪费,花费不少却培养了一些虚脱无力、没有精神、没有活力的人。久而久之,这些人进到社会当中就会形成社会的问题。
以当下中国认可程度最高的考试分数而言,考分较低的被淘汰,被这种评价认为不是人才,失去了进一步接受更高一级教育的机会,伤害了他们的自信心和自尊心,从而影响他们成才。那些考了高分的人又如何呢?从内在角度看,他们可能为了考高分而完全抛弃自己的天性,他们获得高分相对于他的成长发展而言是背离自己天性的一次挫折,其中有些人或因此完全失去成才的可能性;从外在方面看,每次的高分都是一个临时性的过程,他需要面对的挑战还很多,即便常考高分,偶尔考不了高分的人,将会受到比那些并不在意高分的人更大的挫折,这往往是导致他走上难以成才的道路的起点。历年高考中各省的考分第一名的人后来的人生轨迹和表现在一定程度上印证了上述分析。
用一个标准评价还导致学生普遍把高考错当成功的终点,似乎高考赢了就赢了终生,在许多学校中一切为了高考,特别在高中,学生作为“人”的存在已经被生冷的分数淹没,进大学之时就是不学习之日,这种考试使学生变成一个个“学累了”的人。教师在“分数至上”的价值取向下也很无辜,他们也很累,很麻木。麻木久了教师的眼中就只有分数,只关注学生考多少分,只关注分数高的学生。老师的精力也的确无法顾及分数低的学生。社会用高考成绩评价学校,校长就只有用成绩评价老师,最终引导着老师成了“教书匠”,成了“分数加工厂”里的“工匠”。
正因为此,教育专业人士的基本共识是:用单一的标准衡量多样性的人才,大家都不是人才;以单一标准培养的标准件式的人才又满足不了社会对人才的多样性需求。用一个标准评价所有的人则几乎所有的人都不能成才。由上述分析也可以看出,教育当事者个人、专业评价者都不是单一标准的必然需求者,而相对外行的非专业管理者为了满足管控和方便管控的需要,才是单一评价标准的坚守者。改变这一状况,唯有将管理与专业评价彻底分离,才有可能寻求并建立相对专业、多元、符合人的天性的教育评价。
(二)何为评价之本
对学生的评价不同人会有不同的观点,这才是常态。而当一个人试图要求另一个人接受自己对学生的评价观时,或者要求全国使用同一个标准评价学生时,不能不追问的是这种评价观的依据是什么?
中国学校普遍重视学生的学业成绩,并“认为成绩的提高,是可以通过努力达到,而不只是先天能力的反映。又认为成绩的提高,不只是个人的目标,而且是全班的一个集体目标”[145]。1959年5月17日,中共中央在印发关于教育工作的十个文件中道,对于学生,要号召他们不但做到身体好、工作好,而且还要学习好。[146]
1962年11月20日,教育部发出通知,试行《教育部直属高等学校学生成绩考核暂行规程(草案)》,废止1955年颁发的规程。新《规程》规定对学生学业成绩的考核,主要采取考试、考查的办法。评定考试的成绩,一般采用“优秀”“良好”“及格”“不及格”四级记分;少数有特殊需要的课程,也可采用“百分制”记分。对学生的政治觉悟、思想意识、道德品质的考察,主要采取做鉴定的办法。[147]这些评价基本是以知识获取加政治思想为取向的评价。
查阅1950年后中国大陆出版的各种教育学教科书,其中所阐述的衡量和评价教育实施效果的根本依据和标准有:党的教育方针、教育目的、教育任务、教育原则、教育规律、教学大纲。很有意思的是这些高大上的概念里几乎都没有提到人。
中国实行改革开放政策后,建构主义以及其他思潮涌入。由于建构主义主张创建一种开放的、积极互动的学习文化,每个学习者不应该等待知识的传递,而应基于自己与世界相互作用的独特经验去建构自己的知识并赋予经验以意义。在评价上倡导目标自由的评价;以真实任务为标准的评价,努力使教育更加关注真实任务的解决;以知识的建构为标准,以鼓励学习者积极参与知识的建构;以经验的建构为标准的评价,更重视对知识建构过程而不是结果的评价,并同时注意有效评价与教学的整合;情境驱动的评价,评价的标准应源于丰富而复杂的情境;依靠学习背景的评价,设计者和评价者必须考虑学习发生的背景;评价标准多元化,形态多样化等。这些具体的评价技术的各环节都在一定程度上考虑到人。
多元智能学说更进一步关注人,在教育评价上强调内容是多元化的,既关注儿童在各学习领域知识技能的获得,也关注儿童的学习兴趣、情感体验、沟通能力的发展;既了解某个儿童一段时间内身体、社会、语言等方面发展的情况,或他的兴趣、个性特点、学习方式、发展优势等,也了解全体或某一群体的儿童在某一领域或某一个具体活动中的发展情况;不仅关注儿童目前的发展情况,同时也注重分析过去,预期未来,注重发现和发展儿童多方面的潜能,了解儿童发展中的需求。对儿童具体的评价内容可根据评价的目的、教育工作的需要进行选择。不论使用哪种内容的划分方式,评价者在进行幼儿发展评价时都要有正确的评价价值取向,要采用动态评价的方式,教师在与儿童互动的过程中持续地观察和评估他们的发展潜能,调整教学策略,调整环境和材料的适宜性,并给予适宜的支持,引导儿童发展。
上述不同评价的根本差别在于教育评价以什么为本,中国长期采用的是以政府为本,尽管改革开放以后各种思潮涌入,但中国的评价制度没有改变;尽管一些学校开展了生本教育,并尝试进行生本评价,但是这种评价缺乏制度和体制支撑。由于评价体系的缺失,学生和教育改革实践者对生本课堂操作感到迷茫,局部的改革最终依然回到期末考、学年考、高考,校方对教师的考评主要以阶段测、期末考、学年考等成绩为依据,并将教师奖金与学生的成绩挂钩,整体上无法摆脱考试为上的路子。
当教育评价以政府为本,或者以考试分数为本,必然会出现控制性、压制性、外在性的评价,学生学习的兴趣、内驱动力就可能方向不对或难以发挥,生本教学等一些试图进行的教学方法和教学模式上的变革最终必然撞上管理、评价机制的南墙。
由此产生的一个需要回答的理论问题是,究竟什么才是教育评价的根本依据,教育与评价的根是人性假定,怎么评价人和他的学业都必然与人性假定直接相关。现有考试评价制度将人假定为定型的工具而非多样变化的主体,将以人为本作为评价的基础,就需要重新界定人性,把人的天性作为评价体系设置的根本,重新调整政府与民众的关系。现行带有强烈国家主义教育观的高考招生和评价体制的价值基础是儒家的“修齐治平”理论,与以人为本、科学的教育发展观、培养创新与实践能力都存在直接冲突,它的基本假定是培养工具,而非有个性、有思想的人;它奉行的是做人上人的观念,通过考试筛选出做人上人的人选,与人人平等的观念直接冲突。而人人平等是以人为本的教育评价制度所应奉行的价值基础。
以人为本的学生成长发展评价的终极依据是人的天性,依据人的天性对人进行评价而不应依据行政当权者的主观臆断评价学生,这样才能适合促进人的成长发展目标,才能将考试招生改革与学生发展合而为一,也才能有利于建成富强、民主、文明、和谐的现代化国家。
以人为本的学生评价需要改变现有人性假定,从现有高考招生体制的基本假定是培养工具,而非有个性、有思想的人转向培养未来世界未知环境中的未成人。
转变了人性假定,教育需要顺应人的天性,并将人的天性作为教育评价的终极依据,这就必须了解人性,了解不同人之间的差异,了解人类的发展经历和未来方向与趋势,了解个体的终身发展过程,这样才能丰富评价思想,改变长期以来教育评价领域的考试崇拜状态,让思想润滑评价改进的每个艰难环节,然后才能设计多样的评价标准,多样的评价方法,从技术层面解决人本评价问题。
(三)符合人天性的多元自主评价才会人才辈出
每一个人都是与众不同的,与别人不一样的。只有把每个人的最大优势发挥出来,才能够最大限度发挥对社会的作用;社会的发展也需要多样性的人才,这两个方面就跟锅和锅盖一样,虽然各不相同,但终能互相吻合。人本教育就是让每个人走上自己的教育之路,而不是所有的人自觉地、被动地接受一个统一模式的教育。
所谓建立多元自主的评价,多元就是多个标准,人的天性有多少种就建多少种标准,具体的要建多少标准当然是有限的,美国用“性向测试”解决这个问题。性向测试就是测试你未来可能在哪个方向发展具有优势,你的天性会向哪个方向发展。自主就是在多样的标准当中,每一个人依据自己的优势潜能和天性去选择一个适合自己的标准。
从单一的评价转向多元自主的评价是人才充分发展的要求。因为人经过千百万年进化过程本身是各自不同的,对人的评价也应该是各自不同的;在有了多元的标准基础上每个人要依据自己的潜能和志向去选择符合他的标准加以评价。这个评价,不只是外部对某个人的评价,也应该是自己对自己的评价,自己选择外在的标准去评价。
用一个标准评价所有人则天下无人才,并不是简单回到多个标准就会有很多人才。首先需要追问的还是多个标准是如何来的,如果多个标准还是来自行政人员或非专业的安排,类似于曾经实行的政府包办的行政指派工作,乱点鸳鸯谱地要张三去从事工业,李四去从事经贸,依然是违背人才成长发展规律的。
科学的人才评价标准本身并不来自主观臆断,而是来自对人的天性的深刻了解和大面积调查统计,然后再根据统计结果做符合学理和人性的分类。比如,多元智能可以作为一种评价的理论依据,相关的理论依据还会很多。当然,这种调查范围除了个体先天的生理和遗传基因,还需要考虑在多样化的社会中,不同学生个体在不同区域、不同家庭环境、不同文化传统中所形成的独特性,既包括客观的个人需求,也包括带有主观性的价值观、志向、使命感等。教育工作者在教育实践中需要尊重学生的差异性,不能用整齐划一的标准衡量学生的成功或失败,而是要帮助学生去发现自己的天性,让学生主动地以真正对自己负责的态度来发展自己,包括学生自己在内的相关当事人要用一种开放和欣赏的眼光来看待每一个学生,焕发每一个普通学生身上具有的积极力量。
在对人性深刻认识基础上确定的多元评价标准才是保障评价建立在符合人的天性上的前提。保障在评价实践中的评价符合某个个体的天性,就必须保障在评价过程中给予被评价者自主选择的机会。也就是被评价者依据自己对自己优势潜能的认识、体验和判断,依据自己确定的志向选择适合自己的评价标准接受评价。由于是否符合某个具体个体的天性最终须由每个人自己做判定,所以保障自主选择是极为重要的环节。当然在自主选择过程中,教师、父母、朋友和专业人士都可提供参考意见,但最终的决定权在每个人自己手里。
在选择的实践中,当难以准确确定自己的优势潜能和志向时,可以选择若干个评价标准对自己进行评价,在不断试误中逐渐了解自己。每个人在人生的多次选择过程中,需要不断反思自己,不断用实践证实自己,把评价的主动权掌握在自己的手中,把每次外在的评价作为一次证实的机会。
有了符合人的天性的多元的评价标准,并不是任何人都可以去做评价工作,而是需要通过专业评价工作团队依据专业的规则和程序去做评价工作。中国考试的历史很长,对人进行科学评价的历史却不长,专业性不强,过于依赖同一标准的考试,强调选拔功能,忽视诊断、改进、激励功能;简单将各门课不等值的分数相加得到一个总分,从而忽视了专业性的个性差异的区分,抑制了个性潜能的发展;过于把一次考试结果作为超越其权重的依据,形成一考定终身,忽视人在某一段时间内的初始状态、发展过程和未来走向。这种简单、非专业的评价事实上是人才成长发展的主要障碍。
多元自主评价的多元除了指多样化的标准,还包括多元的评价主体。现有评价过于单一的根源是主体只有一个,这样就不可能有一个系统的多样性的评价体系,导致教育很难改进,要通过主体多样逐渐建立一个多样性的评价体系。没有主体的多样,评价的多样实际上是一个空中楼阁,最终不可能实现。参与评价活动的主体除了教师还可以包括专业的评价机构、教育决策机构、学校管理人员、学生家长、学生群体和个体以及学校以外的其他有关人员,充分发挥不同评价主体的作用,将会使评价结果更为客观、全面,激发学生的学习积极性。多元主体的评价方式主要包括自我评价和他人评价。自我评价是学习者按照一定的评价目的与标准,对自己的学习状况进行价值判断,以便自我反省,充分调动学生学习积极性。他评是指学习者以外的人所进行的评价,他评又包括校内的专业评价、同行专业评价、独立第三方专业评价,他人评价可以更加客观,可信度较高,更具有权威性。只有社会中有较多的第三方专业评价机构,才能在选择竞争中提高评价质量。
主体多元的发展性评价以多维视角关注学生的行为表现,更有利于人才成长,在实施过程中多主体评价设计是极为专业的,需要真诚地做,避免形式化和信息失真。不同主体使用的标准不一,需要明确、具体、易于操作的评价标准和评价方法;评价标准和评价方法等评价量规应符合学情,力求简化、实用,以便为自评、互评、老师评、家长评提供可操作的依据,便于评价主体对照标准和方法开展评价活动,更有益于学生对照评价标准有目的地开展学习活动,避免评价活动被架空。不同评价主体的方法和内容应有所不同,不能不分青红皂白地让学生、伙伴、老师、家长等统统“上阵”,把应该让学生评价的内容设计成教师评价,把不适合于家长评的或家长不甚了解的评价项目让家长表态,这样也是评价主体多元、评价结果全面,但由于违背了专业性,评价操作牵强、脱离实际,使评价结果失去效度、信度,使评价的调控、激励、反思、反馈、诊断等效能不能有效地发挥出来。
多主体评价中各主体评价的功能各不相同,并非所有内容都需要实行多主体评价,可根据实际情况进行选择使用,相互交错。比如在学生之间的小组互评活动中,应尊重学生的个性化体验和感受,给每个学生以民主参与、交往合作的弹性空间。虽然这种评价的客观性不高,却能使学生在真心参与中获取真实的评价体验,这种评价有助于自主成长。
独立第三方专业评价也需要在有较高专业性的基础上简化测试过程,细化分析解释。相对于旧有的考试,独立第三方评价所带来的改变有:一是要强调注重全面客观地收集信息,根据数据和事实进行分析判断,将评价建立在大量数据支撑和科学分析的基础上,改变过去主要依靠经验进行评价的做法。二是强调注重考查学生进步的程度和学校努力的程度,注重增值评价,改变过去单纯强调结果而忽视起点、不关注发展变化过程的做法。三是强调注重促进学校建立质量内控机制,从起点环节开始全程控制质量,改变过于依赖外部评价而忽视自我诊断。
要打破对分数的迷信才能更接近人的天性。分数是一个参考,但不是唯一的依据。一个基本原理是:只有评价权力进一步分散,才有可能打破分数的垄断,对分数的迷信。统一地考试,统一地算分数,由各省举办的考试改为全国统考实际上是评价权力的进一步集中。相对于没有客观依据的推荐,看分数是进步;相对于全面的专业评价,仅看分数是肤浅、粗放、落后的。由官方的考试变为独立的第三方的专业测试,实际上是要调整政府与民众之间的利益关系,要更加尊重学生,更加尊重学校,实际上在一定程度上就是政府要放权。这个独立的第三方的权力是有限的,而不是无限的;是能够被有效监督的,也就是难以造假的。政府要从评价的主角当中退出来,让学生、学校与专业评价组织成为真正的主角。
让每个人自己的优势潜能充分发挥、充分发展,这样才能够建立人力资源大国、人力资源强国。这样的体系靠一个机构行不行呢?靠政府垄断行不行呢?政府包办行不行呢?肯定不行。靠计划模式行不行呢?肯定不行。教育评价最终要靠专业团队体系,要靠多方协商,要多方面协调,多元是一个社会教育评价最基本的准则。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。