首页 理论教育 对可靠推论的追求

对可靠推论的追求

时间:2023-02-27 理论教育 版权反馈
【摘要】:教师会根据评价的结果为学生作决策,而合理的教育决策依赖于教育评价的准确性。塞丽娜决定,既要根据个人的表现情况给出个人表现分,又要根据小组的表现给小组打分。塞丽娜的同事们对她的合作小组非常感兴趣。思考再三,塞丽娜认为弗雷德老师最担心的是对学生的成就水平所作结论的效度情况。测验基础上的推论有可能是有效的,也有可能是无效的,而这些结论才是教师真正需要关注的。

正如在第1章所阐述的那样,我们之所以评价学生是因为我们想测定学生在教师所感兴趣的教育性相关变量上的水平层级。有一种与教师相关的变量是能够随教学而改变的,比如说学生对历史知识的掌握程度。还有一种教育性相关变量能够影响教师的教学决策,比如说学生对教师所教内容的态度。

教师对学生在某些教育变量上所处的水平了解得越多,对这些学生所作的决策就越高明。举例来说,如果教师知道莱西(Lee Lacey)在阅读方面存在一定的困难,而且对阅读抱一种消极态度,那么该教师就不会让她参加一个以自主阅读为基础的研究项目。同样,如果通过学期初的测验,一位数学教师发现学生们已有的数学知识大大超过自己的估计,那么该教师会在教学计划中加进一些更深奥的知识点。教师会根据评价的结果为学生作决策,而合理的教育决策依赖于教育评价的准确性。显然,准确的教育评价会提高决策的质量,而不准确的评价则会导致相反的结果。这就是我们要研究效度的原因所在。

通常,教师需要了解学生对课程目标的掌握情况。例如,预测学生需要学习的技能及知识内容。课程目标同样与内容标准相关。举例来说,假设我们设定了评价学生理解其阅读内容水平的标准,很显然要考查学生对各种阅读材料的理解能力是不现实的,因为要读的材料实在是太多了。虽然如此,教师往往期望了解学生处理课程目标所包含的全部相关阅读任务程度的情况。因为我们难以获得学生在完成课程目标要求学生掌握的所有技能、知识时的表现,所以我们不得不采用抽样的方法。因此,当我们评价学生时,我们尝试对学生掌握课程目标的情况进行典型性抽样,基于学生在抽样中的表现,我们可以推断学生在掌握整个课程目标时的情况。图3.1描述了这两者之间的关系。在图3.1中,左边的椭圆代表课程目标。为了便于解释,左边的椭圆代表学生阅读的课程目标,该目标主要是指学生理解书面文章核心思想的能力。图3.1中右边的椭圆代表教育测验(在本例子中指的是由10道简答题构成的测验),可以用它来对学生的能力水平进行评价推论。如果您乐意您也可以把基于测验的推论看成是对测验结果的解释。这一推论关注学生在整个课程目标(左边的椭圆)中所处的水平。如果这一推论是准确的,那么根据推论而作的教育决策也就会更准确,因为这些决策是在正确估计学生实际水平的基础上制定的。

图3.1 根据学生在教育测验中的表现对学生在课程目标中所处水平进行推断的图示

塞西莉亚·塞丽娜(Cecilia Celina)是一名初中英语教师,最近她在班里组织了一些5人组成的合作小组。塞丽娜决定,既要根据个人的表现情况给出个人表现分,又要根据小组的表现给小组打分。她还规定,在每个学生的最终成绩中,学生个体的表现占60%,小组集体的表现占40%。对于参加笔试和口试的学生,她都采取了这种比例的计分方式。

塞丽娜的同事们对她的合作小组非常感兴趣。她们也在考虑是否可以把这种计分方法用于自己的班级中。然而一位叫弗雷德·弗瑞(Fred Florie)的教师对她的这种6—4开的计分法有不同的观点。他认为,由于加入了40%的小组表现分,这使得最终成绩无法有效地表明个人的成就水平。塞丽娜回答说,这种组合式计分法是合作学习的关键特征之一,只有让小组表现在总成绩中占据较大的比重,才能够激励组内的同学互帮互助。例如,她发现班里的多数小组里都有学生非常积极地帮助别人准备一些重要的考试。

思考再三,塞丽娜认为弗雷德老师最担心的是对学生的成就水平所作结论的效度情况。不过,她觉得评价学生的成就水平与给学生打分是两回事。

塞丽娜发现自己面临三种选择:①沿用原来的计分方法;②从个体成绩中剔除小组表现分;③调整60%~40%的计分方法。

➡ 如果您是塞丽娜,您会作出怎么样的决定呢?

评价者所处理的效度指的是以分数为基础的推论的效度,测验本身并不具有效度,它只是教育者用来推断学生的水平的一种工具。如果高分数导致一类推论结果,那么低分数将导致与之相反的推论结果。此外,由于效度和学生在课程目标方面所处水平所作推断的精确程度有紧密关系,所以从技术上讲,“测验的效度”这一说法也是不准确的。一份设计精良的测验,如果找错了施测对象,或者施测情景不合适,都有可能导致荒谬的、完全无效的推论。测验基础上的推论有可能是有效的,也有可能是无效的,而这些结论才是教师真正需要关注的。

然而,在现实生活中您会发现有相当多的教育者在提“测验的效度”。也许他们心里明白效度指的是依据测验分数所作的推论的效度,只不过用一种简单的称呼代替罢了。不过,以我的经验来看,这些教育者并不懂得效度是指依据测验分数所作推论的效度且不是指测验本身。

就效度而言,现在您应该知晓效度的实质了吧。如果您再听到大学生说“测验的效度”时,恐怕您得考虑一下是否该为保全他的面子而放过这个严重的测量学错误了。我的建议是,除非是事关重大的决定——这项决定会对学生产生非常重要的影响——您还是保留自己对效度的深刻见解吧。(当我第一次真正理解效度的本质时,我想与大家分享这些知识,而不是在同事面前炫耀我的见解。结果我却惹恼了他们。毕竟,没有人会喜欢一个爱耍小聪明的人。)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈