有时,一个全州范围的高风险测验在不同种族中的测验结果是截然不同的。例如,在同一测验中,非洲裔美国学生或者西班牙裔学生的测验表现可能不如非西班牙裔的白人学生。这种差异影响(disparate impact)是不是意味着该测验是有偏差的呢?并不一定。但是,如果一项测验在属于某一特定种族、性别或宗教亚群体成员的身上,出现了与其他亚群体不同的结果,那就有必要进一步检查一下这个测验是否存在偏差。但需要注意的是,差异影响不等于评价中存在的偏差。
下面我讲一段自己的亲身经历。这件事发生在20世纪70年代末,它正好切合本主题,因此我终生难忘。当时我在南方的一个州政府工作,帮助那里的州政府官员编制一系列全州范围的测验,那些不能通过这些测验的十二年级学生不能获得毕业证书。我们先拿所有可能用到的题目对州内数千名学生进行预测,并从全州范围内选取了25名教师(大约有一半教师是非洲裔美国人)组成一个委员会,对预测的结果进行审查。委员会的功能在于判断应该丢弃哪些题目。其中,在许多测验题目上,非洲裔学生在全州范围内的预测中的成绩明显不如其他学生。但是,每一次有人以“差异影响”的理由将这些题目删掉时,那些非洲裔美国教师总是说:“我们的儿童需要知道这些测验题目说的是什么,它所涉及的内容非常重要,您不能轻易去掉这些题目!”
那些非洲裔美国教师毫不含糊地说:尽管目前存在差异性影响,但这些非洲裔儿童像其他儿童一样,应该知道这些测验题目要测量什么。这些教师想要弄清,是否非洲裔美国孩子真的就不能做好那些题目。现在测验中的这些题目使我们发现了孩子的不足,因此就可以予以补偿和调整。他们相信,将来这种差异影响会被消除。
如果某一评价程序对某一特殊群体的学生造成了差异性影响,那么必须辨别该评价程序是否存在偏差。但是,如果该评价程序并没有对任何亚群体学生造成冒犯或不公平的惩罚,那么对差异影响唯一可能的解释就是:先前不充分的教学造成了学生成绩的低下。换句话说,测验本身没有什么问题,而是那些得分较低的学生先前接受的教育存在质量问题。
众所周知,真正意义上的教育平等是很难实现的,因此某些测验仍然会在同一亚群体中出现不同的结果,这不足为奇。但这并不代表该测验就是有偏差的,也许它能帮我们鉴别以往教育中存在的不公平现象,并进一步改进这些问题。
不合适的测验内容或评价程序会歪曲学生的测验成绩,而这种歪曲又会降低教育者基于测验分数对学生水平的推论的效度,进而导致不良的教育决策。下面我们将探讨两种能够消除,至少是能够明显地减少评价程序中可能歪曲学生成绩的不适当内容的两种策略。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。