首页 理论教育 凸显测评系统的共同特征

凸显测评系统的共同特征

时间:2023-03-29 理论教育 版权反馈
【摘要】:后两个特征主要考虑大规模测评与学校内部测试的整合,不是本书的研究范围。虽然出发点不同,但是在目标及分析框架设计、试题呈现、结果呈现及解释上,无论是TIMSS数学测评系统,还是PISA数学测评系统,三要素均各司其职,却又相互密切联系、首尾衔接。TIMSS数学测评相比于PISA数学测评,更加关注各国数学课程的教学实际。
凸显测评系统的共同特征_国际视野下大规模数学测评研究

我们注意到,在整个测评系统的维度表现及维度之间的联系上,有着一些共同的特点。为便于归纳,这里沿用NRC提出的理想测评系统的五大特征,分别是综合性、一致性、连续性、可整合性、包含高质量的测评。后两个特征主要考虑大规模测评与学校内部测试的整合,不是本书的研究范围。前三个特征的具体内容如下。[26]

特征一:综合性。一个具有综合性特征的测评系统,意味着测量方法或工具的广泛使用,目的是为良好设计的测评系统提供一个可靠、有效的结果,便于对教学结果、学生学习获得甚至教育政策的制定提供一系列证据支撑。

特征二:一致性。一个具有内在一致性的测评系统,相关概念性基础或者学习模型在不同测评阶段上是相互兼容的。在系统中,不同测试的内容、过程和技能也是兼容的。对于系统内在一致性的要求,体现在标准、课程、教学、专业发展需求的一致性上,有助于学习目标的共同形成。

特征三:连续性。作为一个完备的测评系统,它的连续性体现在,在时间纵轴上,测评能在不同时期或时间段测量学生,体现出不同群体的变化趋势。

我们尝试在上述系统特征上对TIMSS数学测评和PISA数学测评进行进一步的分析比较,在对测评系统三个维度分别进行比较的同时,进一步显现出三个维度内在的联系性和系统的整体性。

首先是综合性。对TIMSS数学测评来说,有以下特点。 (1)以年级作为学生抽样的基本单位,采用矩阵抽样方法,解决抽样学生样本和试题样本数的问题;(2)利用IRT测量模型及技术,如三参数或分步计分模型,对不同计分试题进行参数估计,保证参数不依赖样本,即在统计意义上的不变性情况下,将试题难度和学生潜质置于同一量尺上,形成不同潜质维度上的量尺;(3)结合锚题技术,建立时间纵向上的等值,保证了多年量尺的一致性和可靠性;(4)利用量尺锚固的方法,获取基准上的学生群体及相应试题,对测评结果不同基准的学生表现进行描述。

对PISA数学测评来说,有以下特点。 (1)以年龄作为学生抽样的基本单位,采用矩阵抽样方法,首先解决样本抽样最大化和测评成本最小化之间的矛盾,获取足够的学生样本和试题样本数;(2)利用IRT测量模型及技术,对不同计分试题进行参数估计,保证参数不依赖样本,即在统计意义上的不变性情况下,将试题难度和学生潜质置于同一量尺上,形成不同潜质维度上的量尺;(3)同TIMSS数学测评一样,结合锚题技术,为多轮数学测评建立统一量尺,保证参加测评国家在时间纵轴上可以进行比较;(4)充分利用IRT模型的基本原理,建立不同的精熟度层次,并对相应的学生表现特征进行描述。应该说,在技术运用和方法使用上,PISA数学测评和TIMSS数学测评有着很强的相似性。

其次是一致性。对于测评系统而言,如前所述,TIMSS数学测评和PISA数学测评非常关注系统三个维度之间内在的衔接,三个维度相互影响、相互制约,体现了系统的内在一致性要求。

对于测评与课程、教学之间的一致性来说,有以下特点。TIMSS数学测评将数学课程作为其测评结果的主要影响因素,也作为整个测评框架设计的出发点。因此,在测评目标分析框架的设计上,特别是在测评内容上,着重体现各个参加测试国家数学课程的目的及课程内容分布。PISA数学测评关注在终身学习理念下学生应用数学分析解决实际问题的数学素养。在前三节中,我们就测评三角——认知、观察、解释三方面进行了分析。虽然出发点不同,但是在目标及分析框架设计、试题呈现、结果呈现及解释上,无论是TIMSS数学测评系统,还是PISA数学测评系统,三要素均各司其职,却又相互密切联系、首尾衔接。测评目标的不同,加上各国数学课程、教学契合度的不同,导致了测评内容等的不同。TIMSS数学测评相比于PISA数学测评,更加关注各国数学课程的教学实际。而PISA数学测评考核的知识和技能不建立在参加测试国家共同的课程内容上,而是建立在对将来生活的重要程度上。在现有课程、教学的一致性上,TIMSS数学测评体现出的水平要比PISA数学测评高。

最后是连续性。利用多轮测评积累的信息数据,两个数学测评系统不约而同地进行了时间纵向上的比较分析,这样不仅有助于国家与国家之间的比较,也有助于对参加测评国家在时间纵向上的发展及发展趋势进行分析。到2011年为止,TIMSS数学测评针对历年参加测试的各国,对整体数学成绩、不同基准的学生比例、不同内容领域的相关指标都进行了纵向分析;PISA数学测评则对数学素养、不同精熟度层次的学生比例、不同内容领域进行了纵向分析和比较。

总体而言,无论TIMSS数学测评,还是PISA数学测评,在整个测评系统中,特别是在综合性、系统内在一致性和连续性上,都表现出显著的特征。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈