依据评价在体育教学中作用和功能的差异,可将体育学习评价分为诊断性评价、形成性评价和终结性评价。这三类评价的划分只是相对的,他们之间既有联系又有区别。
1.查阅资料诊断
新学期第一课开始前诊断性评价,可以查阅上学期或学年的学生学习评价资料,作为诊断性评价的重要依据,这些资料有助于教师了解学生已经具备的运动知识与技能、身体素质、学习态度等情况,便于新一轮体育教学的有效开展。
2.言语交流诊断
在学期教学中,课前的诊断性评价可以采用跟学生交流的方式,获取学生对已学内容的掌握情况以及对课程的情感态度、价值观等信息,便于教师调整教学设计。
3.课前复习诊断
在新授内容开始之前,可以组织学生复习已学内容,借以判断学生已具备的学习条件。
以背越式跳高为例,整套动作分为三个环节:(1)助跑;(2)起跳;(3)过杆与落地。
如果新授课内容为(3)过杆与落地,那么体育老师应首先判断学生前两个动作的学习、掌握情况。因为这三个动作是一气呵成的,所以前两个动作的学习是第三个动作的必经之路。所以体育教师应以复习的方式,了解学生对前两个动作的学习、掌握情况,根据需要做出相应的补救措施,合理分组,为动作(3)的有效学习提供必要的先行认知条件。
1.课堂即时评价
体育课堂教学中的即时评价,是指体育教师对自我教学活动和学生课堂学习活动做出的立即反应,以帮助学生调整、控制后续学习行为,其评价形式可以是言语、表情、眼神、手势评价等。
2.单元、学期文档记录评价
使用说明:
(1)本评价表是一张主要由学生操作的过程性评价表。本评价表适用于在每节课的学习过程中对学生的学习态度、情意表现和合作意识、锻炼行为的记录与评价,由各个小组长给本组同学予以每堂课的评价,体育委员给予每位组长的课堂表现进行评价,体育教师或在每组中随机抽取两位同学(组长除外)评价体育委员的课程表现。
(2)评价方法:各项内容评价总分=每节课的分值之和/总课时数。
(3)基准分是对学生在体育课中出勤状况的评价,准时参加体育课学习70分,病假或事假60分,迟到或早退40分,旷课0分。
(4)每项内容的评价标准:
①学习态度的评分标准
积极参与课堂学习活动,并认真接受教师的指导,加30分;积极参与课堂学习活动,并较认真接受教师的指导,加20分;能够参与课堂学习活动,加10分;不参与课堂学习活动,加0分。
②情意表现与合作精神的评分标准
乐于助人、敢于展示和挑战自我,克服困难、坚持不懈,能为团队的胜利积极配合同伴,加30分;能够较好地表现出帮助他人,愿意展示和自我挑战,克服困难,坚持不懈,为团队的胜利配合同伴,加20分;能够有主动帮助他人、展示和挑战自我、克服困难、团结合作的表现,加10分;没有帮助他人、展示和挑战自我、克服困难、团结合作的表现,或有消极的学习行为,加0分。
③锻炼行为的评分标准
穿适合运动的服装、鞋子,积极参与准备活动、放松活动,加30分;穿适合运动的服装、鞋子,且较积极参与准备活动、放松活动,加20分;穿适合运动的服装、鞋子,能够参与准备活动、放松活动,加10分;没有穿适合运动的服装、鞋子,且不积极参与准备活动、放松活动,加0分。
(5)上述评分标准在“标记”一栏中给予图例表示,以便于学期结束时体育教师除了获得总分值以外,还可以了解学生每堂课的具体情况:
①基本分标记:√为70分,■为60分,⊙为40分,×为0分
②各项评价内容的加分值标记:★为加30分,▲为加20分,◆为加10分,〇为加0分。
(6)由于本评价表主要由学生完成,因此并不会增加教师的工作量。
3.初中生成长档案袋评价
1.期末考试
学生体育学习成绩评价表
使用说明:
(1)本评价表由体育教师填写,是期末发给学生,用于为学生提供一份比较翔实的评价反馈信息。
(2)总分=体能×30%+运动知识与技能×40%+学习态度×10%+情意表现与合作精神×10%+锻炼行为×10%。各项评价内容的成绩都以百分制计算。
(3)等级根据总分成绩予以给出,其标准是:86~100分(优);76~85分(良);61~75分(合格),60以下(需努力)。
(4)本评价表给出的各项内容权重均为建议权重,体育老师可以根据学生的实际情况予以调整权重,其目的主要是要能有效激励学生全面发展。
2.初中毕业升学体育考试
为贯彻《中共中央国务院关于加强青少年体育增强青少年体质的意见》,根据党中央、国务院提出的“全面组织实施初中毕业升学体育考试,并逐步加大体育成绩在学生综合素质评价和中考成绩的分量”的要求,各省市都将体育列入初中毕业升学考试科目之一,领会初中毕业升学体育考试的精神,掌握组织、参与初中毕业升学体育考试的方法,是体育教师应具备的基本职业能力之一。
1.评价主体:自评、互评、师评相结合
2.评价方法:定性与定量评价方法相结合
学生体育学习的评价应注重定量与定性评价方法相结合。对于运动技能等内容的评价,用“优秀、良好、中等、差”等模糊的、科学的等级评价似乎更合理、公平。当然学生体育学习成绩评价表“中”“评语”“总分”“等级”的设置为定性评价与定量评价相结合提供了完美平台。
3.评价标准:绝对、相对和个体内差标准相结合
评价对象的个体都是鲜明且充满活力的学生。在“学生体育学习成绩评价表”中,在运动技能与体育领域就针对某位同学设置了“进步幅度成绩、进步分数”的栏目,这就可以根据学生的具体状况进行个体内差标准,通过对学生进步幅度的关注,可以激发学生的学习兴趣、信心和动机,促进学生更好地参与体育运动,而这正是体育学习评价所追求的最终目的。
初中各年级男、女生均为必测三个项目,选测三个项目,合计需要测试六个项目。
注:选测的项目由各地(市)教育行政部门在测试前随机抽取。
《国家学生体质健康标准》提供了初中各年级男、女生身高标准体重和男、女生各测试项目评分标准。具体评分标准可以查阅《国家学生体质健康标准》。
首先是对各项测试结果分别评分,得出相应评价指标的得分和等级;第二步是依据各指标权重计算总分,并划定等级。
体育教师在完成对学生的各项测试及总分评定后,应将每位学生的体质信息记入相应表格,便于跟踪观察学生体质变化情况,采取相应措施。
无论是诊断性、形成性、终结性评价,还是国际学生体质健康测试,最终都必须对体育学习评价结果的相关资料,进行及时加工、处理,并对结果进行判定,形成反馈评价结论、意见或建议,以促进体育教师完善自己的教学设计,鼓励学生改善自己的体育学习方法,以便其更好地参加体育学习,身心获得充分的发展。
知识补充:试卷质量的评价
测验是教育测量的主要工具,在编制或选用测验试题时要对它的质量进行分析,判断它是否满足良好测验的特征。一个良好的测验一般从以下几个方面进行判断。
1.信度(可靠性)
测验结果的可靠性称为测验的信度。测验的信度是指测验结果的可靠程度,即测量能否稳定反映被试的实际水平。一个好的测验,对同一批被试先后两次的结果应保持一致。
求信度的方法有折半信度法和a系数法。
(1)折半信度法是抽取若干名学生的试卷,将试题按照奇数题和偶数题分成两部分(设两部分的题型、题量、难度大致相等),分别求得奇数题得分X和偶数题得Y,由下式计算两变量相关系数:
其中:N为被试人数。
然后代入修正公式2r/(1+r)中,即可求出折半信度。
(2)a系数法要求先求出试卷总分的标准差St;再计算全体学生第i题得分的标准差Si,然后代入下列公式求出a系数:
其中:n为试卷大题的总题数。目前,a系数法是稳定性、可靠性较好的一种方法。
实际运用中,对高考、中考之类的大型考试,要求信度值在0.9以上;对一般考试要求0.8以上,而课堂测试在0.6以上就可以了。
信度是良好测验的必要条件,但不是充分条件。一个测验只具有高信度还不行,还必须具有高效度。
2.效度(有效性)
效度是一种测验能够正确地测量出它所要测量的特性或功能的程度。效度是针对特定的目的而言的,若测验真正测到了要测的东西,则该测验的效度就高;否则,该测验的效度就低。因此,效度是测验最基本的条件,是良好测验应当具备的最基本特征,也是反映测量质量高低的根本指标。
效度总是与测验目的密切相关的。根据测验目的,可以把效度分为内容效度、构想效度和效标关联效度。内容效度是指测验内容与预定要测的内容之间的一致性程度,它通常用在学业成就测验中;构想效度是指测验分数能够描述个人所具有的心理品质和能力的程度,它主要适用于心理测验;效标关联效度是指测验分数与外在参照标准(亦称效标)的相关程度,它可以分为同时效标和预测效标,前者适用于以评定现状为目的的测验,后者适用于预测测验,目的在于研究该测验预测未来成就的预测程度。
3.难度(难易性)
难度是指测验项目的难易程度。一个测验包含多个项目,不同项目之间的难度是不一样的,有的项目难度高,有的项目难度低。表示题目难度的指标称难度指数P,通常用两种方法来计算试题难度。
(1)用试题的答对率(通过率)计算难度:
其中:R为答对的人数,N为全体被试人数。它适用于答案仅有错误和正确两种可能的试题(如选择、判断、填空等)。
(2)用某题测试的平均分X与该题的满分W之比计算难度:
它对任何题型均适用,通常用于非客观题。
(3)除了上述两种方法计算难度外,还可用高分组与低分组答对率的平均数来表示难度。先将学生本次测验成绩排序,取前27%为高分组,后27%为低分组,算出高、低分组对某题的答对率分别为PH和PL,然后代入公式:
即可算出该题的难度。
一般试题的难度在0.3~0.7之间是适宜的,在0.5左右试题能将受试者的水平区分开来,在0.3左右试题偏难,0.7左右试题偏易。
难度也是良好测量的一个重要特征,测验项目的难度直接影响着测验的信度、效度与区分度。
4.区分度(鉴别性)
区分度是测验对考生实际水平的区分难度。即是说,项目得分的高低与被试水平的高低是一致的,高水平的被试在该项目上的得分应是较高的;反之亦然。如果该项目不能反映出被试水平的差异,反而提供了一些相反的信息,即高水平的被试在该项目上所得分数较低,而低水平的被试在该项目上所得分数较高,则说明该项目完全没有区分度,而低水平的被试在该项目上所得分数较高,则说明该项目完全没有区分度,且具有干扰破坏性。
某试题的得分与试卷的得分的相关性大小可以反映试题的区分度,利用公式可以计算区分度:
其中:N为学生数;X为试卷的得分,Y为某题得分。
然后用求得的相关系数r表示试题的区分度D。
一般认为0.4以上的区分度就已经很好了,而0.2以下的区分度的试题则必须改进或淘汰。
要注意的是项目的区分度与项目的难度是有关系的。测试项目要有区分度,则难度必须适中,难度较高或较低都易使项目的区分度较低。若测验的区分度较低,则影响到测验的效度。因此,区分度也是良好测量应具有的特征。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。