心理测验是一种标准化了的测验。所谓标准化,就是指测验的工具必须按标准化的程序进行编制,并根据标准化的程序去使用,否则,就不能达到临床应用的目的和要求,甚至造成错误的评估结果,作出不当的心理干预措施。衡量一个心理测验及评定量表是否具有实际使用价值,可从以下几点进行考察。
一、常模及标准分
常模是指某一标准化样本在某一测验上的平均分数,是样本测验的某一种形式的量数,这些量数的作用,是给测验分数提供比较的标准,从而对测验分数加以解释。在大多数临床心理学评估的场合,测验原始分是没有实际应用价值的,因为它不具有可比性。一般而言,临床心理评估的目的有两方面:一是确定受试某方面心理特征在其相对应的正常人群中所处的相对位置或水平;二是比较受试本人各方面心理特征之间的差异(也是相对于正常人群而言)。要实现这两个目的,必须运用标准分来解释测验的结果。
心理测验的标准分是参照常模——即标准化样本在测验中的操作数量化的结果。因此常模是通过一个具有代表性的样本在该测验中实际地操作而建立的。标准分的形式有很多,其共同点都是基于统计学的正态分布理论衍化而来。通常有以下几种形式:
1.均数 是常模最普通的一种形式,受试者的分数高低就是与常模的均数相比较而获得的。因为受试者在测验中所得的原始分(即粗分)是无法看出其优劣的,只有与样本均数这个常模比较才有意义。
2.Z分 Z分是最基本的标准分,其他形式的标准分均是在Z分基础上转化而成。均数固然可以说明一些问题,但只看均数而不注意离散情况,这样的常模提供受试者的信息是非常有限的。Z分实际上是某一受试在测验中的操作与标准化样本平均操作水平的离散程度,它不但可以说明受试的操作水平在平均水平之上(Z分为正)还是在平均水平之下(Z分为负);也能表明他与平均水平的相差程度(以相关多少个标准差来表示)。但Z分的缺点是因为存在负分,在某些实际测验中使用起来不方便。
3.T分 T分常模是从Z分衍化而来的另一种常模,同时又是常用常模,使用非常广泛,许多心理测验如MMPI、EPQ及中国心身健康量表等都用T分来表示结果。
4.百分位 是临床心理评估中常用的一种非标准分表示结果的方法,是另一类常用常模。它比标准分更容易理解,即使没有统计学基础的人也很容易理解它的含义,许多测验特别是成就测验经常用百分位来表示受试的操作成绩。习惯上将成绩差的排列在下,成绩好的排列在上,用统计学方法计算出样本分数各百分位范围,将受试者的成绩与此常模相比较。如智商百分位50,表示受试者的成绩相当于标准化样本的第50位,也就是说样本中有49%的人成绩比他高,有50%的人成绩比他低。
5.划界分 在筛选测验中常用此常模。在教育界用100分制时,通常以60分为及格分,这也是一种划界分。在神经心理学测验中,将正常人与脑病病人的测验成绩比较设立划界分,以此来划分有无脑损害。
此外还有年龄常模(按年龄分组建立的年龄量表分)、性别常模、地区常模、各种疾病诊断常模等。从可比性看,常模越特别化就越有效;而从适应性来讲,通用的常模使用较为方便。
二、信 度
信度即可靠性,是对测验分数测量误差的计算。它表现为测验结果的一贯性、一致性、再现性和稳定性。一个测验,不论是多次再测还是多人同测,其结果都应大致相同方能可信。任何测验只要它是从个人的行为样本中得到的东西,就包含着存在某些测定误差,没有一个测验是绝对可靠的,只是其误差大小之别而已。测量分数信度的高低,显示一个量表品质的优劣,一个可靠的量表必须具有较高的信度。
对各种误差进行测量一般采用相关的方法来考验,并用相关系数的大小来表示误差的大小,即量表信度的高低。信度系数在-1~+1之间,绝对值越大(接近1.0),表明误差越小,可信度越高;反之,绝对值越小(接近0),表明误差越大,可信度越低。能力测验可信度相对较高,信度系数一般要求在0.80以上,人格测验的可信度则相对较低,信度系数常在0.70以上。
测验信度系数一般有以下几种方法。
(一)重测信度(test-retest reliability)
即同一种测验,在第1次施测之后间隔一段时间再对同一组对象进行重测,求得2次测验成绩的相关系数,以检验测验工具的稳定性。是检验量表测量的稳定性的一种指标。如果2次分数的相关系数较高,说明这一量表2次测量结果的一致性较高,量表的稳定性、可靠性也较高。
(二)分半信度(split-half reliability)
是检验量表内部一致性和稳定性的一种指标。这种方法是把某一量表的项目按编号的奇、偶数分成两组,然后对所测对象的奇、偶两组项目获得的分数作相关分析。如果两组项目分数的相关系数较高,说明这一量表的内部一致性较高,也表明它的内部稳定性和可靠性较强。
(三)等值信度(equivalent reliability)
也称平行信度(parallel reliability),是检验量表信度的又一种重要指标。这种方法有两种方式:第1种方式是编制测验时,同时编制为了同一测验目的、性质、分量、难度均相等的2个量表(即复本),用这2个量表测量同一组对象,然后分析两个量表测得分数的相关系数,有时也称之为复本相关法;第2种方式是2个或几个心理检测者用同一量表同时测查一个对象,然后分别独立评分,最后统计分析各检测者之间评分的一致性和相关性。第2种方式一般用于一些他评量表或评分标准难以掌握的量表,主要是检验测验者评分的可信度,常用于培训心理测验人员。
三、效度(validity)
所谓效度是指测验结果的有效性、真实性或准确性。它是心理量表能否确实测到其所要测的那种心理的特征、状态或障碍及其功能方面的指标。对于量表来说,效度是检测量表品质优劣更为重要的指标。
检验效度的方法很多,由美国心理学会等三个单位联合颁布的《教育心理测验的标准》将效度测量分为3类。
(一)内容效度(content validity)
是指测验的内容是否涵盖了有代表性样本的行为范围,即被测量个体对量表项目所作的反应能否代表预想测量的心理特征。它主要用于设计测验条目时,一般采用分析推理的方法挑选合适的条目。内容效度的分析,目前尚难以采用统计学方法,主要是靠专业知识和实际经验对量表的项目和结构作深入、系统、全面、严格的检查。内容效度分析一般从3个方面来考虑:①量表项目是否真正属于测量的领域;②量表包含的项目是否能覆盖测量领域所有方面;③量表项目的比例是否符合测量领域的结构分布。
(二)效标关联效度(criterion-related validity)
是指量表的测量结果与其他测量结果相关的程度,即用来检验所编制量表是否能有效预测受试在特定活动中的操作情况。效标关联效度可分为现时效度(concurrent validity)和预测效度(predictive validity),两者的差异在于测验的对象不同,现时效度用于对目前所处状态的诊断,如“××患有精神分裂症吗?”而预测效度用于对未来的状态进行评估,如“××将来会患精神分裂症吗?”计算效标关联效度首先要选择效标,可以另一个被公认有效的相同功能的量表作为效标量表,将2个量表测量的结果作相关分析;学业成绩常用来作为智力测验的效标;有经验精神科医生的诊断和评定可作为个性问卷或精神科症状评定量表的效标。
(三)结构效度(construct validity)
是指所编制的测验是否达到了设计目的,即一个量表的测验结果能够证明理论假设的结构或特质的程度。如心理学的理论假设,智力主要有语词理解、数学运算、逻辑推理、空间知觉、记忆能力等因素(或特质)所构成,那么根据这个理论假设构想的智力量表,能否测到这些智力的因素,能测到什么程度,这就要对该智力量表作结构效度的分析。结构效度的分析比较复杂,方法也很繁杂,目前可采用的统计学方法主要是相关分析和因素分析。为了较全面地评价测验的结构效度,D.T.Campbell曾建议,在研究结构关联效度时,不仅应将新测验与同类测验的结果进行相关分析,也要与功能不同的测验进行比较,前者称为趋同效度(convergent validity),后者称为鉴别效度(discriminate validity)。
(四)增强效度(incremental validity)
前面所提到的内容效度、效标效度和结构效度是评估心理测验有效性最常用的3种方法。在临床应用测验时,我们还应注意测验的增强效度。增强效度是指某些测验与其他测验或检查方法联合应用时,其准确性大大提高。如研究发现将精神病人的临床资料和病史与MMPI结果结合考虑时,能提高判断的准确性,这就说明MMPI在这种场合有较好的增强效度。
四、标准化测验
心理测验可分为标准化和非标准化测验,在临床心理学实践中,标准化测验的使用范围更加广泛,非标准化测验多用在科研以及部分有经验的心理治疗与咨询工作者的临床实践中。标准化是指测验的编制、实施、计分以及测验结果解释的程序的一致性。为了使不同的被试所获得的分数具有可比性,测验的条件对所有的被试都应该是同样的。这样,在同样情境下的测验中,通常唯一的自变量是正在受测定的个体的能力或人格特征。当然,完全相同的情景是不可能实现的,在实际的操作中要尽可能做到测试条件、环境的一致性。
标准化心理测验应具备以下特征。
(一)实施和计分方法的标准化
标准化心理测验首先应运用标准化的材料,测题的印刷和成批生产的器具要保证物理性能上的一致。同时其手册中应包含一套详细的实施程序,向使用者清楚地介绍指导语、实施步骤、时限(如需要)、起止点、提问的变通方式、如何处理测验时出现的问题和注意事项等。还应规定统一清晰的计分原则和标准,以及加减分的原则与标准,以保证将来主试评分的一致性。最后还要包括原始分转换标准分的方法和一套方便实用的转换表,有的标准化测验为了使用者分析解释结果时方便,甚至还附加了许多有用的统计表。
(二)常模样本的标准化
常模作为供心理测验结果进行比较的量度,其标准化程度是很重要的。标准化的测验要求常模样本要具有很好的代表性,能充分反映测验所测量范围内人群的构成情况,对于明显影响所测量的心理特质的各种人口学变量均要进行适当的处理。例如,不同年龄的人群其能力发展水平不同,个性特征也存在明显差异,因此能力和个性测验在标准化过程中一般都会按年龄范畴分设年龄常模;又如受教育情况、职业背景等因素与智力有明显的关系,因此在构成智力测验的常模样本时必须使其能代表这些因素在自然人群中的分布情况。标准化的心理测验均有常模,但有常模的心理测验并不一定都是标准化测验。
(三)测量学分析资料
测量学资料主要包括测验的信度和效度,是标准化心理测验不可缺少的技术参数。测验使用者通过研究这些资料可以了解该测验的可靠性和有效性的程度与范围,又可以借助这些资料来分析测验的结果,以便对受试的操作水平作出准确和恰如其分的判断。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。