相关关系的大小(或者强弱)程度,我们称之为相关系数,一般用r表示,它的取值范围是-1<r<1。从它的取值范围我们就可以看出,相关关系有负相关、零相关和正相关三种关系。相关关系的计算方法有很多种,在实际问题中用哪种计算,要根据具体情况而定。
下面我们主要介绍两种相关关系的分析及其显著性检验方法。
相关关系显著性检验,就是检验这种关系是否显著,如果检验结果是不显著的,那么这种关系就没有意义。
相关关系显著性检验的方法是:
差异显著性检验方法:在计算出相关系数r值后,直接查出相关系数显著性临界值表即可。在没有充分理由说明一定存在相关时,一般采用双尾检验进行检验相关关系的显著性,这时临界值表要查双尾临界值。
统计检验推断方法:
若r>r0.01(df),则差异非常显著;
若r>r0.05(df),则差异显著;
若r<r0.05(df),则差异不显著;
积差相关系数是英国统计学家皮尔逊(K.Pearson)提出的一种计算相关系数的方法,所以,有时也称“皮尔逊相关”。
积差相关系数的计算公式是:
其中:rxy表明两组数据变量x,y之间的相关系数分别表示数据组x,y的平均数;n为数据组的容量;σx,σy分别是数据组x,y的标准差。
选用相关系数进行计算和分析,原始的两组数据必须符合下面的条件:
一是原始的两组数据必须是成对出现的,且每一组数据之间是相互独立的,容量>30;
二是两组数据都是连续性变化的比率数据;
三是两组数据各自所在的总体的分布形式是正态分布,或是接近正态分布,至少是单峰对称分布。
积差相关系数(r)显著性临界值表(双尾)
例 109:数学的解题能力与语文的阅读能力有关,为了验证这一假设,某校进行了实验研究,研究过程中对32名研究对象的一次测得语文阅读能力和数学解题能力的得分分别是:
问:实验结果是否验证了原来的假设?
结论:将原数据代入公式进行计算或利用计算器或计算机统计分析软件计算可得:r=0.833929,df=32-2=30,取显著性水平为0.01,查积差相关系数显著性临界值表,r的双侧临界值为:r(30)0.01=0.449。
实际计算所得r=0.833929>r(30)0.01=0.449,即p<0.01,可见,在0.01的显著性水平上语文阅读能力与数学解题能力有着高度正相关的关系,即语文阅读能力强的学生他们的数学解题能力就越强。所以验证了原来的实验假设。
例110:在2000年中考中前某校先用1999年的中考数学试题对502名考生进行了一次摸底测验,在参加今年中考后,计算得这两次数学学科成绩的相关系数为 0.512638,问:这两年中考数学成绩是否确实存在关系?或者说去年的中考对今年的中考是否有影响?
结论:因为这两次考试是相对独立的,但预先并不知道它们是否存在相关关系,所以采用双尾检验:
自由度:df=n-2=502-2=500
确定显著性水平:取显著性水平为0.01,这时的临界值为:r(500)0.01=0.115。
统计推断:
因为实得r=0.512638> r(500)0.01=0.115,所以,r=0.512638非常显著。这说明这两年中数学成绩确实存在正相关关系;或者说这两中考数学成绩相关,表明这两年的中考全市数学成绩确实相关;也可以说复习去年的中考数学试题与今年中考数学成绩有着非常密切的关系。
等级相关关系是指原始数据不是连续比率数据,而是以等级顺序的形式来表示的相关关系。等级相关有时也称之为“斯皮尔曼等级相关”(Spearman)。等级相关系数的计算不能用和善相关系数的计算公式来求。等级相关系数的计算公式是:
在这里,是等级相关系数;D是两组等级数据每对之差;N是容量。在利用等级相关法进行计算相关系数时,如果有几个相同的数据,那么就可以用几个相同数据的平均数作为它们共同的等级数。
等级相关在实际问题中的应用是非常广泛的,它对数据的要求没有和积差相关那样严格,它的条件是:原始数据是成对出现的,以等级次序表示。至于它们所在的总体是否是呈正态分布,样本容量是否大于30,这里都不作强调,都可以用等级相关进行计算。但正是由于这一点,等级相关分析的精确度比积差相关分析要稍差一些。
在一些比率数据中,前面已经讲到一般可以用积差相关系数来进行相关分析,但是,当这些数据的样本容量小物30时就不能再用积差相关来分析了,这时可以将比率数据转换成等级数据,然后用等级相关法来进行分析。
积差相关系数(r)显著性临界值表(双尾)
例111:在一项调查中,学生对11个学科的重要性与学习兴趣的排位如下:
问:学科的重要性与兴趣之间的排名是否存在着显著的相关关系?
结论:先计算出每组数据之差D为:
-3,0,-2,-3,-4,-5,-3,2,6,9,5
再计算每组差数的平方和:
∑D2=9+0+4+9+16+25+9+4+36+81+25=218
然后再计算等级相关系数:
如果确定显著性水平为0.05,查等级相关临界值表(双尾)得:
r(11)0.05=0.618
因为r R=0.0091 < r(11)0.05=0.618,P>0.05,所以学生对认为重要的学科与学习兴趣之间存在很低的正相关关系,但这种关系不显著。
其实,我们在对数据进行统计分析时,可以利用相关的数据处理软件,如利用Excel进行数据的分析检验,也可以利用SPSS进行数据的分析检验,这些软件的功能都是非常强大的。我们在这里举例分析,是因为希望通过这些例子使大家能弄清楚数据分析的使用原理和一般方法。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。