首页 理论教育 两个变量的相关系数怎么求

两个变量的相关系数怎么求

时间:2023-04-22 理论教育 版权反馈
【摘要】:一、简单线性相关分析相关分析是一种广泛应用的测定变量间关联性的方法,也是一种理想的相关关系的测定方法。(一)简单相关系数简单相关系数又称为皮尔逊相关系数或简单积矩相关系数,在本章第一节讲常用统计量时已经作过介绍。

一、简单线性相关分析

相关分析是一种广泛应用的测定变量间关联性的方法,也是一种理想的相关关系的测定方法。我们这里只针对最简单的相关分析进行说明。

(一)简单相关系数

简单相关系数又称为皮尔逊相关系数或简单积矩相关系数,在本章第一节讲常用统计量时已经作过介绍。它测量的是两个变量线性联系的紧密程度。

1.简单相关系数的计算

在计算简单相关系数时一般是将一个变量定义为自变量X,另一个变量定义为因变量Y,X和Y的地位是相等的、可以互换的。

相关系数的计算公式为:

img294

img295

下面用一个简单的例子来说明相关系数的计算方法。例如,为了研究电视广告的劝服力和艺术性是否有关系,研究人员让一组观众对18条电视广告的劝服力和艺术性分别进行了打分,并计算每条广告关于这两个变量的平均评分。如表3—16的前三列所示。

表3—16   18条电视广告的艺术性和劝服力相关系数的计算

img296

表3—16的后五列是相关系数的计算过程,根据上表的结果,可以得出相关系数

img297

2.相关系数的意义

在本章第一节的图3—4表现了相关系数的直观意义。具体来说,相关系数对两个变量的相关性是这样度量的:

(1)正的r值显示变量之间正相关,负的r值显示负相关,r=0.2182显示的就是广告的艺术性和劝服力之间如果相关的话就是正相关。

(2)相关系数r的值,永远在-1和+1之间。靠近0的r值,代表变量之间很弱的直线相关;当r由0向-1或+1接近时,直线相关的强度逐渐增加;r值若接近-1或+1,散点图中点的分布很接近一条直线;r值为-1或+1时,所有的点全部落在一条直线上。

(3)r是用标准分计算得到的,当改变两个变量中任何一个变量的度量单位时,相关系数并不会改变。相关系数r本身并没有度量单位。

(4)相关系数并不关心两个变量中哪个是自变量,哪个是因变量,两个变量在计算相关系数时完全是对称的。

(5)直线相关系数度量的只是两个变量间直线相关的强度,它不能描述两个变量之间的曲线关联,而不管这种关联程度有多强烈。

(6)相关系数会受到少数偏离整体的观测值的严重影响。当散点图中出现偏离点时,使用r解释数据要特别小心。

一般地,在经过假设检验并判断两个变量具有相关性的前提下,根据相关系数的大小,可以把两个变量之间的相关性划分为四个级别(这些级别成立的前提是|r|<0.3为不相关;0.3≤|r|<0.5为低度相关;0.5≤|r|<0.8为显著相关;|r|≥0.8为高度相关)。相关系数的绝对值越大(越趋向于1),则两个变量线性联系越密切。相关系数的符号表明了这种联系的方向。相关系数为正,表明两个变量是正相关,即自变量X与因变量Y呈相同方向的变化,即,平均来说,X越大,Y就越大;相关系数为负,这两个变量是负相关,X越大,Y越小。

(二)总体相关系数的检验

求出样本相关系数r后,可以利用它对总体相关系数ρ作出估计,也可以对原假设ρ=0进行检验。

样本相关系数r和样本均值img298、样本比例P一样,也是一个随机变量。可以证明,如果总体相关系数ρ=0,那么样本相关系数r的抽样分布随着n的增大越来越接近于自由度为n-2的t分布,即:

img299

服从自由度为n-2的t分布。利用这个t值作最终检验统计量,就可以对原假设H0(ρ=0,X与Y没有线性相关关系)进行检验。例如上例中r=0.2182,n=18,t统计量为:

img300

df=18-2=16,由t分布表可以查得原假设的概率值>0.10,因此在5%的检验水平下,无法拒绝原假设H0,即不能根据现有的数据认为电视广告的艺术性和劝服力之间有明显的相关关系。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈