首页 理论教育 回归直线回归直线回归直线回归

回归直线回归直线回归直线回归

时间:2023-03-18 理论教育 版权反馈
【摘要】:由上述求回归直线的计算过程可以看出,即使给出一些杂乱无章的散点,我们依然可以用最小二乘法求出一条回归直线.而在这种情况下,所配的直线显然毫无意义.只有当两个变量之间大致成线性关系时,回归直线才有实际意义.根据实际问题求得的回归直线,其相关变量之间的线性关系是否密切?
相关系数_统计中的智慧

由上述求回归直线的计算过程可以看出,即使给出一些杂乱无章的散点,我们依然可以用最小二乘法求出一条回归直线.而在这种情况下,所配的直线显然毫无意义.只有当两个变量之间大致成线性关系时,回归直线才有实际意义.根据实际问题求得的回归直线,其相关变量之间的线性关系是否密切?这些问题可以利用相关系数对回归直线方程的效果进行检验得以解决.

所谓相关系数是描述两个变量之间的线性关系密切程度的一个数量指标,通常用字母r表示,其计算公式为

相关系数具有性质:

下面借助图23.2说明,当相关系数r取各种不同数值时,散点分布的情况.

图23.2

图23.2 r值与散点分布的关系

(1)当r=0时,,由(23.4)式可知,回归直线的斜率b=0,因此回归直线与x轴平行.这说明无论x取何值,y的值都保持不变,即变量x与y无线性关系,如图23.2(a)所示.值得注意的是,当r=0,x与y不存在线性关系时,也可能存在其他非线性关系,如图23.2(b)所示.当|r|越接近于0时,x与y之间的线性相关程度越小.

(2)当0<|r|<1时,变量x与y之间存在一定的线性关系.|r|越接近1,散点越靠近回归直线.当0<r<1时,回归直线的斜率b>0,称x与y正相关,如图23.2(c)所示;当-1<r<0时,回归直线的斜率b<0,称x与y负相关,如图23.2(d)所示.

(3)当|r|=1时,所有的散点都在回归直线上.这时变量x与y之间存在确定的线性函数关系,称x与y完全线性相关.当r=1时,当x增加或减少时,y也同时增加或减少;如图23.2(e)所示.当r=-1时,当x增加时,y的值反而减少;如图23.2(f)所示.

相关系数r能够很好地刻画两个变量之间的线性关系.当时,虽然x与y之间存在线性相关,但是,只有当r的绝对值大到一定程度时,才能认为x与y之间的线性关系密切.也只有在这种情况下,我们称相关系数是显著的,所求的回归直线方程才有意义;否则认为相关系数不显著,所求的回归直线方程无意义.那么x的绝对值究竟要大到何种程度,才能认为x与y之间的线性关系密切呢?

在附录4的“相关系数检验表”中给出了,对于不同的n(样本容量),在两种显著性水平α(0.05与0.01)下,相关系数达到显著水平的临界值rα,即相关系数达到显著的最小值.

现在用相关系数检验例1中求得的回归直线方程的效果.

由(23.5)式算得相关系数为

又n=24,查相关系数检验表得

因为|r|>r0.01,所以变量x与y之间的线性关系高度显著.

了解“回归”的历史根源或许能帮助我们更好地理解回归直线.“回归”这个词,是F·高尔顿(Francis Galton,1822—1911)于1877年第一次作为统计概念加以应用的.高尔顿是生物统计学派奠基人,出生在英国一个著名的家庭,是进化论倡导者达尔文(Charles Robert Darwin,1809—1882)的表弟.高尔顿早期是一位地理学家,但是在1859年其表兄达尔文的《物种起源》发表后,他的科学兴趣很快转移到遗传学领域.他建立了一个试验室,在那里进行人类体形的测定,对人类身高的遗传性进行研究.在他搜集的数据中,有大量父母和他们成年子女的身高测定数.这些数据表明,比较高的父母与那些比较矮的父母相比,其子女也比较高.但是,很高的父母所生的子女,平均说来没有其父母高;很矮的父母的子女,平均说来没有其父母那样矮.也就是说,他们的身高将向中等身高退化.高尔顿将这种身高趋于人的平均高度的趋势称为“回归”.他用这个词,作为根据一个变量预测另一个变量的一般名称.

高尔顿在研究智力遗传问题时也得到了类似的结论:一般地说,天才是能遗传的.但是,天才的子女要比他们的父母平庸;而一般智力水平的父母,其子女却有可能是超群的天才.这个结果或许会给那些因为自己智力不突出而为子女感到痛苦的父母,带来美好的希望.高尔顿经过更多的研究后,得到了一个更为普遍的结论:人的生理结构是稳定的,所有有机组织都趋于标准状态.

1888年,高尔顿又引进了“相关”的思想.这个思想立刻被证明非常有价值.后来统计学家还创造了多元回归以及偏相关和复相关等概念,用来描述由几个变量预计另一个变量的过程,以及多种关系和部分关系的分析.例如,为了研究一个国家的经济发展水平,需要收集详细完整的数据,要办到并不容易.可是,如果经济发展与股票交易高度相关,而后者的数据很容易得到,那么股市可以作为一个国家的经济发展状况的晴雨表.如果一个人的中学成绩与大学成绩之间,或者大学成绩与以后在工作中的成就之间密切相关,我们就能对许多人的未来发展作出预测.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈