在自然界和社会经济活动中,现象与现象之间,或者说变量与变量之间常常存在着某种相互制约、相会依赖的关系,这种关系一般分为两种:
一种是确定性关系:可以用函数来表示的变量间关系,例如圆的半径设为R,则圆的面积S可以用S=πR2计算,这里的S和R之间的关系为确定性关系.
另一种是相关关系,这种关系表现出变量与变量之间存在着某种关系,但不能够完全确定.如人的身高与体重之间的关系.一般来说,人高一些,体重要重一些,但同样身高的人,体重往往不相同.又如消费者对某种商品的月需求量与该种商品的价格有着很密切的关系,一般说来价格低时需求量大,价格高时需求量小,但同一种价格,各个月份的需求量也不完全相同.
所谓回归分析是指通过试验和观测去寻找隐藏在变量间相关关系的一种数学方法,是研究变量间相关关系的一种有力的数学工具.
设随机变量Y(因变量)与普通变量X1,X2,…,Xp(自变量)之间存在着某种相关关系,由于Y是随机变量,对于X=(X1,X2,…,Xp)的各个取值x=(x1,x2,…,xp),Y有它的分布,我们不妨用F(y x)表示取确定值x时,对应的Y的分布函数.可以想象如果我们掌握了F(y x)随着x取值的变化而变化的规律,那么就能完全掌握Y与x之间的关系了,然而这样做往往非常复杂,甚至是不可能的.作为一种近似,我们转而去考察取确定值x时Y的数学期望,若此时Y的数学期望存在,则其值随x的取值而定,它是x的函数.将这一函数记为μ(x),称为Y关于x的回归函数.这样,我们就将讨论Y与x的相关关系的问题转化为讨论E(Y|X=x)=μ(x)与x的函数关系问题了.
如果μ(x)是线性函数,即E(Y|X=x)=μ(x)=β0+β1x1+…+βpxp,那么就成为回归模型为线性回归模型,本章仅介绍最简单的一元线性回归模型(p=1的情形).
在实际中最简单的情况是由两个变量组成的关系.比如在经济关系中,对某种商品的需求量Y随价格X的升降而变化,居民的消费Y随收入X的增减而改变等.首先考察两个变量之间的的关系模型,即设随机变量Y与普通变量x间存在相关关系,用E(Y|X=x)=μ(x)表示,由于两个变量Y和X之间不存在完全确定的函数关系,因此我们需要引入随机误差ε=y-E(Y|X=x),从而得到两变量之间的关系y=μ(x)+ε.
当μ(x)=β0+β1x为线性函数时,即有y=β0+β1x+ε的回归模型我们称之为一元线性回归模型.
对于一元线性回归模型y=β0+β1x+ε,我们通常假设ε~N(0,σ2),并称y为因变量, ε为随机误差项,模型中的β0,β1称为回归系数.
当给定X和Y的一组观测值(x1,y1),(x2,y2),…,(xn,yn),若我们可以得到β0,β1的估计则我们称为y关于x的回归方程,或称回归直线;称为y的拟合值或预测值.
在一元线性回归中主要解决下列一些问题:
(1)给定观测值(x1,y1),(x2,y2),…,(xn,yn)对回归系数β0,β1的估计问题;
(2)对回归系数的假设检验问题;
(3)在x=x0处对y做预测,即对y做区间估计.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。