第三节 多元线性回归分析
上一节研究了一元回归的问题,它反映的是某一因变量与一个自变量之间的关系。在实际问题中,和某一因变量有关的变量往往不只一个,而是很多个。例如,一个工业企业利润的多少,受总产值多少的影响,同时也受成本、价格等因素的影响;一种商品的销售量,除受这种商品价格的影响外,还受居民收入、代用品及其他有关商品价格、广告费等的影响。研究一个因变量与多个自变量之间的定量关系问题称为多元回归或复回归。多元回归分为多元线性回归与多元非线性回归,这里我们讨论多元线性回归问题。
一、多元线性回归方程的建立
当因变量y与自变量x1,x2,x3,…,xp之间存在着线性关系,则多元线性回归方程可写为:
式中:为常数项;
在多元回归方程中,y对某一自变量的回归系数表示当其他自变量都固定时,该自变量变化一个单位而使y平均改变的数值,也称为偏回归系数。
和研究一元回归时的情形相似,求的值,仍采用最小平方法。
首先,将多元回归方程变换为:
令
根据最小平方法有:
分别对求偏导数,并令函数的一阶导数等于0,得如下标准方程:
若令
则上述联立方程为:
于是的值可以全部求出,从而多元回归方程就可以求得了。
例7-4:某动力厂为提高锅炉对煤气的利用程度,降低对动力煤的消耗,采用回归分析的方法,制定出耗煤指标的控制参数,以便随时掌握耗煤指标的完成情况。
根据生产实际,耗煤指标的大小和高炉煤气燃烧量与锅炉负荷两因素有关。现将所搜集数据加以整理如表7-3所示。
首先根据表7-3编制计算表7-4,然后依据表7-4进行二元回归计算
表7-3 某动力厂耗煤指标、高炉煤气燃烧量与锅炉负荷资料
表7-4 多元回归系数计算表
将L值代入方程:
求值:
求解以上方程得:
求值:
则求得二元回归方程为:
二、估计标准误差
和一元回归分析相同,估计标准误差可以通过总变差的分解求得,表示为:
Lyy=U+Q
其中
则 ,其中p为自变量个数
例7-5:试根据例7-4资料计算估计标准误差。
已知:n=12,L1y=-80.73,L2y=-598.32
三、多元线性回归方程的显著性检验
检验y与x1,x2,…,xp的线性回归关系是否显著,主要是检验β1,β2,…,βp是否等于0。因此,我们可以检验β1=β2=…=βp=0这一假设是否成立,检验上述假设的统计量F的公式为:
在显著性水平α下,对于给定的一组数据,如果
F>Fα(p,n-p-1)
则认为所求回归方程是显著的,否则所求回归方程不显著。
例7-6:试在显著性水平a=0.05的水平下,检验根据例7-4的资料所求的回归方程是否显著。
已知:
代入下式得
查F分布表(见附录二表5b):
F0.05(p,n-p-1)=F0.05(2,9)=4.26
因8.04>4.26,故可认为所求回归方程是显著的。
多元线性回归与一元线性回归不同,不能仅满足回归方程是否显著这一结论。因为回归方程显著并不意味着每个自变量xj(j=1,2,…,p)对y的影响都是显著的。尚需判别在所考虑的因素中,哪些是影响y的主要因素,哪些是次要因素。对于那些次要的因素,总是希望从回归方程中剔除,然后建立更为简单的回归方程,以利对y进行预测和控制。至于如何衡量某个特定变量xj(j=1,2,…,p)对y的影响,有兴趣读者可参考有关书籍。这里不再赘述。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。