第3章 相关分析及其应用
在日常生活和自然科学领域,我们常常需要分析、判断某一变量(因素)是否对其他变量(因素)有影响或某两个随机变量间是否有关联。例如,化学反应温度是否影响产物的收率,吸烟与肺癌是否有关,头发中的微量元素含量是否影响健康指标等。对于相互间有关联或关系的变量进行统计分析,才有可能根据某些变量去预测未知变量的数值。例如,气象预报部门根据当天和历史采集的大气湿度、环境温度和气压等数据进行统计分析后进行未来天气(温度、阴晴、风力等)预报,是因为气压、湿度等数据与未来天气指标有关系,才可以根据这些数据来预报天气。
相关分析(Correlation analysis)是研究随机变量之间的相关关系的一种统计方法,它研究随机变量之间是否存在某种依存关系,并探讨有依存关系的随机变量的相关方向以及相关程度,根据这些信息可以判断某些自变量对因变量的影响方式和大小。在采用统计回归分析等方法建立自变量与因变量间数学模型之前,对变量间进行相关分析可达到以下目的。
(1)帮助判断是否可以建立有意义的数学模型。
(2)进行变量筛选,使模型中只包含独立的变量,提高模型的性能。
相关分析有简单线性相关、复相关、偏相关及典型相关分析等多种方法。其中简单线性相关分析是针对两个随机变量,分析二者之间线性关联程度的强弱;复相关分析是针对一组随机变量,分析其中一个变量与其他变量间线性相关程度的强弱;偏相关分析是针对一组随机变量,固定其中一些变量的值,分析某个变量与其他变量间的关联强弱;而典型相关分析则是针对两组变量,进行两组变量整体线性关联程度强弱的分析。在实际应用中,根据不同的目的可选择不同的相关分析方法。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。