根据主成分分析的定义及性质可以发现,主成分分析主要有以下几个方面的用途:
第一,主成分分析能降低所研究的数据空间的维数。 即用研究m维的y空间代替p维的x空间(m<p),而低维的y空间代替高维的x空间所损失的信息较少。即使只有一个主成分y1 (m=1)时,这个y1仍是使用全部x变量(p个)得到的。例如要计算y1的均值也得使用全部x的均值。在所选的前m个主成分中,如果某个xi的系数都近似于零的话,就可以把这个xi删除,这也是一种删除多余变量的方法。
第二,有时可通过因子负荷aij的结构,弄清x变量间的某些关系。例如在评价某企业的经济效益时,如果得税指标的负荷全为正值,产值指标的负荷全为负值,这似乎可以说明企业对国家的贡献主要来自于利税,利税指标是衡量企业贡献大小的主要指标。
第三,多维数据的一种图形表示方法。 当维数大于3时便不能画出几何图殂,而多元统计研究的问题大都多于3个变量,因此无法将问题用图形表示出来。 然而,经过主成分分析后,选取前两个主成分或其中某两个主成分,根据主成分的得分,画出N个样品在二维平面上的分布情况,由图形可直观地看出各样品在主分量中的地位,进而还可对样品进行分类处理,图形发现远离大多数样本点的离群点。
第四,由主成分分析法构造回归模型。 即把各主成分作为新的自变量代替原来自变量x作回归分析。
第五,用主成分分析筛选回归变量。 回归变量的选择有着重大的实际意义,为了使模型能够更好地进行结构分析、控制和预报,应从原始变量构成的子集合中选择最佳变量,构成最佳变量子集合。 用主成分分析筛选回归变量,计算量小,易于选择最佳变量子集合。
多元统计分析中的主成分分析法,以其理论的简洁性、赋权的客观性等特点被广泛应用于经济、社会、科教、环保等领域众多对象的评价和排序。这一方法的基本特征是应用数理统计和线性代数知识,通过寻找样本点散布最开的几个正交方向,对样本阵中的信息进行提炼和降维;再应用决策分析和泛函分析知识探索主成分价值函数的形成机理和结构形式。 由于上述优点,主成分分析法在社会经济、企业管理及地质、生化等各领域都有其用武之地,如在综合评价、过程控制与诊断、数理压缩、信息处理、模式识别等方向都有广泛的应用,并取得了良好的运用效果。
[1]殷克东.经济管理系统分析技术方法论[M].北京:经济科学出版社,2009:94.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。