首先进行正向化处理。根据第二章的分析假设,本书在后文计量模型中所用的变量均为正向指标,即
由于代理变量的计量单位等不同,在计算经济增长质量之前,首先要对各基础指标进行数学上的处理,使之正向化。因此,本书首先为保证降维前的各个变量的同趋势化,要对各指标进行处理。处理方法主要有:第一种是将逆向指标取负值,适度指标则是对指标离差的绝对值取负值;第二种则是将逆向指标取其倒数进而代替原指标,适度指标则是指标离差的绝对值再取倒数;第三种是先对逆向指标取最大的绝对值之后加各指标值最后取其值的倒数,对于适度指标则先取指标值与其适度值(平均值)之差的绝对值,之后取其倒数。但陈军才(2005)[3]认为第一种方法是无效的,而第二种方法则会面临着指标值为0的问题,而本书选取股市波动的代理变量为全部股票价格指数环比变化率,中国上海证券交易所与深圳证券交易所在1990年12月才成立,1991年以前的全部股票价格指数环比变化率本书设为0,因此也不能简单地采取第二种方法。
由此可知,本书将对各指标进行以下处理:
第一,保持正向指标不变;
第二,逆向指标:
为指标值绝对值的最大值。指标之中有为0的指标采取此方法,其余皆用方法来处理逆向指标。第三,计算适度指标的均值,取离差的绝对值后再取倒数。
其次,进行无量纲化处理。由于各代理变量的量纲、量级不同,易造成结果偏重于方差较大或数量级较大的指标,所以本书对所有指标采取无量纲化的方法来化解这一问题,而不是直接对各变量进行因子分析。对于无量纲化,主要有极值法、中心化法、均值化法、标准差化法等;对于主成分分析与因子分析而言,比较通用的是中心化法与均值化,其中,中心化法是将数据进行以下处理:
表示变量x的均值,si 则是x的标准差。经处理后均值为0,方差为1。
而均值法则是:
经处理后均值为1,方差为
通过中心化与均值化方法的对比可以看出,采用均值化方法来处理数据相对于中心化方法而言,不仅消除了量纲与数量级的影响,还可以反映出原始变量的变异程度信息,并保留了变量可比性,因此,本书与随洪光(2013)、钞小静(2011)一样用均值法对数据进行处理。另外,本书在对数据进行测算后发现使用中心化方法会导致部分指标与理论经验的偏离,因此本书在书写过程中仅列出用均值化方法进行处理的数据,不再对标准化方法进行列出以及验证。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。