首先,我们对Y和X1进行多重共线性的检验。我们只对X1进行检验的原因是,由于尽管两者的指标含义不同,但其所包含的产业却是一样的,因此会引起误解。为严谨起见,我们在E-Views 5.0环境下先对这两个指标进行检验,结果如表5.2所示。
表5.2 Y和X1的多重共线性的检验
数据来源:中国工业企业数据库,2001—2006年《浙江统计年鉴》、《上海统计年鉴》、《江苏统计年鉴》。
观察表5.2中的结果,其中因变量和自变量之间并不存在拟合程度较好的线性关系。而且DW值为1.820024,接近于2,因此可以拒绝假设,即Y和X1之间不存在多重共线性。
我们用X1~X4为自变量对Y进行Logit回归,E-Views 5.0的输出结果如表5.3所示。
表5.3 Logit模型结果
数据来源:中国工业企业数据库,2001—2006年《浙江统计年鉴》、《上海统计年鉴》、《江苏统计年鉴》。
以上Logit 模型采用了最大似然估计法进行参数估计,得到下面这个方程:Y=1.130006X1+0.251864X2-0.003518X3+0.000937X4+4.579902。除了X2外,其他自变量的Z统计量都非常显著(|Z|>3),P值也都小于0.02。一般来说,变量通不过Logit模型检验,有可能存在三个问题,因此,有必要对X2值进行分析。
问题1:所选取变量并不是选择主体的核心属性。如上面所分析的那样,X2表示的是一个产业集聚本身的垂直分工属性,也是本书最核心的问题之一,因此,这个问题并不存在。
问题2:变量数据的失真。我们所使用的VAS法存在以下两个缺陷:一是在同样的中间产品投入量下,位于产业链上游的产业往往比处于产业链下游的企业VIk值要来得小;二是由于相对价格的波动,尤其近年来原材料价格波动幅度很大,因此对时间序列的观察造成一定的困难。对上述两个缺陷我们已经通过以下两个方法进行了排除:① 在计算中只关注于制造业,而没有将采掘产业和最终消费品产业放入计量体系;② 将产业细分到三位数层面,减少上下游产业的影响。这样,我们的X2值在数值上并不存在失真问题。
问题3:使用过多特定方案(alternative-specific)常量。Logit 方式选择模型的效用函数包括特定方案常量,这些常量的数目不应超过备选方案减1。但这个问题并不存在,因为上述情况通常会引起软件异常中断或产生一些提示估计发生的问题,而在我们计算的过程中,并没有这种提示和中断发生。
因此,我们可以确定X2不显著并不是模型本身的问题。表5.4显示了2001—2006年所有三位数产业集聚的VIk值,从中我们发现6年30个产业的垂直解体率(1-VIk)变动并不大,除了16-烟草制造业之外,都在0.65~0.8的狭窄区间内,因此我们对X2作方差平滑处理,得到如表5.5的计量结果。
表5.4 2001—2006年所有三位数产业集聚的新增产值率
续 表
数据来源:中国工业企业数据库。
表5.5 X2修正后的Logit模型结果
数据来源:中国工业企业数据库,2001—2006年《浙江统计年鉴》、《上海统计年鉴》、《江苏统计年鉴》。
表5.5的计量结果显示,所有变量的Z统计量在90%的置信区间显著异于0,P值基本小于或等于0.02,模型通过检验。在第4章中,我们曾经计算过γck的按年平均值及其方差(表5.6),发现产业集聚间分工的明显受到较大的时间扰动,因此我们将上面模型中的自变量Y滞后一期,以检验其本身的跨期影响,结果如表5.7所示。
表5.6 2001—2006年长三角全部三位数产业γck值均值及其方差
数据来源:中国工业企业数据库。
表5.7 Y滞后一期的Logit模型结果
数据来源:中国工业企业数据库,2001—2006年《浙江统计年鉴》、《上海统计年鉴》、《江苏统计年鉴》。
表5.7回归结果显示,滞后变量会产生影响,但是在90%置信区间下,影响并不显著。因此我们可以忽略Y的跨期影响,仅在当期面板数据下解释模型即可。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。