二、预测方法及其结果
(一)指数平滑方法
指数平滑方法可以通过调整对时间序列中包含的短期趋势的估计,自动追踪数据的变化,实现对短期变动趋势的预测。该方法又包括:一次指数平滑、二次指数平滑、多参数无季节趋势指数平滑和多参数有季节趋势指数平滑。因为月度收入数据的季节性和强烈的时间趋势,这里选用多参数有季节趋势指数平滑法,并使用乘积模型。
由于指数平滑方法是利用税收收入数据自身来实现预测,因此不存在模型自变量的设定与筛选等问题。我们使用2000年1月—2008年12月数据建立Holter-Winter季节乘积模型,利用2009年1—4月数据验证模型的效果。计算软件是Eviews6.0。
使用Holter-Winter季节乘积模型预测结果的误差率在4%以下,并且全部呈现偏高趋势,平均绝对百分误差(MAPE)为5.66,通常MAPE值在0~5之间,说明模型预测精度极高,因此Holter-Winter季节乘积模型的预测效果比较理想。
(二)ARIMA方法
我们对税收收入的自然对数取两次差分后绘制自相关图,可以看出,在滞后3期、6期、9期和12期的自相关系数分别是0.722、0.717、0.647和0.676,显著不为0。说明税收收入数据具有强烈的季节趋势。对税收收入自然对数值逐期差分,并以12个月为步长进行季节差分,获得新序列称之为“季节调整后税收收入自然对数值”。
经差分调整后的税收收入数据很快落入随机区间,滞后12期的自相关系数值还是偏大,即使对经过季节差分调整后的数据再进行一次季节差分,滞后12期的自相关系数值依然没有落入随机区间。偏自相关系数在滞后4期后基本落入随机区间,自相关系数在滞后2期后落入随机区间,因此自回归阶数p确定为3或者4,移动平均阶数q确定为2或者3,季节差分为1次,逐期差分为1次。模型的形态为,ARIMA(p,1,q)(1,1,1)[12]。最终根据AIC和BIC值,以及参考预测精度确定模型为ARIMA(3,1,3)(1,1,1)[12]。计算软件是Eviews6.0。
使用季节调整的ARIMA模型预测结果的误差率在0.64%~10.66%之间波动,全部呈现偏高趋势,平均绝对百分误差(MAPE)为5.71,因此季节调整的ARIMA模型的预测效果也比较理想。
(三)BP神经网络方法
BP(Back Propagation)神经网络,即基于误差反向传播算法的人工神经网络,由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。
在使用BP神经网络方法之前,需要对模型的设定加以说明,这里由于仅仅是使用税收月度数据来实现预测,因此选择时间趋势项、税收收入前期值作为输入元,实际的月度税收收入为输出元。隐含层层数设定为4,终止误差设定为1×10-6。在运算中,我们发现随着隐含层层数的增加和终止误差设定值的降低,会提高预测的精度,但是增加的隐含层过多、终止误差设定过低是没有意义的,预测精度不会改变。这里我们选择加入时间趋势项、不加入时间趋势项,选择前1期、前2期和前3期税收收入分别作为输入元,来比较不同的模型预测精度,并且预留出2009年1—4月的实际税收收入数据来验证模型的精度。经过计算,模型的最终形态确定为输入元为时间趋势项和前一期税收收入,输出元为实际税收收入,因为其他形态的模型不能显著提高预测精度。计算软件是R2.9.0。
BP神经网络方法预测结果的误差率在2.24%~38.27%之间波动,平均绝对百分误差(MAPE)为23.59,BP神经网络方法的预测效果并不理想。使用这一方法预测效果不理想的原因可能是输入信息量过小,因为在吴凌云博士给我们的范例中,使用GDP和二次产业GDP来预测年度税收收入时,预测误差率一般在10%以下。
(四)支持向量机方法
支持向量机(SVM)是数据挖掘中的一个新方法,能非常成功地处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题。支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面。建立方向合适的分隔超平面,使两个与之平行的超平面间的距离最大化。其假定为,平行超平面间的距离或差距越大,分类器的总误差越小。支持向量机与神经网络类似,都是学习型的机制,与神经网络不同的是,SVM使用的是数学方法和优化技术,而支持向量机的关键在于核函数。低维空间向量集通常难以划分,解决的方法是将它们映射到高维空间。但这个办法带来的困难就是计算复杂度的增加,而核函数正好巧妙地解决了这个问题。也就是说,只要选用适当的核函数,就可以得到高维空间的分类函数。
反复比较模型的预测精度后,支持向量机模型自变量设置为时间趋势项和前一期税收收入,因变量为月度实际税收收入,模型的cost值设置为40000,ε值设置为0.001,即使将cost值设置再增加100倍,ε值设置再降低10倍,依然不改变预测精度。计算软件是R2.9.0。
支持向量机方法预测结果的误差率在16.28%~45.44%之间波动,平均绝对百分误差(MAPE)为30.29,支持向量机方法的预测效果并不理想。使用这一方法预测结果不理想的原因同样可能是输入信息量过小。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。