为了定量分析几个主要影响因素与话务量的关系,使用回归分析建立话务量的预测模型。回归分析是确定两个或两个以上变量定量关系的一种统计分析方法。使用回归分析预测流程的执行效率、完成时间和流程任务量在流程管理中得到了广泛应用[32]。
多元回归分析是从多个自变量中找到对因变量的变化最为显著的自变量,回归函数中只有包含了这些最重要的自变量,对最终预测的准确性才会起到积极作用。对于线性回归方程的显著性检验,常用的方法有R2检验、F检验和T检验等。R2反映了因变量与自变量之间的线性相关程度,R2越大则模型拟合度越好。F检验是在给定显著性水平α下计算F统计量,如果F>Fα,表明回归效果显著。T检验是在给定显著性水平α(通常为0.05)时计算t统计量,如果t>tα/2,拒绝假设,否则接受假设。
使用IBM SPSS Statistics 20的逐步回归分析法,生成话务量的预测模型。将发卡数、固定额度调整通知短信数量、额度不足和超限提醒短信数量作为自变量,将话务量作为因变量,进行回归分析,如图4.16所示。
图4.16 逐步线性回归
1.变量筛选
在逐步回归分析开始,首先对各个自变量进行F显著性检验,删除F显著性小于F 0.05的自变量。可以发现,发卡数和固定额度调整通知短信数量的显著性较高,均大于F 0.1;而自变量额度不足和超限提醒短信数量小于F 0.05,显著性不高,从回归模型删除。
将自变量发卡数加入回归方程,生成线性回归模型1,如图4.17所示。将发卡数和固定额度调整通知短信数量都加入回归方程,生成线性回归模型2。对比两个模型的拟合度、显著性检验等指标,选择较好的预测模型。
上述回归分析使用了简单、有效的线性模型,有兴趣的读者可以使用IBM SPSS Statistics 20中各种非线性回归模型(对数、多项式和幂函数等)作比较,利用R2等统计量选出拟合话务量与发卡数、固定额度调整通知短信数量之间关系效果更好的非线性回归模型。
图4.17 话务量与发卡数的回归分析模型
2.模型拟合情况
图4.18所示为两个模型的拟合信息汇总,从此图中可以模型2 的R2,R2的值为0.864,大于模型1的R2,此R2的值为0.780,而且模型2的R值、调整后的R2、估计标准差均优于模型1,即固定额度调整通知短信数量自变量的加入提高了模型的解释能力,使回归方程的拟合度得到提高,所以引入固定额度调整通知短信数量是显著的。
图4.18 模型拟合情况比较
3.回归系数的估计
表4.2所示为两模型的回归系数分析结果,可知模型1的线性回归方程为:话务量=3.127×发卡数+12 143.915。发卡数的系数说明平均每增发一张卡,呼叫中心会增加3.127条话务。模型2的线性回归方程为:话务量=2.277×发卡数+15.968×固定额度调整通知短信数量+10 668.207。固定额度调整通知短信数量的加入降低了发卡数的影响权重,使平均多发一张卡增加2.227条话务量,而每多发一条固定额度调整通知短信,则增加15.968条通知短信。
表4.2 回归系数分析
经T检验,两个模型中的发卡数、固定额度调整通知短信数量等显著性概率p值都小于0.05,具有显著性意义。
4.已排除变量分析
表4.3所示为两个模型中已经排除变量的T检验显著性,从此表中可以看出,在两个模型中,额度不足和超限提醒短信数量的显著性概率都大于0.05,所以不能引入模型。
表4.3 已排除变量分析
5.时间序列分析
某公司呼叫中心话务量的走势如图4.19所示,从此图中可以发现话务量整体呈上升趋势,且前半部分走势平稳,后半部分增长速度较快,这与某公司近年大力发展信用卡业务的战略吻合。下面利用时间序列模型ARIMA拟合话务量的走势。
图4.19 话务量的时序走势
常用的时间序列模型有多种模型等,这里使用IBM SPSS Statistics 20的差分自回归移动平均模型(autoregressive integrated moving average model,ARIMA)。实验证明,ARIMA在时间序列预测中的效果较好。
选择SPSS Statistics 20中的“分析”→“预测”→“创建模型”菜单,设置话务量为因变量,选择ARIMA模型,运行结果如图4.20所示。
图4.20 ARINA模型的预测结果
从拟合度看,时间序列分析模型对应的R2为0.65,小于线性回归模型的R2值(0.864),即线性回归模型的拟合度更高。这是由于时间序列分析只考虑随时间推移话务量的整体变化走势,并没有进一步考虑各种因素的影响。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。