【摘要】:呼叫中心故障处理流程的业务数据包含故障编号、故障省份、处理人工号、业务类别、故障等级、开始时间、结束时间、合计小时和接障人工号等字段。流程运行数据需要进行相应的抽取、转换操作才能满足流程挖掘的需要。在数据挖掘前需要对业务数据进行预处理,以提高数据的质量和流程挖掘的效率。图4.11 呼叫中心故障处理流程日志挖掘的过程流
呼叫中心故障处理流程的业务数据包含故障编号、故障省份(Province)、处理人工号、业务类别、故障等级、开始时间、结束时间、合计小时(Time)和接障人工号等字段。流程运行数据需要进行相应的抽取、转换操作才能满足流程挖掘的需要。此外,由于员工技能、流程执行环境等因素影响,业务数据中难免存在噪声、错误等脏数据。在数据挖掘前需要对业务数据进行预处理,以提高数据的质量和流程挖掘的效率。
(1)删除脏数据。源数据中存在少量的处理人工号字段为空值、合计小时字段为负值等脏数据,这些数据不符合业务规则,可以删除。
(2)转换数据类型。在源数据中合计小时的类型格式为字符串,需要转成连续型数据类型。
(3)将省份分组。流程运行数据中覆盖了30多个省、直辖市的故障处理情况,为了方便分析,可以按照地理位置把省份映射为华北、华东、华南、东北、西北、西南、华中等大区(District),以满足决策树分析的要求。
(4)合计小时属性离散化。合计小时属性为连续型的数据,为了提高决策树的分析效率和分析结果的可读性,将合计小时按照业务处理效率等级进行离散化(TimeLevel),如表4.1所示。
表4.1 离散化故障处理合计时间
(5)过滤无关属性。故障编号、开始时间、结束时间等字段与流程挖掘的目的不相关,因此可以过滤这些属性,提高数据分析的效率。
图4.11所示是呼叫中心故障处理流程日志挖掘的过程流。
图4.11 呼叫中心故障处理流程日志挖掘的过程流
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。