首页 理论教育 数据挖掘决策树模型基本步骤

数据挖掘决策树模型基本步骤

时间:2023-02-14 理论教育 版权反馈
【摘要】:本书通过将领域知识、专家经验、群决策和多目标决策理论引入到数据挖掘中,对基于多目标决策的数据挖掘的方法评估问题展开深入研究和探讨,建立基于多目标决策的数据挖掘方法评估理论框架。本章通过结合领域知识、专家经验,进一步基于多目标决策的数据挖掘方法评估理论框架,拓展和延伸了第5章提出的层次分析模型,提出一个共识支持模型来识别最佳的聚类方法,以提高聚类绩效。

本书的组织结构如图1-1所示,共分7章。各章的具体安排如下:

第1章绪论。首先,着重介绍本书的研究背景和研究意义,并根据已取得的科研成果提出了研究的核心问题;其次,针对AHP群决策研究问题、知识驱动的数据挖掘研究问题、多目标决策在数据挖掘中的研究问题和方法评估研究问题,结合国内外文献,展开文献综述,把握领域内国内外的研究前沿和热点;最后,指出了本书的主要创新点和组织结构。

第2章概述了本书的理论基础。详细介绍了本书工作的三大理论基础:群决策理论和技术、多目标决策理论和技术以及数据挖掘理论和技术,以突出交叉学科的融合优势,整合优势资源,对基于多目标决策的数据挖掘的方法评估问题展开深入研究和探讨,充分发挥交叉学科的研究优势。

第3章基于绪论中的文献综述和理论分析,结合群决策、多目标决策和数据挖掘三大理论与技术,提出本书的核心研究问题——如何针对给定的目标问题或数据集,科学有效地选择合适的、高效的评估方法或模型,以寻找最优决策。本书通过将领域知识、专家经验、群决策和多目标决策理论引入到数据挖掘中,对基于多目标决策的数据挖掘的方法评估问题展开深入研究和探讨,建立基于多目标决策的数据挖掘方法评估理论框架。该理论框架由三大阶段和六大模块构成。

第4章通过把领域知识、专家经验与多目标决策方法即层次分析法AHP相结合,提出IAHP-GDM方法和EWAHP-GDM方法。提出的IAHP-GDM方法和EWAHP-GDM方法是基于AHPGDM方法的提升,而EWAHP-GDM方法又是在IAHP-GDM方法上的进一步提升。在实验阶段,针对股票、债券、房地产、基金四大金融产品,邀请了五位投资管理、风险分析方面的专家,运用本书提出的方法对其进行风险预估,并且和已有的AHP群决策方法进行对比分析。实证结果验证了本书所提出的IAHPGDM方法和EWAHP-GDM方法的有效性。

在本章中,提出的EWAHP-GDM方法首次把集结个体判断矩阵(AIJ)和集结个体排序(AIP)统一在群决策模型中,扩展和丰富了AHP群决策方法的集结技术。同时,提出的EWAHP-GDM方法还被进一步扩展为一种可以确定准则权重的方法,为分类方法评估和聚类方法评估章节中的多目标决策阶段奠定了扎实的研究基础。

图1-1 本书的组织结构

第5章分类方法评估。本章通过结合领域知识、专家经验,提出基于多目标决策的数据挖掘方法评估理论框架,并结合二次挖掘的深层分析思想,提出一个层次分析模型用来评估最佳分类方法。该模型包括数据挖掘阶段、多目标决策阶段和二次挖掘阶段三个阶段。为了验证模型的有效性,实验选取了2个UCI信用风险数据集,10个经典的数据挖掘分类方法,10大绩效评估指标,4个重要的多目标决策方法,来评估针对信用风险分析的分类方法的性能。实验表明,通过本书提出的层次分析模型,可以快速准确地识别出最鲁棒的分类方法,并且能够诱导出一个方法优劣排序的列表,进而快速、准确地指导决策规避信用风险。另外,该模型可以很好地解决没有免费的午餐定理所指出的基础性难题,且能够有效应对针对不同决策方法对方法或模型评估的结果存在不一致甚至矛盾冲突这一多目标决策领域的重难点问题。

第6章聚类方法评估。本章通过结合领域知识、专家经验,进一步基于多目标决策的数据挖掘方法评估理论框架,拓展和延伸了第5章提出的层次分析模型,提出一个共识支持模型来识别最佳的聚类方法,以提高聚类绩效。该模型在聚类方法评估时,可以调和评价结果之间的分歧和冲突而促成满意度最佳的共识决策。在二次挖掘阶段,基于二八定律,提出一个基于三阶段的共识融合模型实施二次知识发现。为了验证共识支持模型的有效性,20个UCI数据集(包含18310条实例、313个属性、6个聚类方法、9个外部度量指标和4个多目标决策方法)被用来测试和验证我们提出的共识支持模型。研究表明,该模型综合考虑了决策参与者的整体满意度,既考虑了备选方案的最满意排序,也考虑了最不满意的排序,并且进行定量化研究来选择最佳聚类方法。同时该模型能够调和在方法评估时,评估结果不一致甚至存在矛盾的差异。

第7章结论与展望。本章归纳和总结了全书的研究内容,并对进一步的研究工作和科研方向提出了展望。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈