【摘要】:数据挖掘的基础是数据,因此在挖掘前必须进行数据集成,这包括首先从各类数据系统中提取挖掘所需的统一数据模型,建立一致的数据视图,其次是作数据加载,从而形成挖掘的数据基础,目前,一般都用数据仓库以实现数据集成。在数据集成后对数据作进一步加工,这包括淘汰一些噪音与脏数据,对有效数据作适当调整,以保证基础数据的可靠与一致。这两个步骤是数据挖掘的数据准备,它保证了数据挖掘的有效性。
16.5.2 数据挖掘的步骤
数据挖掘一般可由下面五个步骤组成。
(1)数据集成
数据挖掘的基础是数据,因此在挖掘前必须进行数据集成,这包括首先从各类数据系统中提取挖掘所需的统一数据模型,建立一致的数据视图,其次是作数据加载,从而形成挖掘的数据基础,目前,一般都用数据仓库以实现数据集成。
(2)数据归约
在数据集成后对数据作进一步加工,这包括淘汰一些噪音与脏数据,对有效数据作适当调整,以保证基础数据的可靠与一致。这两个步骤是数据挖掘的数据准备,它保证了数据挖掘的有效性。
(3)挖掘
在数据准备工作完成后即进入挖掘阶段,在此阶段可以根据挖掘要求选择相应的方法与相应挖掘参数,如可信度参数等,在挖掘结束后即可得到相应的规则。
(4)评价
经过挖掘后所得结果可有多种,此时可以对挖掘的结果按一定标准作出评价,并选取评价较高者作为结果。
(5)表示
数据挖掘结果的规则可在计算机中用一定形式表示出来,它可以包括文字、图形、表格、图表等可视化形式,也可同时用内部结构形式存储于知识库中供日后进一步分析之用。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。