首页 百科知识 数据挖掘的步骤

数据挖掘的步骤

时间:2023-10-18 百科知识 版权反馈
【摘要】:数据挖掘的基础是数据,因此在挖掘前必须进行数据集成,这包括首先从各类数据系统中提取挖掘所需的统一数据模型,建立一致的数据视图,其次是作数据加载,从而形成挖掘的数据基础,目前,一般都用数据仓库以实现数据集成。在数据集成后对数据作进一步加工,这包括淘汰一些噪音与脏数据,对有效数据作适当调整,以保证基础数据的可靠与一致。这两个步骤是数据挖掘的数据准备,它保证了数据挖掘的有效性。

16.5.2 数据挖掘的步骤

数据挖掘一般可由下面五个步骤组成。

(1)数据集成

数据挖掘的基础是数据,因此在挖掘前必须进行数据集成,这包括首先从各类数据系统中提取挖掘所需的统一数据模型,建立一致的数据视图,其次是作数据加载,从而形成挖掘的数据基础,目前,一般都用数据仓库以实现数据集成。

(2)数据归约

在数据集成后对数据作进一步加工,这包括淘汰一些噪音与脏数据,对有效数据作适当调整,以保证基础数据的可靠与一致。这两个步骤是数据挖掘的数据准备,它保证了数据挖掘的有效性。

(3)挖掘

在数据准备工作完成后即进入挖掘阶段,在此阶段可以根据挖掘要求选择相应的方法与相应挖掘参数,如可信度参数等,在挖掘结束后即可得到相应的规则。

(4)评价

经过挖掘后所得结果可有多种,此时可以对挖掘的结果按一定标准作出评价,并选取评价较高者作为结果。

(5)表示

数据挖掘结果的规则可在计算机中用一定形式表示出来,它可以包括文字、图形、表格、图表等可视化形式,也可同时用内部结构形式存储于知识库中供日后进一步分析之用。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈