数学建模社区-数学中国

标题: 数据挖掘的步骤 [打印本页]

作者: 飞翔的娇龙    时间: 2012-10-17 17:34
标题: 数据挖掘的步骤
数据挖掘的步骤会随不同领域的应用而有所变化,每一种数据挖掘技术也会有各自的特性和使用步骤,针对不同问题和需求所制定的数据挖掘过程也会存在差异。此外,数据的完整程度、专业人员支持的程度等都会对建立数据挖掘过程有所影响。这些因素造成了数据挖掘在各不同领域中的运用、规划,以及流程的差异性,即使同一产业,也会因为分析技术和专业知识的涉入程度不同而不同,因此对于数据挖掘过程的系统化、标准化就显得格外重要。如此一来,不仅可以较容易地跨领域应用,也可以结合不同的专业知识,发挥数据挖掘的真正精神。   
% \( A  P" U9 l6 Y7 j& F6 g) g- }
数据挖掘完整的步骤如下:  % [& E* X% S3 |3 ~  C; n4 u' R
 ① 理解数据和数据的来源(understanding)。   3 x% Y3 x5 E, l7 M/ C' a& b
  ② 获取相关知识与技术(acquisition)。  
% [; N7 p* Q9 u# ^2 ~  v/ T8 U ③ 整合与检查数据(integration and checking)。  
. Z) f2 M. |0 e7 w" _+ Q0 `. v5 m ④ 去除错误或不一致的数据(data cleaning)。  & V5 z* Y# q3 ~" N9 J" E( E
 ⑤ 建立模型和假设(model and hypothesis development)。  : `3 l- _$ ]* ~$ h; W& `
 ⑥ 实际数据挖掘工作(data mining)。  
7 W$ p% p$ z, Z1 T2 I7 Z0 u' s8 l- H0 t ⑦ 测试和验证挖掘结果(testing and verification)。  
0 i% X  x) M8 u$ d9 D3 ? ⑧ 解释和应用(interpretation and use)。  8 }8 P  x9 z4 C  g9 L& f# C! o

' Z7 a4 q5 q$ M4 u% D 由上述步骤可看出,数据挖掘牵涉了大量的准备工作与规划工作,事实上许多专家都认为整套数据挖掘的过程中,有80%的时间和精力是花费在数据预处理阶段,其中包括数据的净化、数据格式转换、变量整合,以及数据表的链接。可见,在进行数据挖掘技术的分析之前,还有许多准备工作要完成。
作者: jmdx2006    时间: 2012-10-20 08:01
学习了,有道理。
作者: mathhgr    时间: 2012-12-24 14:44
学习了,谢谢楼主
作者: 如梦荼蘼    时间: 2013-6-1 09:35
学习了~~楼主给力~~~~~~~~
作者: 张懿    时间: 2013-8-16 23:25
谢谢楼主分享
作者: guoaecg    时间: 2013-8-17 11:30
回复赚钱~~~~~~~~~~




欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5