- 在线时间
- 39 小时
- 最后登录
- 2012-10-26
- 注册时间
- 2012-1-1
- 听众数
- 7
- 收听数
- 0
- 能力
- 0 分
- 体力
- 205 点
- 威望
- 0 点
- 阅读权限
- 30
- 积分
- 102
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 90
- 主题
- 38
- 精华
- 0
- 分享
- 0
- 好友
- 15
升级   1% 该用户从未签到
 群组: 数学建模培训课堂1 |
数据挖掘的步骤会随不同领域的应用而有所变化,每一种数据挖掘技术也会有各自的特性和使用步骤,针对不同问题和需求所制定的数据挖掘过程也会存在差异。此外,数据的完整程度、专业人员支持的程度等都会对建立数据挖掘过程有所影响。这些因素造成了数据挖掘在各不同领域中的运用、规划,以及流程的差异性,即使同一产业,也会因为分析技术和专业知识的涉入程度不同而不同,因此对于数据挖掘过程的系统化、标准化就显得格外重要。如此一来,不仅可以较容易地跨领域应用,也可以结合不同的专业知识,发挥数据挖掘的真正精神。
4 U3 d7 ?$ x7 \9 j: j) c8 ^" g& e, `. W" T" n
数据挖掘完整的步骤如下: % r: l8 i+ w( j ]8 l3 X# M
① 理解数据和数据的来源(understanding)。 $ I- R- R% X! T- `1 |
② 获取相关知识与技术(acquisition)。
5 ?2 D2 X0 c8 Q ③ 整合与检查数据(integration and checking)。 - I) z1 \$ C% U+ U
④ 去除错误或不一致的数据(data cleaning)。
. `4 G; O1 E- O7 z* k" y; e ⑤ 建立模型和假设(model and hypothesis development)。
& d5 R) K; S# M5 O+ o0 c ⑥ 实际数据挖掘工作(data mining)。 5 n# F& V) d' h8 J3 o
⑦ 测试和验证挖掘结果(testing and verification)。 : r# z/ \7 D1 V8 Q
⑧ 解释和应用(interpretation and use)。 $ j3 W" a* { f8 w
2 {7 r2 ~8 l8 J 由上述步骤可看出,数据挖掘牵涉了大量的准备工作与规划工作,事实上许多专家都认为整套数据挖掘的过程中,有80%的时间和精力是花费在数据预处理阶段,其中包括数据的净化、数据格式转换、变量整合,以及数据表的链接。可见,在进行数据挖掘技术的分析之前,还有许多准备工作要完成。 |
zan
|