- 在线时间
- 791 小时
- 最后登录
- 2022-11-28
- 注册时间
- 2017-6-12
- 听众数
- 15
- 收听数
- 0
- 能力
- 120 分
- 体力
- 36305 点
- 威望
- 11 点
- 阅读权限
- 255
- 积分
- 13852
- 相册
- 0
- 日志
- 0
- 记录
- 1
- 帖子
- 616
- 主题
- 542
- 精华
- 12
- 分享
- 0
- 好友
- 225
TA的每日心情 | 开心 2020-11-14 17:15 |
|---|
签到天数: 74 天 [LV.6]常住居民II
 群组: 2019美赛冲刺课程 群组: 站长地区赛培训 群组: 2019考研数学 桃子老师 群组: 2018教师培训(呼伦贝 群组: 2019考研数学 站长系列 |
一、数据挖掘(Data Mining,DM),又称为数据库中的知识发现(Knowledge Discover in Database,KDD),决策支持过程,主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,分析、归纳、推理,挖掘潜在的模式,帮助决策者调整市场策略,减少风险,做出正确决策。
; L0 ?8 ^4 e4 R! \7 m" s8 a Y& D7 }0 J( d* c4 t" w1 Q W9 [
知识发现的的三个阶段:1、准备数据; 2、数据挖掘; 3、结果表达和解释9 s/ Q2 _) H) D; A* w7 ?
: s* a7 Z2 S' b* G
最著名的数据挖掘标准流程:CRISP-DM; p4 ^1 _7 s: O N' i3 v
! |% N7 y0 Y7 ?; m b3 O- m全称为跨行业数据挖掘标准流程,分为6个阶段:业务理解、数据理解、数据准备、建模、评估、发布2 M) K! S n/ b6 \! c* {
& T- p8 y. q0 U' x" E# v! g2 S- B
(1) 业务理解:分析需求、初步收集数据和指标
& I8 G7 Y( j" y$ c7 A4 z1 O! |( I! B- t/ L7 T
(2)数据理解:理解各个数据字段的含义所记录的业务信息。
' V H" e0 Z& p) [2 x1 ]5 k7 V+ \) X6 Q% K, z
(3)数据准备:数据清洗、提出、转换,提取样本,清除噪声,处理缺失数据,数据标准化。
8 \/ g: k" p B* a) F/ H
$ B6 e! u$ B" k5 z# w O(4)建模:参数调整使模型最优。 r0 A0 i7 ?" C# Q$ A, v$ h% q
7 [$ _: q1 j% E& o(5)评估:评估、挑选最佳模型。
) ]6 S3 E( B6 |+ b# c( D& v# @2 [+ X" y, f; i; A1 R/ b
(6)发布:将模型运用于实践,跟踪反馈,了解效果,后期优化。
5 W* v. j2 a @* a. d
# ]2 \& k4 Y7 |$ P9 Z" WSAS数据挖掘方**:SEMMA
/ v& E8 u, U1 g$ E1 V
s. K. W* ` L, H8 T. m8 {(1)Sample-数据取样
# a9 ]0 G$ z9 q, |& n( [# F8 Z9 R1 k' m! P ^* F
(2)Explore-数据探索
2 Q* L$ I) r9 }# a( D/ [" u% F. M9 z, {, w! f5 ]: m
(3)Modify-数据修正! A) o2 e8 x' s* e* A
0 v, v* _! M8 [ y9 w8 r
(4)Model-建模
% d' C8 J: o1 c6 D! `1 f1 e0 ^9 Q# p% P5 Q) s$ D5 f; E
(5)Assess-评估8 E9 [4 _8 x- l* s) K# p
% I d6 S7 |4 \$ m+ O5 `; p9 H8 B# t$ A# m( z
二、经验谈
& h( z1 D. L! `, q/ Z; ]/ { s
/ @1 j4 l1 a! S1 m9 P& `2 K4 d(1)明确要解决的问题+ ]) E4 W. ]) A- v3 k
: q: l( }% O, @% H* h7 t
(2)确定最终评估标准
- Z3 ]. d' o# q* {3 z* K. R _7 u4 f! V4 r# L
(3)设定期望方案 S7 h5 B6 P5 D! B* Y% z
/ [/ p) R/ g# v% v4 r
(4)简单项目到复杂项目/ C- V0 c z( m+ l1 D4 y
0 ]% h) c7 J0 @6 e7 S1 s( X! M% }
(5)团队合作,协调沟通+ m; b# x7 l+ I; V7 c
3 J) {- g2 p9 k* J; G* h. N8 T
(6)避免陷入数据垃圾) c$ g& m# o' A9 u4 y+ ~4 D8 e
4 ^( C! |1 ~! l1 W- H( G/ P# d9 d1 _1 v$ y+ P T. Z8 i4 C3 O
|
zan
|