- 在线时间
- 791 小时
- 最后登录
- 2022-11-28
- 注册时间
- 2017-6-12
- 听众数
- 15
- 收听数
- 0
- 能力
- 120 分
- 体力
- 36344 点
- 威望
- 11 点
- 阅读权限
- 255
- 积分
- 13864
- 相册
- 0
- 日志
- 0
- 记录
- 1
- 帖子
- 616
- 主题
- 542
- 精华
- 12
- 分享
- 0
- 好友
- 225
TA的每日心情 | 开心 2020-11-14 17:15 |
|---|
签到天数: 74 天 [LV.6]常住居民II
 群组: 2019美赛冲刺课程 群组: 站长地区赛培训 群组: 2019考研数学 桃子老师 群组: 2018教师培训(呼伦贝 群组: 2019考研数学 站长系列 |
一、数据挖掘(Data Mining,DM),又称为数据库中的知识发现(Knowledge Discover in Database,KDD),决策支持过程,主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,分析、归纳、推理,挖掘潜在的模式,帮助决策者调整市场策略,减少风险,做出正确决策。6 d. V- ?! ^5 ^! V
. C+ |- c3 D) Z7 W
知识发现的的三个阶段:1、准备数据; 2、数据挖掘; 3、结果表达和解释
# `0 J$ ?' a2 R0 f+ A; K3 F1 _6 d& ?% g9 D/ V6 S. B
最著名的数据挖掘标准流程:CRISP-DM" p9 b5 u; U1 j' [, z, {% {# x
0 x$ ^8 R" P" i4 T- M9 p全称为跨行业数据挖掘标准流程,分为6个阶段:业务理解、数据理解、数据准备、建模、评估、发布
- Z9 R% q1 q3 R2 l9 z# {% a8 S+ R" d! |) P( F; V5 p% A0 g' Z
(1) 业务理解:分析需求、初步收集数据和指标6 K6 J& h0 P* G! F3 M
& d5 F7 l7 b% O, Y ~, ^; f+ M(2)数据理解:理解各个数据字段的含义所记录的业务信息。
, A5 S% t+ I, `
: O# w O0 H# l; {* ](3)数据准备:数据清洗、提出、转换,提取样本,清除噪声,处理缺失数据,数据标准化。' B0 R2 T( M. G0 P' F
$ {) S: i4 F' `' \& y
(4)建模:参数调整使模型最优。
. _- Y' k( e. e% W* x5 E' d4 ~: V; x$ I) |
(5)评估:评估、挑选最佳模型。% @9 _7 k; j0 l6 D: h- k9 r0 I
3 i8 A0 p3 m6 G. J* N. Q) J j(6)发布:将模型运用于实践,跟踪反馈,了解效果,后期优化。# Q4 u, o( {: c1 Q/ c; \ V5 ~
* Q7 g, f) J" o. P5 e- A9 C) F
SAS数据挖掘方**:SEMMA. A1 t. C7 t: z% m/ }
% w1 ?/ X# H* s# C4 U9 Y(1)Sample-数据取样
' M1 t8 Q u( r2 }/ x5 J8 B: S0 ?
# W P9 M$ C9 Z; _4 L# p(2)Explore-数据探索2 K1 i1 Z, `/ [* U1 i; Y# h
. h( W. b1 ~, T! p! s1 \
(3)Modify-数据修正
) C X/ @& T8 {/ A& \ p! ^ B% a8 ~" h X; e; |/ k
(4)Model-建模
6 ?8 ]2 b0 |' y, s" x7 W7 c1 F: t% m% D% K: H* D4 ?7 T' |; p
(5)Assess-评估4 H: b( [, d4 q7 l
( K% C& D% x* z# L* V
n: z" U% ?# b+ y0 Z ?二、经验谈9 g( F6 y1 N0 U# I5 e
% ]/ N" [5 S4 q
(1)明确要解决的问题$ [9 \! }/ A* E
( t$ B: t0 D8 _; m; T
(2)确定最终评估标准' o+ j. K0 D( i' c! x3 l/ u
; g1 ~' X' U* F2 W+ F(3)设定期望方案
1 }5 T% B9 i5 C( M/ D) M- h, B8 b9 r& s& C" k6 J& p
(4)简单项目到复杂项目
/ {: G- f! L5 x6 g5 p' e! e8 \" A! v" [. r) m9 Y) x
(5)团队合作,协调沟通
( b* }# R W! O6 ]# B* \* p, G8 |- D1 u0 f
(6)避免陷入数据垃圾
6 H6 s$ F$ q! y
! N1 T4 p0 \5 }
" d, w: I! B9 v* @6 Z |
zan
|