QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1800|回复: 0
打印 上一主题 下一主题

数据挖掘建模过程

[复制链接]
字体大小: 正常 放大
浅夏110 实名认证       

542

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2020-11-14 17:15
  • 签到天数: 74 天

    [LV.6]常住居民II

    邮箱绑定达人

    群组2019美赛冲刺课程

    群组站长地区赛培训

    群组2019考研数学 桃子老师

    群组2018教师培训(呼伦贝

    群组2019考研数学 站长系列

    跳转到指定楼层
    1#
    发表于 2018-11-2 09:13 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta |邮箱已经成功绑定
    一、数据挖掘(Data Mining,DM),又称为数据库中的知识发现(Knowledge Discover in Database,KDD),决策支持过程,主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,分析、归纳、推理,挖掘潜在的模式,帮助决策者调整市场策略,减少风险,做出正确决策。
    2 Q7 Q* {. p: x5 _$ C2 ]. Y- M% E, ?; A
    ' V* T) h  D" ^知识发现的的三个阶段:1、准备数据; 2、数据挖掘;  3、结果表达和解释
      [& q6 x) ^) s) R' w$ ~* W" L, Z9 H0 E
    最著名的数据挖掘标准流程:CRISP-DM  C' Y/ N! c% |
    / _( m: o( E1 H' P; h6 E# a
    全称为跨行业数据挖掘标准流程,分为6个阶段:业务理解、数据理解、数据准备、建模、评估、发布
    : `% S! y9 D( e8 X
    ' ?6 ~% V2 Z' ~! S- t6 `(1) 业务理解:分析需求、初步收集数据和指标
    % U# J+ t' Y; U* `8 Q
    9 t; h2 x! A7 D8 o(2)数据理解:理解各个数据字段的含义所记录的业务信息。4 D1 l7 c1 S* T  g( |+ p

    & ~7 M9 [' B8 I(3)数据准备:数据清洗、提出、转换,提取样本,清除噪声,处理缺失数据,数据标准化。
    ; k1 v$ G) D0 d) o* O6 w0 Q4 m
    4 d- \3 J) Q" t6 w4 m, j6 D/ m(4)建模:参数调整使模型最优。
    6 }! D5 }- {) |& z
    : j# I0 Q# J) `5 i# _9 U(5)评估:评估、挑选最佳模型。5 c' L" x4 ]) N4 G4 C& ^" V8 U

    - E2 G' g# [* Z& ~" J' w$ O(6)发布:将模型运用于实践,跟踪反馈,了解效果,后期优化。
    . R. [+ r, E  {0 Z# X8 j+ e! Q
    5 Z) C  ]4 i/ f! l/ ?: aSAS数据挖掘方**:SEMMA$ N$ ~4 n) i( c9 ]$ {2 G
    5 ^( \: y& d* a/ s
    (1)Sample-数据取样
    % t. q& ~9 j( x5 _4 Z. }9 C" q& ~5 I* d* A0 ]
    (2)Explore-数据探索4 V9 }% ?! q5 Z+ T  T6 i
    ; ?+ i" r2 }- R' x# Z
    (3)Modify-数据修正2 l3 F0 _, [  N$ m2 f0 Y7 j% `- s2 s

    ; I* s9 u' a/ l1 O; g: _4 L0 w- ?1 T(4)Model-建模
    6 q* c5 g" E2 _- Q8 ?8 f& Q; C  i7 J" Y  M) c
    (5)Assess-评估
    - s+ L1 Y/ m9 j" K% R( y3 I0 }' y9 Q3 l; i6 p
    , U' l/ H7 N: q, I# z2 e
    二、经验谈- J7 }# y: D( l: ?' |

    0 e( X6 s  A: H9 X(1)明确要解决的问题0 l: r. u$ K2 X4 q6 `; v" T

    1 D; O' L' A) F(2)确定最终评估标准) ^* H4 B& |9 m3 m& S3 `3 m; W. w& u0 M

    . {# l- V$ X) F6 h(3)设定期望方案
    , Q* t( j8 x( b) l0 D0 a: `  F7 G' Q5 A% d, n' D7 x4 y1 `& _
    (4)简单项目到复杂项目! n1 y) O% N* j1 X/ U4 q

    4 R; N) a- I3 v  |; E! x(5)团队合作,协调沟通
    ( w: V$ L% t8 S( B" B4 w
    1 w2 e* r, q8 W8 a(6)避免陷入数据垃圾
    6 r$ F" K) h) y( M
    & O% }5 g; T# p9 |9 O
    . O; X! B' Z& t, W
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2024-5-1 01:29 , Processed in 0.286443 second(s), 50 queries .

    回顶部