QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3036|回复: 0
打印 上一主题 下一主题

数据挖掘建模过程

[复制链接]
字体大小: 正常 放大
浅夏110 实名认证       

542

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2020-11-14 17:15
  • 签到天数: 74 天

    [LV.6]常住居民II

    邮箱绑定达人

    群组2019美赛冲刺课程

    群组站长地区赛培训

    群组2019考研数学 桃子老师

    群组2018教师培训(呼伦贝

    群组2019考研数学 站长系列

    跳转到指定楼层
    1#
    发表于 2018-11-2 09:13 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta |邮箱已经成功绑定
    一、数据挖掘(Data Mining,DM),又称为数据库中的知识发现(Knowledge Discover in Database,KDD),决策支持过程,主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,分析、归纳、推理,挖掘潜在的模式,帮助决策者调整市场策略,减少风险,做出正确决策。& J, H4 \- s8 I0 \& w  h

    ( Y: C7 y+ M/ K3 ?知识发现的的三个阶段:1、准备数据; 2、数据挖掘;  3、结果表达和解释! o- A1 c! H' C0 y
    : t$ k9 |; ^$ w) Q! J
    最著名的数据挖掘标准流程:CRISP-DM8 h- w! N& N1 t+ t3 l
    # ^9 V: B" Z  y0 t
    全称为跨行业数据挖掘标准流程,分为6个阶段:业务理解、数据理解、数据准备、建模、评估、发布
    ' R6 E( Z1 o. Y4 ?
    ) ~5 R% R8 C/ y* q7 M0 V! j(1) 业务理解:分析需求、初步收集数据和指标* A, ]) M* M' F$ |6 T

    & _) X. q* N: @6 Z8 q3 R6 O(2)数据理解:理解各个数据字段的含义所记录的业务信息。% m9 d' I& E3 J& f

    - P  i1 J( k- {4 b# L* _( M(3)数据准备:数据清洗、提出、转换,提取样本,清除噪声,处理缺失数据,数据标准化。
    . x% v( w3 U# e9 C6 x; W& e0 |: {5 ]# z! {3 d
    (4)建模:参数调整使模型最优。* w/ S0 k& A% u
    * h* H1 D8 M2 M0 z3 t# X
    (5)评估:评估、挑选最佳模型。
    $ y4 z# {+ l- d7 x5 r5 y. L6 s. z( Q$ u( Q
    (6)发布:将模型运用于实践,跟踪反馈,了解效果,后期优化。0 J5 `  L& j& j6 n' y
    4 n3 D$ M! p; e
    SAS数据挖掘方**:SEMMA; \& a! J# }( F% ], ~# p5 C) u

    ( P7 O7 u. p  U" a* _5 E: W1 k/ F(1)Sample-数据取样5 q' e6 M# n# k& Q3 U

    2 C0 ]& X: r6 x3 H8 Q9 b(2)Explore-数据探索' Y7 c3 e* s0 Z! f/ G5 G2 t5 h

    9 E4 n5 Q5 b7 {% j/ Y- h2 i(3)Modify-数据修正
    & |/ U7 `' C! ~! o4 ^: X( G  b! ?, W( L
    (4)Model-建模
    / V$ i- A6 ^3 N6 w* w. Z$ p
    ( a0 w; V6 Q' t. J6 e: T(5)Assess-评估
    3 s9 v% J; U1 Y" p2 |1 q
    0 a4 F  [& M* q# ~- c. ~
    ; d& \$ N; \6 G# o二、经验谈
    9 \8 e( B: K$ ~% l7 ]* H  i4 h5 r& f8 M8 }( u8 {/ S& J5 t
    (1)明确要解决的问题
    - n- H& |' E+ e" ~4 o" P, n, S$ H( ^7 c# }
    (2)确定最终评估标准* J5 q6 F% f$ S

    4 y+ X0 y* I$ |2 y* x9 ?/ E: `(3)设定期望方案( b" C0 c- |$ z" p0 z+ e4 {

    $ n  ^" f% X+ r7 P- g4 u' g(4)简单项目到复杂项目
    1 r5 r6 p* @: P. p7 w
      p  D" F8 Z" p" ^2 o* s+ m0 P(5)团队合作,协调沟通4 f6 f5 U' ?4 d8 h; ]$ c
    # ]% h; v$ [/ Q9 \/ K; Q% U4 O1 i+ X
    (6)避免陷入数据垃圾
    0 ]* D& L5 f* P6 E3 U) h! _% u+ O" b+ b2 g3 O3 W

    8 x; w) F( }5 x! o  Z
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-14 02:50 , Processed in 0.520540 second(s), 50 queries .

    回顶部