QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3066|回复: 0
打印 上一主题 下一主题

数据挖掘建模过程

[复制链接]
字体大小: 正常 放大
浅夏110 实名认证       

542

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2020-11-14 17:15
  • 签到天数: 74 天

    [LV.6]常住居民II

    邮箱绑定达人

    群组2019美赛冲刺课程

    群组站长地区赛培训

    群组2019考研数学 桃子老师

    群组2018教师培训(呼伦贝

    群组2019考研数学 站长系列

    跳转到指定楼层
    1#
    发表于 2018-11-2 09:13 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta |邮箱已经成功绑定
    一、数据挖掘(Data Mining,DM),又称为数据库中的知识发现(Knowledge Discover in Database,KDD),决策支持过程,主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,分析、归纳、推理,挖掘潜在的模式,帮助决策者调整市场策略,减少风险,做出正确决策。
    * r  t( A$ S1 i* g1 S& ?$ q* j! n" x+ w: f8 a3 Q( K( D/ ]
    知识发现的的三个阶段:1、准备数据; 2、数据挖掘;  3、结果表达和解释9 a/ `, Y9 O( q* S* ^

    0 F2 B* |  x4 ^0 j最著名的数据挖掘标准流程:CRISP-DM- ]. \) z3 R3 w( U' z4 s

    * e. L1 l0 M# q( s6 h- f全称为跨行业数据挖掘标准流程,分为6个阶段:业务理解、数据理解、数据准备、建模、评估、发布8 a. u, n( |' I

    0 u. l1 k  e3 d# B9 b( P7 J! s(1) 业务理解:分析需求、初步收集数据和指标
    0 U/ j$ S- w, ]; j8 v  F8 k
    8 E" ~& ^" c. T% b( t4 ?(2)数据理解:理解各个数据字段的含义所记录的业务信息。/ w6 T6 s! o3 m, T1 q2 \' E

    . w" p  Q- H6 {(3)数据准备:数据清洗、提出、转换,提取样本,清除噪声,处理缺失数据,数据标准化。
    5 Y/ r. x! u0 _8 R$ D7 F- v! Y6 y2 n1 l8 k$ D  ?
    (4)建模:参数调整使模型最优。# V6 A; F& t2 t

    6 H$ K# X2 f" \% E5 H, S, e2 ?0 o4 h' J+ A(5)评估:评估、挑选最佳模型。
    ! T- w0 Y0 y) F/ I/ `4 s# [* f6 G) b* `7 s) O) M8 r& t
    (6)发布:将模型运用于实践,跟踪反馈,了解效果,后期优化。8 i6 h" r; m0 i( w! M

    * e$ M7 e% R2 u( Q7 DSAS数据挖掘方**:SEMMA, F. b& o9 f2 @) c

    , O& o* s* s$ f  l4 g5 \(1)Sample-数据取样
    ! W  e) h8 @1 w" O/ q# ^5 G5 v4 }  ~1 R% L( A, j0 h% K0 v* d) Z
    (2)Explore-数据探索7 H- U6 k9 v) q3 {
    , a/ L+ P7 H/ Q. \3 W
    (3)Modify-数据修正. ]* Q% \- @$ f, w
    1 ?$ I! Q+ [6 t5 o" K$ X+ z, x
    (4)Model-建模
    ; i# w; s. ]7 a6 q: }: e
    # ?; t5 w* y% z" i(5)Assess-评估8 q" f; l! b; L) c( w1 e5 y

    6 M- Y8 T- i, Z' \: b, ^1 B6 m5 q/ e& [: ]0 S1 H+ S
    二、经验谈. S$ }+ u  e! F3 I6 ]0 K
    / G1 M- ~0 ?: @' ~
    (1)明确要解决的问题
    . N# Y; i/ Q: `. @. M
    7 h, M$ f" k# Q; T9 i(2)确定最终评估标准
    ' O- o; ?, c& x' W' b2 c: l' h& H. }9 v0 _! E) D
    (3)设定期望方案. l: ~" A2 d8 o5 X+ z% F
      o$ D! q% r0 e' ^3 T
    (4)简单项目到复杂项目4 R( |0 G& P2 p: X; Q
    0 T. B) s0 @; T( d- C2 z
    (5)团队合作,协调沟通9 f0 V7 [4 q; Z1 f4 J" U, M
    % m' p! P- J. l$ o2 w5 ^
    (6)避免陷入数据垃圾
    * g1 k$ ^# T# V& V
    ' A# ^; e$ v# v3 u4 r  R8 N" H# Z. }
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-8 10:39 , Processed in 0.619413 second(s), 51 queries .

    回顶部