QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3069|回复: 0
打印 上一主题 下一主题

数据挖掘建模过程

[复制链接]
字体大小: 正常 放大
浅夏110 实名认证       

542

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2020-11-14 17:15
  • 签到天数: 74 天

    [LV.6]常住居民II

    邮箱绑定达人

    群组2019美赛冲刺课程

    群组站长地区赛培训

    群组2019考研数学 桃子老师

    群组2018教师培训(呼伦贝

    群组2019考研数学 站长系列

    跳转到指定楼层
    1#
    发表于 2018-11-2 09:13 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta |邮箱已经成功绑定
    一、数据挖掘(Data Mining,DM),又称为数据库中的知识发现(Knowledge Discover in Database,KDD),决策支持过程,主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,分析、归纳、推理,挖掘潜在的模式,帮助决策者调整市场策略,减少风险,做出正确决策。: U) Z  {4 L9 ^

    1 N- V* N) r: ~9 p. |+ P4 P- R知识发现的的三个阶段:1、准备数据; 2、数据挖掘;  3、结果表达和解释
    * y7 O5 [+ c# d5 [- z6 @
    1 p0 M0 W$ z$ l9 p最著名的数据挖掘标准流程:CRISP-DM3 X, n# V5 X4 E  o) h
    7 f, d3 c  d" O
    全称为跨行业数据挖掘标准流程,分为6个阶段:业务理解、数据理解、数据准备、建模、评估、发布7 D. |# R# c6 d8 W4 S% ~
    & q5 ~$ ?. U- w1 ~0 u; B- b3 }, ]3 G) v
    (1) 业务理解:分析需求、初步收集数据和指标
    " V1 Q6 Z  G% f0 w( R  c6 R
    $ `$ F) i/ |  E% W( B4 m(2)数据理解:理解各个数据字段的含义所记录的业务信息。' U7 G: v- x3 A$ l% W  L" j

    8 o' S9 x% ~: I4 Q% t/ b(3)数据准备:数据清洗、提出、转换,提取样本,清除噪声,处理缺失数据,数据标准化。) D* h9 P: a' U7 o. q
    8 g; a8 ]* T  T6 a2 M' J2 A% m
    (4)建模:参数调整使模型最优。* q* Q+ \! v: N, j* ?
    . J% Q2 y3 K) U  L  C  ~2 J) [+ r
    (5)评估:评估、挑选最佳模型。$ T' E7 Z- V2 H/ R. e+ Y0 H
    5 ^: e' b2 u) e( [3 a
    (6)发布:将模型运用于实践,跟踪反馈,了解效果,后期优化。
    2 C5 ]& W. J7 n0 ]( v2 S" v8 |* a: E
    & R: E. D/ }, G# |  D) r/ Z7 oSAS数据挖掘方**:SEMMA
    8 K! R7 A7 L/ r- M$ U7 V* l$ s8 _1 e, h6 e
    (1)Sample-数据取样1 o' ?6 J: Z1 a3 V
    / {' c  t$ Z) A+ A+ z
    (2)Explore-数据探索
    5 F) i0 |& E5 v% B
    8 U1 U$ `( R/ ^& w1 c" p) l7 G(3)Modify-数据修正& o9 I- s* m; ]0 _9 I" x0 K: j! B

    ( f& `; w4 F, c; k* m(4)Model-建模' `% w9 ?- b% p" R0 Q4 N+ d( Q

    5 V+ c- c& ^* @# k8 G! _. Y(5)Assess-评估* j8 K. C- ]+ X" a$ c7 U8 U2 z
    ) z; U1 k% m- v! B

    8 H. H( O$ }& v二、经验谈% m, T# {/ n* y" s$ I

    % o8 t9 Z: V' O2 C. K) y3 K* M(1)明确要解决的问题
    2 K8 |0 Q6 w& h5 E2 \* U, `( @: |* Y& D
    (2)确定最终评估标准
    : G6 o# A; k* X5 _8 e3 \5 ~) g' f0 g- m
    (3)设定期望方案! p9 ]$ F" O# {8 O% l

    : \" ], j$ x/ A3 }; i(4)简单项目到复杂项目2 D7 m) b9 f! L# B  @7 ^! [

    2 q" e$ l2 _! k/ }* W(5)团队合作,协调沟通" J% {7 f: p0 \3 _
    * P; E9 ]& [" t/ f) ?' V
    (6)避免陷入数据垃圾
    2 b& u( x1 \* l: u4 p- n7 f5 F
    & w& l  c  n- B0 O& M8 {4 y( s0 }! D6 u3 ?) `
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-8 13:25 , Processed in 0.495942 second(s), 51 queries .

    回顶部