QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3041|回复: 0
打印 上一主题 下一主题

数据挖掘建模过程

[复制链接]
字体大小: 正常 放大
浅夏110 实名认证       

542

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2020-11-14 17:15
  • 签到天数: 74 天

    [LV.6]常住居民II

    邮箱绑定达人

    群组2019美赛冲刺课程

    群组站长地区赛培训

    群组2019考研数学 桃子老师

    群组2018教师培训(呼伦贝

    群组2019考研数学 站长系列

    跳转到指定楼层
    1#
    发表于 2018-11-2 09:13 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta |邮箱已经成功绑定
    一、数据挖掘(Data Mining,DM),又称为数据库中的知识发现(Knowledge Discover in Database,KDD),决策支持过程,主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,分析、归纳、推理,挖掘潜在的模式,帮助决策者调整市场策略,减少风险,做出正确决策。
    2 l) d2 C! ~# z2 N/ R
    2 a* v( m9 D& `知识发现的的三个阶段:1、准备数据; 2、数据挖掘;  3、结果表达和解释
    " `3 {" d; w3 G0 Q1 ]- `# K. w3 o* L$ G2 k4 u6 a" x
    最著名的数据挖掘标准流程:CRISP-DM
    2 x! L& G9 x! j8 [% ~8 q* }5 T
    . t. \) A- l! }( l7 y全称为跨行业数据挖掘标准流程,分为6个阶段:业务理解、数据理解、数据准备、建模、评估、发布
    & o3 V+ p6 c0 ~) l" x0 H9 F1 m; o. x% }7 M( k9 {# n, J
    (1) 业务理解:分析需求、初步收集数据和指标
    ) P0 A( |1 r  S" W& d7 o6 ?2 ~( n5 I
    (2)数据理解:理解各个数据字段的含义所记录的业务信息。
    8 Y( ?8 g1 Z. e; p9 L0 {9 Q+ k0 q6 u
    (3)数据准备:数据清洗、提出、转换,提取样本,清除噪声,处理缺失数据,数据标准化。& D* R* t7 K+ q7 {, |1 H- T

    - u5 t- V. b4 q. I! x(4)建模:参数调整使模型最优。
    1 J5 G: [: e  i: R6 F
    , u8 _3 W+ m' n(5)评估:评估、挑选最佳模型。
    ) G* p: ]3 L3 z# U. ^) x7 U- z- H8 X/ N; `! i
    (6)发布:将模型运用于实践,跟踪反馈,了解效果,后期优化。
    ; V+ A) F7 l) E% @" E. j0 S$ C: N" E7 J- v& J8 P4 s3 Z
    SAS数据挖掘方**:SEMMA
    4 E+ _- R3 t6 B$ r& A: y0 R, V. Q3 }1 D4 x
    (1)Sample-数据取样
    8 j8 |: t; M! A4 X
    ' e: G5 b3 l6 T8 B- `0 J) @3 \(2)Explore-数据探索7 E2 _/ \* V* ~8 X6 R+ S0 [2 k; r$ h
    % ^# _8 m7 Q, c$ \
    (3)Modify-数据修正
    ) f& M" f* k! \: A! x+ d! S
    * }( L$ G  I5 r2 F1 a6 i1 A# s. K(4)Model-建模4 c* ^) B3 W1 b; ^8 h( j
    1 _0 u! M6 g% [0 ^
    (5)Assess-评估
    " x* u0 G4 W6 M
    & I/ D5 C  Y  Y% K  o
    3 x! j1 b2 ^1 {( g% x二、经验谈
    - r: }$ y3 G  A' M( m  C
    / ]8 b8 c3 r4 A(1)明确要解决的问题
    # P# B& a- b2 r% _$ S$ g. @8 N7 z9 b+ _. \7 Y" o3 r
    (2)确定最终评估标准- {5 C% ~. p' \& C
    & ~* R3 d' [% c1 h6 U/ d% i+ o5 p
    (3)设定期望方案# B8 W; t, Q8 S- R

    * \; J: a4 T; e: L& s(4)简单项目到复杂项目
    * f$ q0 w, [; Y. B# Z' s  b8 P. A4 n* }% Y+ c4 e0 h6 }
    (5)团队合作,协调沟通
    5 R8 L5 w, _- n2 ^" P9 N$ n% w* E6 `
    (6)避免陷入数据垃圾
    6 _' V- _* j/ Y+ S9 ?3 E/ h5 N7 w% ]; ?6 r. t6 ]3 N

    ) X, @1 d. R* H% O8 T# l1 k
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-21 10:05 , Processed in 0.401011 second(s), 51 queries .

    回顶部