QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3067|回复: 0
打印 上一主题 下一主题

数据挖掘建模过程

[复制链接]
字体大小: 正常 放大
浅夏110 实名认证       

542

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2020-11-14 17:15
  • 签到天数: 74 天

    [LV.6]常住居民II

    邮箱绑定达人

    群组2019美赛冲刺课程

    群组站长地区赛培训

    群组2019考研数学 桃子老师

    群组2018教师培训(呼伦贝

    群组2019考研数学 站长系列

    跳转到指定楼层
    1#
    发表于 2018-11-2 09:13 |只看该作者 |正序浏览
    |招呼Ta 关注Ta |邮箱已经成功绑定
    一、数据挖掘(Data Mining,DM),又称为数据库中的知识发现(Knowledge Discover in Database,KDD),决策支持过程,主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,分析、归纳、推理,挖掘潜在的模式,帮助决策者调整市场策略,减少风险,做出正确决策。! ]) {. ?6 Y6 h2 W0 K
    : S4 v1 b) ~# h) ^$ o
    知识发现的的三个阶段:1、准备数据; 2、数据挖掘;  3、结果表达和解释1 v- h5 P! G8 R2 P( {/ |% @. b

    $ U- S/ `' d! z7 l& o最著名的数据挖掘标准流程:CRISP-DM
    - U" p1 {5 \: W, ^. _; p# g" Q+ {5 k7 ]2 D, `  A: b* H; v. H
    全称为跨行业数据挖掘标准流程,分为6个阶段:业务理解、数据理解、数据准备、建模、评估、发布
    5 r4 H/ l! F( j+ C
    / {& x/ j9 `* Q/ J6 s& b(1) 业务理解:分析需求、初步收集数据和指标
    2 E9 Y* K$ H2 e8 r" E6 `6 M4 s3 m5 O/ O- m
    (2)数据理解:理解各个数据字段的含义所记录的业务信息。
    . q' [1 j# W" D2 W% I& T7 K
    / G( J6 C9 I& d! A2 n(3)数据准备:数据清洗、提出、转换,提取样本,清除噪声,处理缺失数据,数据标准化。6 C, S4 F% i- `

    0 H" N# N/ v$ f; J/ m4 _3 x) i(4)建模:参数调整使模型最优。% k9 I$ Y+ d' q* V# z9 D
    + t* M  o& a6 f
    (5)评估:评估、挑选最佳模型。
    % l& z5 q8 \; `" s( I  [# v" x* f' e5 F
    (6)发布:将模型运用于实践,跟踪反馈,了解效果,后期优化。& @5 F7 Q8 B2 r( T
    6 M5 |" T3 ^; A
    SAS数据挖掘方**:SEMMA
    1 D! k* ]2 t$ h2 w
    , [. ~; w- G7 q% C: T6 N- J2 L(1)Sample-数据取样
    7 o) k4 |- Z& r# Z+ g/ B  ?* s
    % N+ {/ y; V% S(2)Explore-数据探索
    ) ^% E# B" o' e( V2 e
    8 m7 V( V$ D8 Q9 ]" V0 n(3)Modify-数据修正
    . j8 V- k0 y' W, r! l
    ! X3 r/ ^) V. s1 A0 ?1 T(4)Model-建模0 D+ c+ d# j- @$ X
    % E  o2 v/ ~9 N. ]+ N
    (5)Assess-评估
    # z6 O# `$ w3 {3 @3 y7 Y
      Y; Y5 C" d: g" ?/ \0 k' ~* E. P3 W3 L1 A5 N; V
    二、经验谈
    % O; n9 ~6 |3 k2 Z
    * `4 n# z- o3 d( l- e" I(1)明确要解决的问题7 n) {+ U7 g6 y! s1 W& y
    : d3 H9 ]+ U8 p( X. h' G
    (2)确定最终评估标准
    4 a1 ]* E* V$ m% J" m4 _; v: }7 w4 [# S) [' j" [0 J3 {3 }6 T1 g
    (3)设定期望方案  e, x/ Q- R+ u! y# @

    0 Z/ i0 H1 Z. i5 `" H* X(4)简单项目到复杂项目
    . O- E( ~4 Y) x2 f2 b$ f$ d$ j6 C3 ?& J) L. @: o
    (5)团队合作,协调沟通
    . b  p' f  \$ i8 m2 G# h/ P( S8 o" L) s
    (6)避免陷入数据垃圾. s8 X0 n6 q' S2 U

    + i' n! |6 r5 [0 h
    2 S* |3 ]4 {& |8 e9 ^1 P2 q. V0 w
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-8 11:49 , Processed in 0.418499 second(s), 51 queries .

    回顶部