QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3072|回复: 0
打印 上一主题 下一主题

数据挖掘建模过程

[复制链接]
字体大小: 正常 放大
浅夏110 实名认证       

542

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2020-11-14 17:15
  • 签到天数: 74 天

    [LV.6]常住居民II

    邮箱绑定达人

    群组2019美赛冲刺课程

    群组站长地区赛培训

    群组2019考研数学 桃子老师

    群组2018教师培训(呼伦贝

    群组2019考研数学 站长系列

    跳转到指定楼层
    1#
    发表于 2018-11-2 09:13 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta |邮箱已经成功绑定
    一、数据挖掘(Data Mining,DM),又称为数据库中的知识发现(Knowledge Discover in Database,KDD),决策支持过程,主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,分析、归纳、推理,挖掘潜在的模式,帮助决策者调整市场策略,减少风险,做出正确决策。: a9 C& E6 w1 \+ R

    2 p- m5 @' _( E知识发现的的三个阶段:1、准备数据; 2、数据挖掘;  3、结果表达和解释
    4 _( Y" B% D8 {, }* {
    + p1 O4 \" F. O1 B' F4 y* m最著名的数据挖掘标准流程:CRISP-DM
    9 k7 m5 h+ Y4 b1 L: U& Z' v6 a( X$ p* w0 }4 S, u: p3 W
    全称为跨行业数据挖掘标准流程,分为6个阶段:业务理解、数据理解、数据准备、建模、评估、发布4 O  m) \. |7 q' D  D  |3 S

    ) a- Y1 E. s4 W% `$ T' g(1) 业务理解:分析需求、初步收集数据和指标
    , S1 a$ j# T7 R6 e  y" s& I, t! a
    9 U5 V& t* v, V: c. m* h3 n(2)数据理解:理解各个数据字段的含义所记录的业务信息。
    ( D+ {4 N7 C+ n( Z! H4 J, Z+ q# C4 n
    (3)数据准备:数据清洗、提出、转换,提取样本,清除噪声,处理缺失数据,数据标准化。
    1 ~- F1 k7 l$ W- Q, A% D" r. S2 J- x( n4 c
    (4)建模:参数调整使模型最优。8 D% c4 }, S2 X* A

    3 Z# ~+ x7 H$ h. ^! F& f(5)评估:评估、挑选最佳模型。
    9 Y" }$ h6 s; A% [; K) a
    % \1 V5 B# a$ X(6)发布:将模型运用于实践,跟踪反馈,了解效果,后期优化。2 ?0 V2 V; m: _3 x/ ~

    ) _% g: a1 s, r2 C+ K  sSAS数据挖掘方**:SEMMA
    : q/ e6 ]/ ]- W
    # I# m( e  n6 d* L5 ~# a(1)Sample-数据取样' C7 A2 @' }' }' [' U# d
    8 [$ R1 Y- Q- H8 Z
    (2)Explore-数据探索& p' A( }9 Q2 u4 _5 V, f! q

    . V8 {9 G8 A: X0 ^+ x. y7 u(3)Modify-数据修正1 ?. l: D3 P  u' R! L( j
    + D7 E5 I; U4 w" l: `( @# J
    (4)Model-建模6 Z3 z  B( j3 k8 s8 V
    & I; \+ x$ |9 s! A( y. E
    (5)Assess-评估+ k5 ]# ?- a! e9 z8 L: Q

    ( a) ?  W6 N$ _6 P# B2 D9 t7 R# R# {9 T# E; G  D$ I
    二、经验谈2 ^1 u% V2 Z9 q* w( H; p7 X
    ( m5 M: P1 H. W# Q& n+ P
    (1)明确要解决的问题- p1 V5 f7 l& n8 d1 O+ T) ]
    5 ]6 m/ x$ U4 {0 u- t/ |
    (2)确定最终评估标准
    7 J, J4 r' l6 u" I/ q0 z! d8 y  V  s3 f  f( J: @& ?5 _
    (3)设定期望方案- _& J# u, K6 H
    + ?. Z. T: z$ J
    (4)简单项目到复杂项目
    : I+ h; m) t1 l' C  ?
    8 U2 E; k; m' s% [0 l  c(5)团队合作,协调沟通, e! x% X. j" `; U5 L# ]

    , _: F, H2 l) a! D8 m# u(6)避免陷入数据垃圾$ h( d! V& [. M/ P: L. {2 P5 a% _

    ' n4 Z+ v# ?/ V+ V) {# W2 T! X- X4 ?( g9 i+ y$ b
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-8 19:44 , Processed in 0.380381 second(s), 50 queries .

    回顶部