QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4207|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |正序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结
    9 _9 A5 L2 W: C6 U1 a% v数学建模大作业中涉及到的知识点总结:: n! S+ @0 W# x3 t

    : ^3 C5 j  I# k9 S  Y0 F7 U(1)写作缘由1 C: g6 }# K) F; y* G$ s
    (2)统计描述:# J/ L: \: h; v
    追加用excel 做频率统计
    $ A' O' Y- C* j(3)相关分析(点二列相关 )
    ; ]# x. F! k* X+ n: x) c" S! @(4)回归分析0 q: E4 U! I1 P0 J
    (5)特征选择和数据预处理; ?# T7 j- u9 ~# }) K' _
    (6)缺失值的填充
    ( }* k: H% o2 ?7 C+ O* m! Y(7)文档编辑的一些技巧
    ' g0 I; g% P7 i9 r' Y2 [(8)团队合作的一些心得7 u# E* d$ H4 p
    (1)写作缘由6 U4 X) }: D/ Z

      A$ @# T9 D0 K2 J3 c在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下: R2 C# [- K. H& N
    5 _2 S' K& n. w3 E
    (2)统计描述:2 p. M; W3 i/ w! I) i8 q: ~! y- |

    ; [1 T. R6 W. p1 `! x① 频率统计 ' f- O1 I- z* L5 S) x+ X9 Z
    ② 中位数
    ( h! h  T* C; c7 C+ Q8 d- [③ 众数 / e0 f- R: d" f; E5 W' o
    ④ 平均数 & d& z% F7 ]/ j9 g1 z3 @
    ⑤ 方差
    6 m. ^# {7 K- @- h+ Z# u⑥ 标准差 4 m& @; i  }! I, l" q
    用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
    9 v" M5 `/ O" N6 b* m  v* O. {9 f, `5 X

    - p  ]% J% G! W  G追加用excel 做频率统计
    ; ?  j4 M$ m; W, y+ ?" G, J; c4 i$ H. x( V
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html) C8 [; d8 v' M1 I
    # g& t+ k( ?) W" `, |
    (3)相关分析(点二列相关 )
    + M  [3 x% O! ^+ Y" n1 q
    7 U2 s8 G9 |1 q. h2 S8 i; K0 j& G% e# N8 p$ |8 g
    / Y+ ^% ~9 B/ [- E* Z: L
      j: X; Z8 h8 i

    . b* c1 C3 |" _1 w% W! \; I(4)回归分析
    $ p9 q: w2 p* s% ?" \6 x, v  O* Y6 z" z$ C3 D2 z% n) Q/ f
    Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
      Z. x0 b% ~1 R2 a0 |
    8 I8 t3 B. ^4 R- @因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。$ B- u/ m7 V! u
    # J3 g/ h8 @$ v9 F5 m
    回归分析一般有这几个操作: 4 F+ i2 w8 f# [  _- `
    ① 设置筛选条件,刷选数据集 valid $ w9 [, R, d  l

    ! `$ T8 f1 G, e- g8 P+ r2 F
    * o- D" t: u: n- J; R; N
    7 h& I0 R* e, q4 q, V2 h9 t② 模型拟合度检验
    7 q$ @, k1 B6 U- O7 n
    0 w8 r- g8 s* |: }( t: Y( N4 d, g2 D5 F; a1 ~! e) Y! R
      m4 A3 h1 F0 L( H
    ③ 预测的模型参数
    ( b% L% V# ~" }; u 4 x# ^) g" d) g! [& {9 l9 P
    ④ 预测结果,准确率
    8 @1 t! k5 F2 F- G4 P' C% J, Q; {- L; w7 z3 l0 Z5 B( W
    + G, G( E6 M0 {/ y% [# x
    ! B! ]( v. `3 z

    2 N) H- r; r4 _; a$ @; P* f0 B(5)特征选择和数据预处理
    ! S7 [1 M( g3 t% ^
    ; Z( y9 a' M& N- W# W# h$ a- ~6 T3 R特征选择,主要是gzh的想法
    $ k. M, v; J% G% j5 x- R/ g& w- \特征筛选的思路:
    2 m8 B: G1 }# c1 |1 T3 k分类变量用1 2 3 4 离散值
    . x7 a. S6 A5 E对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 " G2 g8 R5 t, k! v9 q
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值( k7 F" J+ m0 J. V& Z2 O

    / {/ Z' D* m, |( Q+ A注意了:
    : P/ _* q& x: p! K2 u' n2 E筛选特征的时候,重复性要考虑、缺失值要考虑8 e. X- K% r  @" {4 f

    - _+ d+ Y, i# Q7 |(6)缺失值的填充
    ; p1 d( e7 W0 @9 u/ L3 R
    * b& s  k1 Y- f, |. B
    & K/ k* l8 S" G: {. _* C2 ^# m
    0 w  q7 h9 O  Q3 O(7)文档编辑的一些技巧
    % K9 e; d& ~8 @9 _/ f- |& I) K7 F9 D3 z
    https://blog.csdn.net/qq_26769591/article/details/808488412 `, X6 k) q! b# W$ e- Y
      H6 J- U3 @, N
    (8)团队合作的一些心得, Q$ g& d9 X7 a4 W- |

    . l) \/ t5 R9 h& P1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 " D& Q5 D4 Z9 }# M# n
    2.不会乱 不会重复做功 不会丢失工作 5 V/ {6 P! x  v7 h
    3.经验丰富 总能拿出一种解决方案   h" M  L' M  Z3 [" Z
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
    & K# x1 g2 k* a4 N4 g- ~8 R9 W5.大致方向总是不差 错也只是参数不是思路 不是算法
    5 w# X+ M: X: O  i5 C7 l6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
    9 P* u; z$ h( [/ l$ C  k; i+ |7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
    ( Y& N; D: E4 ?  e: Z1 V. R---------------------
    2 X3 D+ ~) g( J" c* O) a- p作者:-英击长空-
    / _# }$ h5 f. w; O8 d来源:CSDN
    + \4 \3 A2 ^5 P2 E+ o( B原文:https://blog.csdn.net/qq_26769591/article/details/80840673
    % @8 U$ Y  U* Z0 A+ ]7 k9 K$ z2 Q% a% p

    : f0 q! z2 D' m1 d; U" c' P$ E
    : b+ }# b0 B. T0 G" F
    0 |2 W! {& a6 M7 K7 R

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-6 18:56 , Processed in 0.410812 second(s), 59 queries .

    回顶部