QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4160|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结# B# O# M- x& J8 a( V0 K% W) ?$ ~
    数学建模大作业中涉及到的知识点总结:  w6 c+ Q$ d. U- M; p' Z) l

    ) _8 l0 H2 H6 P(1)写作缘由9 q: q6 F2 d) g% S: S
    (2)统计描述:
    ( _/ @+ R0 I+ T追加用excel 做频率统计8 ~: \! B3 ^2 D# z7 F" N
    (3)相关分析(点二列相关 )
    & r0 [; h4 ?9 D1 }9 ^; u  o+ c(4)回归分析
    7 z: e( l1 O9 q(5)特征选择和数据预处理6 ~$ h; u* \; s  X
    (6)缺失值的填充& \/ i+ `/ ~# D, B6 K( V3 M- \( }
    (7)文档编辑的一些技巧
    " V9 Q; j1 ~1 Y9 @4 Y, g(8)团队合作的一些心得( }7 A' u9 u: l; |/ v
    (1)写作缘由( {  F1 b4 h. |8 B7 I: ]

    * a: u" u# n5 E: K2 k在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
    * R$ }" A9 \* S, }$ \$ z4 P" D: ?3 [' I* Z. `- g$ F
    (2)统计描述:' Y5 L* t0 `' K# l; D2 M
    , D$ w# X# Y8 v) \
    ① 频率统计
      m+ o& S/ y& R7 C1 E+ `. `4 h② 中位数 8 Z; ^: z2 ]4 V- g+ v9 `3 ?
    ③ 众数 ) {  ?, k/ N7 |
    ④ 平均数
    . k2 s9 w& U; B8 s) a0 J! \⑤ 方差 & r  ?, p$ x1 {" ^- w* r. k
    ⑥ 标准差 / k4 p4 s/ Y  b( Z9 `
    用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 8 ~9 f+ N2 P+ c  H# ?8 H; ^, f' n

    . Z. K0 ^7 `2 u  |2 m7 b: J
    4 G$ L2 x$ ]$ D9 ^5 F( k7 X追加用excel 做频率统计7 \) x( E* x% o/ t, S) C( z
    9 n3 q- y2 T  e# b! r
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html2 q# l7 E) `/ y
    2 j' r' H" p3 p5 [" J5 a5 B
    (3)相关分析(点二列相关 )
    ( u, s6 I  |& v/ n4 I
    5 C) ]4 m, q& B
    , X% b$ G; |/ l/ M' u& I
    2 Y4 d4 q* X" a! o# z$ [$ C* O; ~' k& _' i
    0 H# {4 n, i$ F- B7 z# e
    (4)回归分析/ {% f; m# `+ }- a8 V: n' y" s
    . ~3 L& R+ I% j
    Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。0 \+ F! H' ?0 t$ D
    8 ~( S- j) l, ]5 p5 _0 I
    因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
    8 W2 U) \& E! m/ O4 L* ^5 ~' N  G0 r6 g. I2 \; K3 X; w* y8 Z( ^7 ^7 X" k/ \
    回归分析一般有这几个操作: ; ^2 R6 R# P$ ~# Z3 j
    ① 设置筛选条件,刷选数据集 valid 3 H. d7 a1 V' p: B

    * v  j, B' l0 t! H9 m4 I8 L1 ~$ H% a1 E0 g+ W

    , u5 w, g  m9 v8 p② 模型拟合度检验
    8 `' d) j. l9 d/ i) H6 X5 Y0 L  F / Z) D+ C, F; P" x

    / T4 X" l4 a$ n+ z
    4 E8 _( f' q$ P7 M③ 预测的模型参数
    - I3 }' B6 _2 T7 @" H; E
    & E0 p  a  n! |: r④ 预测结果,准确率& a: X$ k7 r: _5 d0 O
    : q' D; r$ X! u* _1 b3 y4 B5 |: z
    / o/ Z9 b: g5 P- H! }
    3 s3 N! s" P' H6 J
    . a4 ^0 ~+ k5 `: Z
    (5)特征选择和数据预处理
    ! _9 }9 s' [3 W1 z- g
    ! J( h2 j- M5 u1 |) c. v特征选择,主要是gzh的想法
    4 b! A2 t( c. ?特征筛选的思路: * H5 s7 X; X9 {+ w) W+ J, \0 j
    分类变量用1 2 3 4 离散值
    * o1 M: E2 J3 z8 J对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
      v3 T! U- I; e& s对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
    1 B+ {9 j' t" T! c; Q+ |$ m; Q
    注意了: 9 u9 L+ B9 F) E7 c9 L  N( X* \
    筛选特征的时候,重复性要考虑、缺失值要考虑
    ; o# r, T- U2 |5 N4 e) S
    . C% [: u/ [/ y' q% f* f$ K0 ^(6)缺失值的填充
    % j) @) E$ [3 P: E# q0 ~* m. P1 Q  P7 G
    4 H' d5 V# E3 c7 E" H* Q& ~- d
    # `/ W. O2 C9 d; n  [
    (7)文档编辑的一些技巧
    , y! k2 {/ b. O
    2 z1 ?; `3 x/ R9 k# Y; c2 A/ b- ]8 Whttps://blog.csdn.net/qq_26769591/article/details/80848841
    0 [+ N4 Q: L  ^# g2 h5 G" f8 x2 E) k2 t( s
    (8)团队合作的一些心得
      D5 c& Z1 C9 P& o
    & F# B" ^0 `% x3 b/ [- G1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 , y9 b$ Q. y: p( }7 ~
    2.不会乱 不会重复做功 不会丢失工作 5 M+ y7 G* m3 U" H4 T" y
    3.经验丰富 总能拿出一种解决方案 ; {" b' T3 c6 G& Q+ ?$ p, d
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
    / ]) i/ Y# B  e' n( |5.大致方向总是不差 错也只是参数不是思路 不是算法 3 w5 E0 W* O0 M! l
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 8 o  U5 a1 r) p. H" m4 a
    7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线* @5 F; E. Y4 c' g6 S# I
    ---------------------
    6 E4 D! ^0 h. o  A" w6 M5 I作者:-英击长空- 9 s, B$ k+ l5 c2 r
    来源:CSDN
    5 E  K0 |& j6 [( ~7 s6 O原文:https://blog.csdn.net/qq_26769591/article/details/80840673
    9 n# l" w8 C/ J( q% Z% a/ Z& r
    ( H" B( B+ n- O$ \4 H
      f) r7 c$ A4 t$ E6 q8 d
    5 \0 M! T0 V3 h2 h9 A
    8 {1 S: O7 Z) u& \* |$ g

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-11 14:49 , Processed in 0.410996 second(s), 59 queries .

    回顶部