QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4208|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结. T/ H1 G* G4 _+ p5 v: j# W2 q/ s6 a
    数学建模大作业中涉及到的知识点总结:2 G" d' I4 e5 H- d/ j7 D

    % K  D8 P& ]: t' `7 R(1)写作缘由+ S( k0 y8 T8 _* t5 f
    (2)统计描述:) M# a7 c: F" C) k8 n
    追加用excel 做频率统计: J- C4 l+ ]8 X8 Q% }
    (3)相关分析(点二列相关 )
    # c; k/ z& ]  x  a& E1 y7 _2 I(4)回归分析
    0 Y# z6 ~  w+ z+ _' e9 c(5)特征选择和数据预处理
    . S  O5 n# _( {4 E  j(6)缺失值的填充
    1 I& x2 b% b7 i8 j4 q(7)文档编辑的一些技巧0 d3 P2 G% T4 n7 j" m) r+ i. w
    (8)团队合作的一些心得" u' ^  q) S! f* A2 V1 M. w
    (1)写作缘由* z& e7 _* w; c) v3 m' m

      L% }4 |4 m( x) @- d. o# ?在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
    . M! a) L$ M. W, Y- }7 C: `( x
    * A6 W- C. G. |7 g  v9 o(2)统计描述:
    1 e& H2 Z1 Y; t, k# I2 B/ o) ^1 h  f9 M& A* b  |6 `
    ① 频率统计 1 C; [4 s, R7 ~( l: ~, r2 d6 p
    ② 中位数 ! [- U' e5 S4 w+ S6 k8 x
    ③ 众数
    1 @6 R- a( g1 F  Y  ~7 I④ 平均数
    $ }  b& j; o+ y. h$ s9 f⑤ 方差 1 |* V) x, l% P) c8 d& \
    ⑥ 标准差
    # V9 X- [8 l; I" e/ P用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
    1 d, ~! Z: M8 f& I) o! i
    ; Z1 N8 P3 b# ~0 N/ X) R1 a- D6 \
    追加用excel 做频率统计2 d+ C, R& W2 W/ o/ {% L4 j
    5 D5 c! Y8 [4 h0 W3 w& c
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html0 d& ]5 O9 |# D) S% m9 }

    " H' W2 u* {$ @6 {( \# j(3)相关分析(点二列相关 )7 S5 ?* h1 y6 d  G/ @4 i
    * z6 P* Z% z6 R. j

    / O$ ~, B7 \* ?' ]3 v
    0 N, \: ?$ j' g9 W3 i5 Y
    & w- Z! L5 o: K( {9 Y+ y+ s3 U; }) P: e  R) _3 I  c; w$ W
    (4)回归分析
    , K/ Z( a6 ]# G* F0 P( W5 ^+ A2 M2 ?9 L
    Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
      G+ f( x* t" d5 e1 Z  N
    / a8 r7 A7 B, l. |+ g因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
    8 T* T- k0 H: X, g9 D
    $ z/ p* F% @& U% j8 s回归分析一般有这几个操作:
    7 g7 I  Z/ x8 M/ }① 设置筛选条件,刷选数据集 valid 0 r" U' _! Y$ {2 m3 z- n

    " c2 n; p# F" A5 `5 X! Q) g, o; H; e; h9 e3 [/ y) d6 ^( r

    ' u& f1 ]/ j8 I3 H; j② 模型拟合度检验
    * U- b$ `4 e: J" a' ?, a
    ! K# w3 `2 R; `! y
    6 j' c2 c) b+ i9 v3 f# D; C; p, t; n% q  Z( [4 m) n7 Y; @  w
    ③ 预测的模型参数 5 F7 g" s% ?% |8 R# z

    ' k! B( B1 p1 T; G: {7 ^& r④ 预测结果,准确率5 G7 X7 E- k# V
    . J$ S# }; P- ?
    3 g+ d8 E/ ]. ?3 a/ R) f
    ) \9 h- Z' D4 C" F- ~( T

    - z5 B' T4 \! t: ^(5)特征选择和数据预处理' P2 {7 d$ n6 z" v0 R+ m

    7 K; R9 C+ f$ ^* v& v( A7 o7 t特征选择,主要是gzh的想法
    $ ^* U7 A. _# x特征筛选的思路:
    7 l# h$ q0 \4 f. _$ p3 J分类变量用1 2 3 4 离散值
    ' M( ]2 m8 }; o对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 3 n; `  R3 X+ O7 P
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
      \+ e8 ?" Z* f+ r
    ) P( C% ~  c9 f8 b' x注意了: 6 j% {9 l  J5 ?( N
    筛选特征的时候,重复性要考虑、缺失值要考虑
    ) k9 }- O6 v! V( _' K' G) z$ W( v
    2 D- U2 N& y( w  m  Q(6)缺失值的填充
    . c  {. x1 i7 Q  T4 ^. T' H2 \
    1 M- n$ X  X0 H$ i2 v
    # ?/ m! {- A4 @) P9 b
    8 G" ?- U# [1 A8 J0 ]! r9 s3 g(7)文档编辑的一些技巧
    - x8 h) f: M6 Q' [! G2 O& R/ ]- S" q" B3 Y# l# O
    https://blog.csdn.net/qq_26769591/article/details/808488418 ^6 r4 x% O" B- J) t
    1 b) H' D! H( \1 d
    (8)团队合作的一些心得5 \4 y4 L7 M, g2 e1 P
    / H/ B6 t7 p% v9 a& p
    1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 6 D$ |- q+ f( @$ K4 ^/ Q# h( b
    2.不会乱 不会重复做功 不会丢失工作
    $ Q  y3 p) o! g& k; j3.经验丰富 总能拿出一种解决方案
    4 J  U, B7 s4 I! P9 C# g  }8 L* P4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
    , B* ]# d1 s* r+ k5 i2 x8 c" I5.大致方向总是不差 错也只是参数不是思路 不是算法 % u) y) i( l+ [5 ~) |
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
    3 y" \( E/ [0 s8 `2 i6 M' m7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线9 }" ?; e3 J2 D6 \! z8 u; A
    --------------------- # O$ ^; p5 Z* s' t# z2 D# w6 a
    作者:-英击长空- , Q5 {: G- M  c0 Q( `
    来源:CSDN
    * B- j# M2 {/ m* J# n7 S6 X原文:https://blog.csdn.net/qq_26769591/article/details/80840673 2 V9 g6 h/ j7 l" H+ b* _. e
    ; J9 \6 F9 P% w# c

    % o8 p# {- ~/ G8 C" L5 c
    0 T1 x5 @6 g0 `6 R
    % r( w- d" B9 s1 M- B

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-7 01:54 , Processed in 0.431528 second(s), 59 queries .

    回顶部