QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4168|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结5 ]5 {, c: Z. k9 o6 N. r& N; t
    数学建模大作业中涉及到的知识点总结:
    9 c: m! g, q0 `# Z6 c7 S$ V- o# U7 P/ j  F4 ^& R3 U
    (1)写作缘由. [& T- `$ y. z8 x2 _3 l4 H& _0 m5 g
    (2)统计描述:7 H! f: t8 K% {# i* I, ^4 Q
    追加用excel 做频率统计0 H: O  A! _- K  S3 l
    (3)相关分析(点二列相关 )6 o1 U$ e1 W9 I# z2 Z7 @% p8 u
    (4)回归分析
    ! _: w6 F- k' l# ?, s(5)特征选择和数据预处理- c. j. S7 E8 R' Y/ C1 H
    (6)缺失值的填充. y5 L8 r7 m( `. P  Y
    (7)文档编辑的一些技巧. a/ l4 \: o( m: D+ B/ Q0 n% `
    (8)团队合作的一些心得
    $ k* |  }* l* T9 x8 L(1)写作缘由
    % z  H6 }/ i7 o% Q4 J7 i2 {; j" j9 ^: |8 v
    在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
    - f/ x$ k3 G+ G7 j$ Z
      P* s& u* E+ P(2)统计描述:
    ) e$ ~6 q) K2 C& v1 d7 r
    ' G5 Y* d9 {! v: e' N5 B. J① 频率统计 0 P  @! j6 o' G
    ② 中位数
    6 I- f4 `: [. W! u- z; F: m9 F③ 众数
    3 B8 X. K1 K- b" D& r④ 平均数
    ' u1 Y  A" S: B1 }5 f⑤ 方差   o; L4 J4 f) c/ v# q; Q" Y
    ⑥ 标准差 + M9 r: s9 H) t* s# W
    用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 3 t, |+ W& v  p; d( q' |
    ) Q7 D4 s) j2 ~5 y
      n0 e6 l1 P* E: @! {9 Z4 ^
    追加用excel 做频率统计0 h4 h: R' i: j! s* }$ i$ S
    * ^/ I+ \4 C+ P3 M0 M2 E' G6 _
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
    0 K. }2 s6 e6 @5 Y$ L
    $ L8 j$ g! [9 ]% ^1 M# l4 U(3)相关分析(点二列相关 )+ F" o1 D7 H" L  ^" V5 J( k8 O
    & R! j4 y( Z4 q" p; }' J
    2 A* Y4 N. k8 t+ M' x
    ! A3 _/ k# s. h1 Z* K4 v+ E) y
    * @6 S! a* i- d* F- g
    , x8 I3 p! L# M& L1 S
    (4)回归分析
    / L/ `( F' u4 G+ I1 g( j) w. t# w; e# V" Y0 n$ I. w9 Z
    Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。+ L) g' t% Y* y: i; S8 B
    & g- j9 ^+ ?4 ~4 h& ?4 _
    因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
    ! y5 o3 I! l% w8 ?" e+ c: S% }+ a) A0 r: j5 e, D
    回归分析一般有这几个操作: ( M1 D: ~" B) p# V% y' P
    ① 设置筛选条件,刷选数据集 valid / U% c5 y; f+ m3 R- n% W

    + d) o. L8 f: b9 ^4 w5 U: [$ K: f. E) W( _

    5 T7 G8 W; D# j" E② 模型拟合度检验
    % {% ~, I4 K0 [* ]7 U, f ( c2 j- `! {! C2 P& ^
    " N9 a! y( I! g; @3 X& \+ L( y2 ^
    " @4 Y$ F4 t& U6 b2 x5 o
    ③ 预测的模型参数 * q; d1 d5 [! W( H$ @
    1 @0 q6 ]; H# V; }( p
    ④ 预测结果,准确率* d8 E& n1 E0 y  X/ j  x8 i1 k; U* V3 a
    ! T$ e8 H, u0 x" ^) J( }: Z
      S1 ^" L! @+ B+ o
    & \# ^- ~$ O1 i/ D6 ]

    : X, f- u$ U, n(5)特征选择和数据预处理
    5 K5 L# z5 D5 \3 V3 U4 H
    + [2 P1 R- ]" B$ q特征选择,主要是gzh的想法
    , q  \* o) l' B- H* w% b1 [1 }. A特征筛选的思路: % y( Q( u( \8 I7 Q+ F* Z0 |
    分类变量用1 2 3 4 离散值
    ; R, E& K3 P( _( Z  X对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
    2 T, ^! s* i! c2 j; d; h. L对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
    ) O  d1 Z- P% y) a4 n9 m0 W9 T1 ~+ U- O$ w8 V  `' U% ]0 o) A* d
    注意了:
    ' H% `0 [' p2 I+ L: B9 ~筛选特征的时候,重复性要考虑、缺失值要考虑
    4 ?5 n: V9 y. Q' {5 ^2 F# ?
    * L  q; c* I  B: ^) _: N(6)缺失值的填充
    9 g5 n/ l/ r! y" z, m% n% Q# U: c

      K, j  D0 F( p. F: p* T  F8 v. R$ `* f  b
    (7)文档编辑的一些技巧
    + @, z) ^( j7 j8 Y- Z
    - l  L6 }9 O0 H* W% T$ d+ o0 uhttps://blog.csdn.net/qq_26769591/article/details/80848841
    9 w' C* X1 w* d7 P0 ?: O& D; E4 @1 Z1 k$ B, t$ B1 q' m. T
    (8)团队合作的一些心得0 E7 N, p+ s) Y8 A" o
    9 a, Z+ c! B5 U0 u
    1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
    $ @/ g! n9 U7 b5 V+ {) _" f2.不会乱 不会重复做功 不会丢失工作 0 O! A/ r6 b2 O! ~3 C
    3.经验丰富 总能拿出一种解决方案
    : n  z2 R0 s, h; P9 x. g4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
    : E8 b" D" ~, R4 y$ \+ f5.大致方向总是不差 错也只是参数不是思路 不是算法 4 d6 f! F2 z* M" Z3 q7 A0 p! W- r
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 # A! ~* U1 [8 a6 _* x
    7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线' h' W) L- b8 s! z) c) B5 i% C. Q
    ---------------------
      e2 @' f" d& [. L6 e/ W# `作者:-英击长空-
    * L% L+ N* B! @9 r/ [3 I来源:CSDN ) x9 O4 ]! i# ?+ j9 ]2 S& `
    原文:https://blog.csdn.net/qq_26769591/article/details/80840673
    ! L( [9 x+ i8 p+ X7 r6 N" E. b, }5 Y( a- h2 y0 R, ^( J

    ! {0 c6 [) e( \8 N8 g% c$ }) }  F- o4 i3 R
    - X8 C1 ~3 m; A' V: k

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-13 02:06 , Processed in 0.448521 second(s), 59 queries .

    回顶部