QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4188|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结. l- u% z! \7 }" @
    数学建模大作业中涉及到的知识点总结:
    * a, ^  }5 W! Y- n% C' N! N6 h2 E$ P1 t( t
    (1)写作缘由
    3 ]' p# _! t5 f' H% E(2)统计描述:
    ) n2 n4 r2 Z+ J  M+ ]9 {追加用excel 做频率统计
    ; _" K2 v) j: e% R( o6 p# f(3)相关分析(点二列相关 ). N3 v" E6 u! v7 }  _+ O
    (4)回归分析
    9 |6 m+ p- T/ ]9 F; j( T6 {. F% [6 x(5)特征选择和数据预处理" ]5 r/ S- T" U' t. H
    (6)缺失值的填充
    6 E. ?+ j. Y: }' N9 z(7)文档编辑的一些技巧& P/ N" O* r/ F
    (8)团队合作的一些心得
    ( J& h& C( U1 U; I5 s(1)写作缘由% _4 a% ^* ]- d$ n) ~% i! p
    4 E% c" {, Z3 c
    在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下1 }5 [) `& j& w0 p$ a
    / Q! n& ~# ^- U1 ]5 |1 n$ o) c
    (2)统计描述:7 v4 o3 q9 T- M# K: J: K0 K
    $ f) [  M% v$ T$ s  z1 [
    ① 频率统计 8 w% Z, K$ }: v/ ]  F
    ② 中位数
    $ R1 N4 H! ], O: Z6 G③ 众数 ! Z" k) d# F( H
    ④ 平均数 6 f. X, l. z5 _# u0 p
    ⑤ 方差
    + C0 R1 B! t' ]. r8 m⑥ 标准差 * _' ~' O0 U5 q8 c3 \7 U* n
    用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 1 S& R  ?" ^7 H: D# k& c

    : F8 ~; m% m8 K) ?/ N6 w$ j& l) i' ~
    追加用excel 做频率统计: X- b3 {6 z7 q/ b

    4 Z5 b1 N, _' y/ t0 Qhttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
    0 j( N6 l2 U: h! P
    " @# p5 x2 v/ x- @) M(3)相关分析(点二列相关 )
    ) F' \. Y8 w5 Y" N9 Y3 l$ }( C% ?
    " ?2 R+ m) Y/ G# [
    / k- s4 H6 k) K, h% U& k$ U9 Z7 _7 ~3 `

    + l9 c9 B+ Q# w8 n/ S4 `# N% Z* o  [- E1 D& P8 V- A. E7 C
    (4)回归分析
    0 C$ n7 b+ n8 A1 u; Z$ _) }2 O
    ) \0 G+ y3 x! gLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
    . L5 O' J6 v4 H& q0 S& q( E7 A
    . U6 q3 O1 }) \7 }7 |; S因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
    5 H( [; F* G/ `, F4 t6 V' m( p
    + T  m1 q# m) i- H, U4 T* U# ]回归分析一般有这几个操作: ; O0 L: i3 A" w3 Z- R
    ① 设置筛选条件,刷选数据集 valid 7 V5 \9 f' J* [) [0 h, a

    1 {. J; y9 q' ^5 t% s4 R3 g! S# z3 s, s( _5 q; _

    * m3 I: z% o8 o1 ~+ X2 N0 F8 {! t② 模型拟合度检验
      J! T& v. d- c% D: r) `
    0 W' A5 W! u2 y4 D' S( J- J
    1 F0 i: W- O; `8 d$ J7 M$ {5 i3 M. X6 V: ~
    ③ 预测的模型参数
    7 J: a+ G& \% Z3 E* N* W
    7 I* @8 @, m: C! L& s7 V④ 预测结果,准确率9 `) v) t1 h$ p+ ]& a# O
    1 C- Q1 Y7 H. ]  O% q; J! C

    8 R5 |! A% h, ~
    * i6 u& ?9 _5 l* t  U3 M$ E
    : q, J7 x  x9 h(5)特征选择和数据预处理, @  a9 v) S# a" Z1 a

    6 P6 R2 m2 W9 h' b) s- o; c特征选择,主要是gzh的想法 % r& ~; n' k* h9 _, I4 ^% U! Y
    特征筛选的思路:
    , s1 Y! k' [) d6 ~分类变量用1 2 3 4 离散值
    & ^! `  _$ N4 X% J! n8 J  \对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 7 M1 {( k' C1 j
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值2 g/ ?* n3 O: v) M& B/ z: |7 @

    " B5 n  k$ J- ?6 Q( g# f- g1 d: I注意了: 5 L* l) d, o8 I3 ~9 K/ ]
    筛选特征的时候,重复性要考虑、缺失值要考虑
    7 D7 X- j" `: `9 R! Z+ ~5 ]2 t+ X7 N1 Q! ]! u' i0 }' P
    (6)缺失值的填充
      t9 N: t9 X' E% q
    , q& F" k. Z* m; O* [+ J; m) i- p) j5 ?! c& ^  G% s1 n
    7 W) G, x: v! D( f) y* A+ H
    (7)文档编辑的一些技巧: J+ U* g# P% o6 M! e

    7 B% B- f- r5 w( p2 p% Shttps://blog.csdn.net/qq_26769591/article/details/80848841
    ( A" ~+ Q/ l' B. g8 ^+ A5 U$ W- k+ B- L, s6 O; E9 I
    (8)团队合作的一些心得  _9 l" c' ]% `& L% ?8 {

    ! T6 K1 b. H+ L2 w1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
    6 z# H  m: R2 V- r: J2.不会乱 不会重复做功 不会丢失工作 & d% x8 I$ ?0 W. V+ D
    3.经验丰富 总能拿出一种解决方案 % ?8 z! ]7 s" u: @
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
    % S  y. f1 H9 J- y5.大致方向总是不差 错也只是参数不是思路 不是算法
    : D2 A# [( ?0 D7 z) ], g6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 ' U* t( a4 p) `* l
    7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线4 T6 Z8 p% ^, ~! k
    --------------------- 2 D5 m$ s0 K! r1 s! N1 g
    作者:-英击长空-
    , D9 I! y7 B2 o& ?2 s! S* m7 }来源:CSDN 6 k+ N, z# X  ^" p  f$ X9 u6 D
    原文:https://blog.csdn.net/qq_26769591/article/details/80840673
    - e/ z6 M8 h! g- s' C1 `
    7 f% d( t# y! F- m: ~  t% m5 y' W. @) O6 [8 p# O$ F- Z

    : G) a4 \" d7 x* z1 d' ^* L) C8 s5 H8 j4 g4 f. w' X, q# J

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-5-8 02:32 , Processed in 0.407072 second(s), 59 queries .

    回顶部