QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3906|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结
    9 f; S5 t! P. y" l数学建模大作业中涉及到的知识点总结:
    . X9 H( t7 h! i1 O7 C; x- E
    6 K, B* C6 i3 ~: }) W$ m( i1 N: V(1)写作缘由
    % K3 S% }) _1 S$ y(2)统计描述:
    4 \% u) v0 w3 F! r- R追加用excel 做频率统计
    , p- \1 D  X7 r+ J(3)相关分析(点二列相关 )
    2 e! b. X9 Y1 q4 Q5 N/ w  y3 `(4)回归分析+ _% R8 }& q" f: r& F2 c% B
    (5)特征选择和数据预处理1 L  I4 {3 o* t5 M0 d
    (6)缺失值的填充
    * Q' a) S( l. B# j" `7 U: ]+ T% i(7)文档编辑的一些技巧
    0 z: @# o5 G1 k2 A0 |3 X, b(8)团队合作的一些心得
    2 l  f& y( @$ A/ i: d(1)写作缘由
    + d- R' E5 Z* y3 `, Q2 y4 T0 Y% o* w: w. q( H1 H+ {- Q. @( Y
    在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
    * P& |$ ^" U6 R& _- M% ^: n! J  M) A: S
    (2)统计描述:) r! N3 n5 k) d' Y% H
    2 A8 ]' o! m1 \& O
    ① 频率统计 ) U+ ~% Q% y! s: V) z
    ② 中位数
    # P  K8 D0 Y! i, Z③ 众数
    8 v# e* U0 Y3 M+ m④ 平均数
    5 `" J" y) i- d4 s) D7 G8 @7 ?⑤ 方差
    , ^8 M0 S. T5 o⑥ 标准差
    # U; S5 H# J  Y0 j6 w5 b用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
    ; j1 x, R* E0 Y: u: V9 s
    % }$ n+ X- k  i( P8 S1 U2 g. y( X' b* i9 b; @! i' R: q
    追加用excel 做频率统计( n3 ?+ m, C; G. |  v( d, T
    ' Z, o3 |, y+ ^& y( _  c- l. ?1 H% X' }7 I
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html1 ~! s: J) u1 f# `8 ^0 n

    ! p/ @9 M5 U  H( e3 v(3)相关分析(点二列相关 )
    . @' @# D! @  C1 N
    $ y# J" U/ r7 C( Z8 y* W/ O) c8 x# |. C$ F
    , L1 r) h4 N3 p6 \% k
    9 K& K$ R% d* \) r+ n& d9 I) x
    $ ^$ s/ S. S( a7 n3 l
    (4)回归分析
    4 I' }4 D' ~* }; b
    ! C  _: t% @7 \+ l$ Y! j1 uLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
    ' h5 t8 e- ]6 q7 q6 V% x( `: e
    9 s! Y7 }; [6 V1 E; T  ~0 I因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。. x2 z7 R- F4 l

    4 [2 C* _1 J' f/ }回归分析一般有这几个操作:
    # V* h+ N& W  ]① 设置筛选条件,刷选数据集 valid
    4 [! T- Z4 ?6 \( f. ?  k7 y+ r2 K) v- P7 j: c
    6 s2 ~9 Y8 X3 k' W- b0 t8 i( E+ d5 G2 z
    8 d4 M0 [9 Z$ Q$ N1 ~2 u5 [
    ② 模型拟合度检验
    - K7 H6 z3 O$ y7 c1 d ' P9 }8 m* Q, I) j& u) ]

    ( S4 Q* X9 Q/ F0 G. z2 t, `3 h+ r$ F: T" M9 Z, I, F( Q
    ③ 预测的模型参数 + A2 u- W  _: q$ p. i! U0 [
    0 _/ {4 S* f$ C* q
    ④ 预测结果,准确率
      ]& n; m6 v1 H  ?; k& _6 o, K0 E! [3 N

    ' [/ h# z6 k1 n+ O1 u
    6 c8 g+ z1 d/ t$ r8 @9 i5 Z0 t: g+ P# v1 v) J
    (5)特征选择和数据预处理
    ! F1 `& ^4 N9 P  N6 ]9 y5 R7 q* k5 W/ c* u  o. d
    特征选择,主要是gzh的想法 3 m0 }# |" e7 S- x
    特征筛选的思路:
    2 X1 l6 |, _* y6 O- D分类变量用1 2 3 4 离散值 / U3 D# ~/ X: ?5 y2 y+ Z4 Z
    对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
    5 _8 h  A' y; n对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值1 r/ j& P. u' V. \
    ( K2 o% ]% l% ~' n
    注意了: , }3 ~1 A- Z  \* w2 R. F
    筛选特征的时候,重复性要考虑、缺失值要考虑1 y- x" E# ]6 X! d1 [7 j
    7 I& g8 [/ _5 i) n6 F' `6 D/ W2 N; b% ]
    (6)缺失值的填充
    : b5 K' Y/ t* ~7 x$ c# b2 z9 `
    $ v8 g- o: O$ w
    4 L8 U1 @5 K) h4 d0 f* n$ S1 G( ?
    , q  k# v1 H  z/ J(7)文档编辑的一些技巧, r! q6 J) ~* z( D
    ) f9 ~8 r" O) ^" O& T9 w, o
    https://blog.csdn.net/qq_26769591/article/details/80848841) a% l: K2 I2 Q2 t  C4 D" t, r

    3 h1 `3 T9 X2 `4 Z3 o6 M5 z3 x(8)团队合作的一些心得9 S( J8 h+ c2 b1 N3 a

    6 ]$ Y4 [# V# @1 n" Z1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 9 k6 S' e8 |. o* {  v
    2.不会乱 不会重复做功 不会丢失工作
    : j8 m6 F" A1 q$ L# d+ _$ A3.经验丰富 总能拿出一种解决方案 - q. K; |) B( Q. [: Y3 e6 d
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 & O) C- o+ ]3 G' ?0 P+ L
    5.大致方向总是不差 错也只是参数不是思路 不是算法
    $ z6 Y3 x4 [  n' t6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 4 j8 `; A. z4 |, Q
    7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线/ }# N2 b8 b! X* l9 s0 A& v5 g" ?
    ---------------------   F8 Q, B6 v. j/ C+ J5 `7 X
    作者:-英击长空-
    # p4 P9 I, n0 V& v/ z' R5 o来源:CSDN
    0 E; _- p" F# x9 F) X/ g原文:https://blog.csdn.net/qq_26769591/article/details/80840673 # ^+ D6 N# w8 e4 J0 Q3 J4 E
    : f; k# ~3 Z) \9 \' H

    ' n& ?4 `5 g8 i) P0 {5 b& M; J; O
    : }' I% M$ i( o1 u; Z8 T6 K7 H* T9 H# A1 g/ I* a0 p0 b2 {  `* z

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-10-30 03:18 , Processed in 0.561435 second(s), 59 queries .

    回顶部