QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1925|回复: 0
打印 上一主题 下一主题

[建模教程] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-6-5 11:24 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结
    - N; w- L$ {2 V" h# v! e; y
    " s( ^; A4 B: Y1 v* t7 ]
    (1)写作缘由
    ( K9 {- }# k& ]; l( K) w3 k(2)统计描述:
    2 X& c1 f( @" [追加用excel 做频率统计9 ~5 f" Z! c3 G
    (3)相关分析(点二列相关 )
    ; d, L8 @' j" ~: n( ]9 r( ](4)回归分析9 \# U* A4 ?  Q; z3 {& S
    (5)特征选择和数据预处理4 l& a- M' Y) T# M8 ]
    (6)缺失值的填充) M! Q7 x. K  l% o7 I( J  q
    (7)文档编辑的一些技巧( ^3 w) U" y4 e, A! G4 b
    (8)团队合作的一些心得( x! [; T; C! _  T, @
    (1)写作缘由
    % t  b2 m& _: P- K  U
    . f# Y1 T6 \; Z. f, D9 q) Z6 g在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
    + J' I! K/ n+ ^! i( M" T  w6 G: S: p) e3 D% X; Z& D2 j) h9 I
    (2)统计描述:
    : q1 Z: o7 L: o- k) G) s' K, m4 e
    ① 频率统计
    1 j7 @& V. F( \, q: j8 A, D② 中位数 0 N4 l( O! o, m% X. B
    ③ 众数
    / H  y- s* ~8 N0 t. y  d" E( t④ 平均数 0 t$ l; N. l1 w: ~7 q
    ⑤ 方差 ( h5 S7 X  h/ }2 A( v! \  r& @
    ⑥ 标准差
    3 F0 E0 i8 b: y% e' P( t6 y1 d- y用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 $ @6 g. i: j' Q6 F0 ~
    - Z9 t$ G2 E, X. m5 z/ a
    追加用excel 做频率统计! P+ K- V) g: r9 o7 H
    . L9 [" t  c) H9 V1 i& D1 J
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html' @- t! `5 U2 I
    ' M$ T7 k0 C+ |
    (3)相关分析(点二列相关 )/ p3 h( a* [  {, `( n
    ! |5 D% A2 C$ a- x+ {
    ' d8 Y1 v. m& [" v1 j

    8 C8 M* {% }* ?  j5 `3 |& y. s, _+ c% O& G4 ?

    7 e, z8 B% d4 s0 v0 q4 [1 r/ r(4)回归分析4 y4 a( ]% ^0 N' r. U) g: V
    + s5 b$ c# ]" I% P
    Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。7 S) s: r2 q) K- U# r! `

    + d3 U7 _' a, a5 {因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。8 o$ w* o9 S' X; R' I3 e! {2 Q& Z
    + b* r- @9 |7 ^/ Q& j( S
    回归分析一般有这几个操作:
    / t5 B6 B: M% `( j1 `6 x; m5 o① 设置筛选条件,刷选数据集 valid
    6 U* I' G6 k0 _; w
      j5 F- q" ^8 L8 K$ C+ v4 N6 n7 n. v; L' t

    3 @' M3 F6 a% W* b② 模型拟合度检验 & ], x: }& N2 V+ |1 K3 F0 c
    ; ~9 D9 f5 ^: b# r" W' b
    3 t5 M/ T7 y( |- @) ^9 @* V/ k, @

    / l* s/ d" r8 U7 J: E, d. }9 m③ 预测的模型参数
    3 _+ N8 G/ ]* C; d+ _! C
    8 {% Q% m. g; \5 ^, v9 a④ 预测结果,准确率
    ! ~' E) F. j; g* N$ ]/ I9 @! l5 c2 y/ b* Y" ?/ n/ {/ f  m, U1 s

    : T8 x& f; W8 D
    2 r, |* M, R  ]: O+ Y7 l* O* n; C" x8 Y: A- N0 F$ _, j) i* s
    (5)特征选择和数据预处理
    ' Z1 z; S. l; N  N! i0 A/ ]' P$ ]4 I3 I
    特征选择,主要是gzh的想法 6 v. B% O% u; M: H
    特征筛选的思路:
    $ [. ]. D) ?" S* s3 h+ Q' b分类变量用1 2 3 4 离散值
    & Y1 `2 k" C1 U- B7 L) I% a对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 / r  P2 t! P8 z+ V- C. w+ d
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值5 V% F& ^- F& F6 v# ]6 r
    - `3 w% Y8 x$ d, g$ `
    注意了:
    5 B% t. O9 m. o8 c筛选特征的时候,重复性要考虑、缺失值要考虑
    # y- J5 N) D4 g9 [0 U$ |4 A  v$ z  d# c, U) ~! W) R1 g: \4 V6 }1 T! |
    (6)缺失值的填充' |( e, L% R2 Z
    " Y2 k1 P' h1 z
    3 j) ~  D$ f% i: }
    ! o0 j$ c- e- c
    (7)文档编辑的一些技巧# N, V# X6 O; K4 J) J; k  n" r
      k5 i1 a6 Z8 y
    https://blog.csdn.net/qq_26769591/article/details/80848841
    2 }& h8 W7 h* G, Y! ~/ ~: ]" k% r" o  O. e/ x" n8 M& Z# ~
    (8)团队合作的一些心得
    * X4 l  `/ m" O& x% V4 C2 Q& |7 y- Z! T: v
    1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 6 q0 t: l7 Y. H4 [% Y
    2.不会乱 不会重复做功 不会丢失工作 & E9 S# X; X5 a) R  E% Y& |
    3.经验丰富 总能拿出一种解决方案
    / ~( B0 [4 |' W* I5 X) M  K4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近 , y* i- f" V" P9 x2 \3 M
    5.大致方向总是不差 错也只是参数不是思路 不是算法
    ( m+ S# k, w& I* I) Y8 _2 S6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 ' U* S7 }5 B/ Y: r; m% @2 e( y
    7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线+ I' r1 X+ S. R! v
    ---------------------
    : O8 }1 s5 w* m( `
    8 P- E" x7 W: W$ x; C9 a% R
    1 q7 O( j5 e# Y5 ]+ r' a5 N+ D- v0 w/ W4 f- H+ ^( Q

    2016高教社杯优秀论文.zip

    12.3 MB, 下载次数: 4, 下载积分: 体力 -2 点

    售价: 1 点体力  [记录]

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-12 14:51 , Processed in 0.442108 second(s), 55 queries .

    回顶部