QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4221|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结8 B: _6 c) _/ o7 r' U- b
    数学建模大作业中涉及到的知识点总结:/ r8 Y! v4 K) M2 L) A: [
    1 B* R! ~6 `& `
    (1)写作缘由
    " ?. ]1 E, W0 \# Z(2)统计描述:
    ( x% J) [/ e- d4 ^- g( M追加用excel 做频率统计" ^3 b" P, x8 T5 M$ ^
    (3)相关分析(点二列相关 )0 B% ~- g3 A% V$ b
    (4)回归分析
    ; N+ I; L3 P, M8 C6 m(5)特征选择和数据预处理& Z3 ~2 R3 W% T% ~
    (6)缺失值的填充5 g4 H# c0 T+ }6 C7 [1 N
    (7)文档编辑的一些技巧
    4 g, H9 N, U* |' u4 Y) h5 k(8)团队合作的一些心得
    - c# o, R& O9 `- I(1)写作缘由
    5 |+ c$ C& k5 |! w1 G) R  `( T1 ~
    在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
    " f: ^4 S) ?, Y/ }% F; S7 g8 k# ^$ U/ Z+ ]
    (2)统计描述:
    , [3 ?' K: a" f: N# r& t
    2 n& O( D- L. c# E* T: f① 频率统计
    " s; }, R: p$ N5 O: L- Z1 D; v② 中位数
    5 N  @1 I  |4 }" {+ j+ P0 R, O③ 众数
    : O3 i2 E! ?" f5 a  z: e/ `④ 平均数 4 x; N0 \' d9 I/ J' ~* {1 V
    ⑤ 方差
    2 Z, T% X# ]9 G0 I2 e& `⑥ 标准差
    : J* }5 H7 b1 m% R$ q6 O" J) q! r% a用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 3 D9 O) Z" ]: C
    , Y4 i6 |8 X5 p! A

    2 Y$ r; q+ Z" R$ J追加用excel 做频率统计
    4 R2 C  v  ?# |" E- A* d2 ]0 z; v. Q; D, }$ Y. b
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html0 g6 h) I& k# g% w
    ; S0 {1 z2 Z0 l  a8 V1 B$ V
    (3)相关分析(点二列相关 )( v' p6 F6 a# D/ c
    4 ~, j: d/ A8 k; j, C1 o$ p4 D
    ' P" o6 J1 d/ G3 y) Y+ ^5 Y8 M

    5 F2 U5 q3 e6 g& @5 H
    ( _1 w9 m0 O3 u' x
    7 f5 L. L1 c& _: z/ z" s* h(4)回归分析
    " G% M  X2 H1 P/ q+ Y: P
    ( c/ a8 I" N) t& A2 a. v0 Q! @Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
    . T5 I; w# J5 ]1 r2 |. {' [
    6 W. N% O* s. M% A# T/ o因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
    / |/ M9 c6 ^+ s( V2 ?8 h5 o, g
    回归分析一般有这几个操作:   g$ ~7 B: ^9 L& e/ N! h; z
    ① 设置筛选条件,刷选数据集 valid
    & d6 b( V/ f! t4 V! M( d0 t% y
    7 d& n$ {  O& X# l0 [, j5 X+ r) y% a% s! p& H9 W

    6 l+ D# h- r" L7 p2 X② 模型拟合度检验 5 G7 e- E# y$ A9 |3 J2 C; J
      v+ J- `" H; [" Y4 e  ^

    7 T" a2 i0 k5 |$ m3 ?' [& t& I1 y" G2 q
    7 ?) T  @* c, t2 m) ~2 b: ~③ 预测的模型参数 9 t2 W+ l) Z9 c' x
    " J5 V' o# q+ b4 {0 z' [$ z
    ④ 预测结果,准确率
    * }9 I3 r1 f9 |- O1 ^+ N+ ^: ~) {3 R# b1 K) u
    4 g$ |8 u5 G9 i" W1 {
    7 R& L3 r, s! s& |% ?$ [3 b5 }0 d
    * r6 c' G5 l7 ?+ y- q
    (5)特征选择和数据预处理; o$ H  U% }6 Y! x8 t) c8 ?

    6 q% J0 f& P6 S9 L特征选择,主要是gzh的想法 , W  T* a$ ^+ {* D
    特征筛选的思路:   L1 _: R6 s, l& r( c! J
    分类变量用1 2 3 4 离散值
    : D1 U5 I: Q3 K2 f对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
    6 x. n( D6 Y( K$ p  r& p对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
    # s1 d+ n8 U' r  N
    0 E4 u2 V$ ?0 ^注意了:
    : ^' w5 d( i) k' s筛选特征的时候,重复性要考虑、缺失值要考虑
    8 D1 @( q1 h5 W' z  s1 Y' a7 O; G  n) N* _
    (6)缺失值的填充; [9 ?2 F6 F1 s+ {# l1 v
    8 }0 m3 ?/ n$ `. r  H

    ( f9 U5 K3 M& p" O
    1 R1 m0 Y& P# Y; Z(7)文档编辑的一些技巧8 x  n# f, D4 Q6 I, o  Y( r4 T1 t
      g$ _" D3 l: V7 w* g- T
    https://blog.csdn.net/qq_26769591/article/details/808488410 H; S7 y: N+ \; H- _! z$ _5 Z
    * C( S9 w: y% q
    (8)团队合作的一些心得
    8 P  I, ?- y) o, x# S9 C$ R5 e+ v* [5 p: v$ y; _- }+ D
    1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 ! ~2 Q7 {+ l% ]9 k: z4 g/ k  x
    2.不会乱 不会重复做功 不会丢失工作 ( P& y, x4 D+ f1 p; u
    3.经验丰富 总能拿出一种解决方案 ) Z# d' M6 R- P0 q. _' X
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 $ B# l6 `/ R3 j5 d8 [
    5.大致方向总是不差 错也只是参数不是思路 不是算法
      r4 p6 x  O6 e; y% j6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 " p/ {- ^4 P! i- C4 n
    7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线. p& b! v+ t) b# i# p0 N
    ---------------------   R' v0 M2 j& a6 Z" s
    作者:-英击长空-
    - _4 R5 ?* H2 e0 O来源:CSDN
      F$ ^- C/ E& P( G* S! x原文:https://blog.csdn.net/qq_26769591/article/details/80840673 ) P' m6 Z( T6 j% L+ I7 U$ P& E" V% c
    9 V1 M6 t4 [7 {. ?3 [& y) U

    6 C# c2 _/ b/ w3 B$ e5 e7 t# [* C: Y# h! l4 @! [9 G
    0 n( I$ Y! ~0 l8 w$ J

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-22 15:01 , Processed in 0.436224 second(s), 58 queries .

    回顶部