QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4167|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结
    6 ]# y* N1 |& E7 }) Q: s- K7 z数学建模大作业中涉及到的知识点总结:
    5 X0 A4 E4 w! G+ p  ^9 b+ f) s' v: e3 r7 v
    (1)写作缘由  H3 z0 v$ ?" `
    (2)统计描述:
    8 S; F. I* R& K追加用excel 做频率统计+ |4 a7 n7 f8 Y/ h
    (3)相关分析(点二列相关 )
    8 C& Q! `2 l4 S( g* ?(4)回归分析
    / L: m( T. C2 c(5)特征选择和数据预处理
    7 y& o, z* d1 u& T/ l% z(6)缺失值的填充
    + q+ T. w5 I" s& O. o. S(7)文档编辑的一些技巧  a2 O) s5 n( m$ V* n9 O
    (8)团队合作的一些心得
    5 E! k3 ?: o. D! N; s+ ?$ [(1)写作缘由
    . c7 n% T0 t  {2 b" l
    0 {0 L( u4 O( _% }  o( O在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
    0 B: X/ O+ ]$ o: ?2 }) e2 m
    2 Y4 t" o/ T0 I- J(2)统计描述:
    ; J' C6 t; h) N/ `$ |9 N# Q
    8 h! z8 w) x5 v& M  `: Y+ K① 频率统计
    5 V4 J" h$ s- T$ g② 中位数 9 o4 `+ {9 J8 O; s' m
    ③ 众数
    ! T% P/ y7 Q! S& g8 W; [7 o' G  I* o④ 平均数 ' m% T" j2 Y1 B% {
    ⑤ 方差 - U; n2 `- t& @/ \2 R" u) [- f, X, F
    ⑥ 标准差 3 `0 O7 e4 F9 G5 P/ A% i5 G. k
    用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 7 ~# P. k7 a2 d+ i
    4 s. s* M6 q2 n4 B2 C% B

    1 c7 k- S) ~3 j+ K2 U追加用excel 做频率统计
    0 S3 d1 O% ?& `( p+ h& M) h' f' w! J! R
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html5 V! f4 y! i6 n
    ' X  t( e) K$ {5 b! g% R5 \0 _- u( O
    (3)相关分析(点二列相关 )
    * u" k9 {- y. r6 r1 Q6 S$ K
    9 M0 u  Z  P' o& }: ]' t7 j; W2 u) @/ R" s7 ]& y$ K) i5 G
    ; q) Q1 Q5 y$ G" V

    $ S" q, G+ n5 S3 a, U: s- v1 d  f, c; A: h* v; Q& [/ Z6 k
    (4)回归分析
    ! d' Y& o( \5 \5 k
    " f5 t% Z; f0 n, N# ~# p3 @& hLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
    3 {( L' M4 C$ ~0 K) R, J. s- v) r6 e- J: G# l; N
    因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。# I* X, C% N7 l8 u' t' {  u
    , [- B# [  L' }$ X% W: V7 o* T. l
    回归分析一般有这几个操作:
    $ E; |0 R( L$ q. H: ~① 设置筛选条件,刷选数据集 valid
    ! }/ X* g# b/ j4 w% s
    ) c, ]& H2 m/ t0 ~8 R% N
    ( o" d) J& F" o# W+ L0 @' N# _) ?& v4 O& m
    ② 模型拟合度检验
    ; \  d9 r  v, o1 l0 M# }9 g & {3 l3 A) x/ ~0 |

    / G5 C$ p3 Y1 X  e  M/ j8 D, M! y. G, q7 }- s6 M
    ③ 预测的模型参数 2 T  w$ S# m' F9 k# E& X- L0 p* E3 o

    ! r3 J( t' j* _! V2 S% r④ 预测结果,准确率
    7 l! p6 U9 f$ {( j$ l) H  J9 j! Z2 N/ o, g

    3 D2 x7 M! `% v+ {+ y" h" W; Q: b" \; @4 t! A) p, V
    0 q$ z( e6 D* G- }; @7 @  }
    (5)特征选择和数据预处理, H( p% O0 d; p) z
    6 B* ], l0 {/ r% H
    特征选择,主要是gzh的想法 ' \# {  Y* c1 R' ?
    特征筛选的思路:
    " F, h1 k/ D* A& T8 y分类变量用1 2 3 4 离散值
    0 Q! j7 A7 l( I2 y( G7 L+ B对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
    " \' h6 I, B2 V& C对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值- x7 E9 H5 {0 }. f+ ~

    % e4 P/ Y( X* d7 V% h& Z, p  O. ]注意了:
    ) n2 N$ |- ~0 I' i, I筛选特征的时候,重复性要考虑、缺失值要考虑
    . E0 h  Q0 H0 T5 ?' v* z5 H6 s9 t8 _+ G7 f' C
    (6)缺失值的填充
    5 \- R7 s: c! u; H( g1 A+ e; ~1 O
    & K! G- s6 d+ _* J/ J. ?. W6 V
    6 p+ m, r1 g; c2 d4 ~! s( G' ^, |" [3 z
    (7)文档编辑的一些技巧- B4 u  T( O6 S9 E
    . L5 i7 O% P' [: y. \
    https://blog.csdn.net/qq_26769591/article/details/80848841
    2 ]6 `7 ?- O& N* I. |- M% h8 d& G3 z' |4 B: J3 M
    (8)团队合作的一些心得) @- {9 C# L+ j# }# o* n3 T3 f- ^# o: I
    & r2 e: m  ]' ^  x8 k/ d# d
    1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 ( k. D5 a+ P4 V! b9 b: g
    2.不会乱 不会重复做功 不会丢失工作
    $ `2 E; I) |0 _% F  D+ r3.经验丰富 总能拿出一种解决方案
    $ W: l3 K9 i( r; \7 V) D4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
    $ r, @$ I5 }$ [- j' n5.大致方向总是不差 错也只是参数不是思路 不是算法 $ {$ c7 n: @9 V& n
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 ' E: S! z4 t9 O( b5 r
    7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线, n- @; V* v  ^8 m# B
    ---------------------
    6 ?% s/ a$ t8 f! Q1 I作者:-英击长空- : f! j3 \, f, h/ x8 h' H* F" u; s
    来源:CSDN
    " ~' X9 e: {+ T! c/ _3 }& n原文:https://blog.csdn.net/qq_26769591/article/details/80840673 6 c! ^3 L* y+ G: f

    - \6 w! k* R6 o! d7 S+ x7 l. m
    ) Y4 h9 o/ E( T
    7 B% H7 A# d  v8 E8 N4 J: Y
    1 q1 r* ?0 n) \0 p# T& b2 a

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-12 16:21 , Processed in 0.409445 second(s), 59 queries .

    回顶部