QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4205|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结/ Y" L0 [  r7 E/ E1 |& r4 i8 G
    数学建模大作业中涉及到的知识点总结:  V, L4 e$ A( f0 c1 `- e, Y/ c" |
    3 Y3 @; o8 V! d* T! R2 l# w
    (1)写作缘由
    . K" q3 j( r) P3 R' C8 {5 y(2)统计描述:
    / s+ d; H6 x$ B, m追加用excel 做频率统计( T1 d1 \  ?$ s9 S9 U' t( t0 E5 c
    (3)相关分析(点二列相关 )
    / u8 x/ c# N. a* V) q$ d(4)回归分析% q. ]2 ^7 n+ Y5 d0 p
    (5)特征选择和数据预处理
    0 R/ Y! j& z3 i1 J8 Z0 t% U(6)缺失值的填充, f1 G. }2 i8 ?9 \6 F0 u+ x
    (7)文档编辑的一些技巧
    5 Y' j5 s, h; t5 I! ?! G; ^2 C(8)团队合作的一些心得/ ~& |' y6 C. X0 E; y: D
    (1)写作缘由8 m8 B9 }' v, Q+ P; [

    ! w3 v6 q5 p) F4 I, S; h在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
    * M! C" H9 f( B( m* T8 m/ w3 ?3 X$ @: I- t
    (2)统计描述:
    8 [8 I5 g  P2 q' q4 v, {4 e3 k% O# ?% l! [) ^: v
    ① 频率统计 7 L# N7 f2 B8 i/ f8 ^
    ② 中位数
    . P& {0 ~! D: Y' J; d' @- M- t6 m③ 众数 ! B2 Q- j' ~6 r2 E1 t- T8 k  C# y
    ④ 平均数 2 t7 i: D8 K/ o" c, A2 g( m6 @
    ⑤ 方差
    ' f6 u% k4 _1 C# v⑥ 标准差
    % A2 J% b" Q! B% Y2 ]% Y. G用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 % M/ E: F) Z3 x

    $ `! h( M: P) @1 E1 Y" {" u' X  W& M& O4 I8 E! i! Y, t
    追加用excel 做频率统计. Z9 O, ~/ K/ E, o. C

    # X) w* T- x1 R' Z0 lhttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
    : x$ n. B8 p7 U- ]6 V1 `/ y/ R/ j/ P4 f- ]& x& ^, _
    (3)相关分析(点二列相关 )6 G* W" E8 V5 N* `& N* l$ P
    7 D+ C! f: v4 A0 N& t" ]+ g; ~
    ! ?; h- [! I! |0 X5 U6 ^7 X+ f

    / Q: [, l+ Z* z% E! v! y; Z4 z8 A1 A0 e' C! H4 o1 \! ^

    3 o5 D) Z/ L5 N' ^; R! V* f2 b+ T(4)回归分析
    % Q, a$ p& |+ P2 k$ |) j4 `9 E; {2 o  @* Z$ w; Q( h) Q9 b
    Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。4 r/ x5 O4 w: F) a" F* W" N0 n4 L
    * q5 N0 X' d$ H0 [. H
    因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。& I3 T( R" ~$ C% ]& g; m! J( l

    - {1 Y- Z, ^. l% H3 g回归分析一般有这几个操作:
    1 I4 p, V2 B3 J  V① 设置筛选条件,刷选数据集 valid # z; n. v  a) F7 ]1 T* `* d: O1 I
    5 G" r" R7 t3 z+ }% l& H

    . l1 s3 b* R! `7 z1 W1 D( J
    / Q9 T% k* Z% w4 w( Q, E; K$ }② 模型拟合度检验 8 c0 R( z3 F+ T( d' l: q
    7 u9 E, A" \$ f! |
    ! ~3 v# S! z3 h& p( j8 l  z

    & [- }* M. L( T$ ~' l③ 预测的模型参数 % i! ~, w, C4 }

    / ?/ G4 l0 z8 e! |" s0 {  a, c7 D; w④ 预测结果,准确率
    . R% x0 P% {8 Z- ~7 A# B6 U4 |% ~( J
    % I0 v5 R: ^: y
    + Q! p4 K" K! M3 l) K1 [

    2 R- [% Z) J0 J$ I, ?! s' a7 f(5)特征选择和数据预处理" z5 u+ a& _+ y! d; e8 Z$ w& K

    # W2 G9 I1 Q2 J+ D特征选择,主要是gzh的想法
    - o+ ?5 P* W  K5 S特征筛选的思路:
    9 x% P) h2 T: j, C/ w分类变量用1 2 3 4 离散值 7 q0 h9 K( s1 {
    对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 . u% }$ N3 J* n  b7 G# p
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值6 E/ W7 h( r: Q
    ( ~/ B" u( q$ u8 R: x# e) r
    注意了:   x7 s# ?( t* v! ^) s
    筛选特征的时候,重复性要考虑、缺失值要考虑1 v: [" M% C( L

    4 E8 J+ G) q' ]* {) B% K. V(6)缺失值的填充
    9 N4 \( _( n. H- c0 Q7 ]+ E+ \. H4 l: P. Q  v
    6 ^1 t; _: ^. d+ ^3 e) z  w2 v
    6 O7 n" s8 K/ J( V5 V8 n
    (7)文档编辑的一些技巧
    / i/ @3 f+ e9 X& H/ v
    1 Z- [4 R# `& D4 D4 O8 rhttps://blog.csdn.net/qq_26769591/article/details/80848841
    - h5 p  Z7 O% K# x' `& U7 w; b. i6 n0 l. @) R( j+ V
    (8)团队合作的一些心得2 ?. y. \9 V3 j  [* [. y

    3 D. m; p1 i( S9 D/ ]1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
    8 F! C) n$ F9 {; W: O2.不会乱 不会重复做功 不会丢失工作
    7 t! g7 Y' A* C2 k7 }* H0 P3.经验丰富 总能拿出一种解决方案 0 d% l$ I" N7 Z
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
    2 ~: y: L2 G# X# k, `5.大致方向总是不差 错也只是参数不是思路 不是算法
    9 R8 ^6 T) z2 D! R$ q! q% K6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 / M" m) |! B' F+ r
    7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线. O. M; E! m, o0 F
    ---------------------
    ; ?- |4 g2 h( ~6 ^1 g2 a0 [+ a作者:-英击长空- 5 j8 c, K4 T/ |0 }. q) d& F  ~' ]
    来源:CSDN
    1 l) E' N* Y# r原文:https://blog.csdn.net/qq_26769591/article/details/80840673
    1 d4 g2 c, H% x0 y2 \9 `) E8 ?" _9 N' @" G

    + j5 @6 H' X2 Q4 x. E$ _. X+ b. l4 \  X
    + c! b  Y, o2 R9 y

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-6 09:10 , Processed in 0.408880 second(s), 58 queries .

    回顶部