QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3681|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |正序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结) j& l- ^5 u( d9 y
    数学建模大作业中涉及到的知识点总结:
    9 Y% z: M9 ]% n8 g2 }7 j- a" O7 J' G
    , V+ x- J' y3 f4 Y* ^8 c(1)写作缘由. @  Z9 q! v; P3 B
    (2)统计描述:% X  i, i! b( I4 f: Z/ K4 X1 Z% a
    追加用excel 做频率统计% F3 E1 w8 [1 w' ]+ t- c
    (3)相关分析(点二列相关 )
    , i1 k9 T6 ~9 J. ]! _(4)回归分析
    % Z8 a' N2 f) L* E+ p# l! T- u(5)特征选择和数据预处理
    ! ^$ N6 V* d) y; Q2 I, ]* O(6)缺失值的填充
    ( u% N" B2 K' v; H" H1 ]8 i(7)文档编辑的一些技巧
    4 a8 P9 M, V  k4 v  c9 A7 [3 I(8)团队合作的一些心得* s* ]" E# G  b+ S$ U
    (1)写作缘由  h3 S" G4 ]: D; h) @1 O1 R' R  R5 {

      {3 x2 ^0 V- v- i+ T  [7 a在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下1 w7 Q+ h3 I! D6 g0 I

    / b: h9 H* f  \7 @/ X(2)统计描述:" o! C% I6 e+ ]6 `+ h
    7 v  p! ^" n, l  z6 V# h
    ① 频率统计 % D2 `. ?& P& n9 t8 V8 M
    ② 中位数 ( M. S6 \* G2 A3 [, N
    ③ 众数
    8 j; n$ F8 k. {% l( k7 k④ 平均数 & ~" s5 D+ I% d" j5 L
    ⑤ 方差
    ( P4 T/ b! c' O0 i! ~8 Y; c, A# V⑥ 标准差 + {% [" P& W! J: |, K
    用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 7 O0 m" F4 p* j- G( ?/ k/ @
    $ U4 L, I( y5 O& b6 G
    0 z1 D1 a- t, r+ G  n
    追加用excel 做频率统计1 b& ?: b& x5 p3 M
    + l$ I9 w  \( {% b
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
    , d* [% g4 l- a, h
    , M/ C  \+ A9 V. Y' X/ G5 G(3)相关分析(点二列相关 ); H  O/ |1 y4 A9 F

    $ y4 y- H: r/ H+ Z5 o4 o9 H. e' w9 Y8 U; a% d9 R

    % O' v- T, m- u' Z1 @9 d. A2 _. T' M5 s; o+ j5 S2 Z* ^2 |
    8 ?  H4 g9 y+ v' c/ v
    (4)回归分析
    8 r7 Q& d3 Z1 i% b2 e1 \7 M5 @' o4 C. w4 a. l* a
    Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
    % h6 Z, w- l! e! s0 G
    0 j6 X8 a: D& |因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。6 h: b) x. }$ b) x6 L" ^
    3 d4 x. \. G, Q. z) c( P8 ~
    回归分析一般有这几个操作:
    - v: J) _2 }; a- {4 M① 设置筛选条件,刷选数据集 valid ( J7 @7 Z" J; o% |8 O$ f

    # u& O$ N. p8 F9 _9 K% X3 ~: Y* A8 C0 m
    ' V9 G' \9 i5 g5 y4 j! r( O# O
    ② 模型拟合度检验 - v' u" p! W- O0 ]4 L4 s8 }

    $ O! M9 j7 y* \1 l) S+ P3 J# \6 e) g+ I. S# o" M  Q: t$ S
    # o8 t6 L! C$ p" d7 P
    ③ 预测的模型参数
    ! p( V, `. ]2 k; z - d0 ^' G. ~& e/ H/ L* t1 Y$ N
    ④ 预测结果,准确率4 n% Y* f7 m! _

    6 ]3 h& z9 C+ c! z* ~. ]' v . D: O6 d& Z, l+ b  w( w" Q
    0 z) u0 U- @1 }4 q

    " J% M$ s) X8 P(5)特征选择和数据预处理
      |9 o) T" ]& k/ v; J- O" t* k
    3 x1 ]% I. c% ]0 ^3 c特征选择,主要是gzh的想法
    # I8 h" @" V" ~: G* b: D特征筛选的思路:
    + y5 t) l4 E* i2 ~3 q( m9 n分类变量用1 2 3 4 离散值 0 e/ j8 x" o  H; `2 {
    对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 - V6 G1 s* G9 p8 Y
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
    8 h- y2 z3 V; I" g1 D. `# v; v; Y* m: A; W- |. N! b: a  c
    注意了:
    0 w1 \( r6 |( I" l, O& x+ T) e" ?4 S筛选特征的时候,重复性要考虑、缺失值要考虑
    ) L; a  V: `0 W. L: H, w: b. I) J+ {, z( y6 b. d% C( A
    (6)缺失值的填充- x. w( {( w4 N( S

    " Q. y' e; h+ a0 V2 _
    9 b  D- E; R, z% k0 _
    " i5 d- X) G7 k; f+ r6 e, h(7)文档编辑的一些技巧/ X7 [) t7 d$ X% N

    / P5 |* B2 {% x7 `+ fhttps://blog.csdn.net/qq_26769591/article/details/808488415 L% z& V* {! f- |( Q
    2 p$ |6 H: `. G, z0 d% _  r% o
    (8)团队合作的一些心得8 ?3 X/ u! w$ n) f; {

    1 V; u% [2 H$ S6 `0 c1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
    7 }5 @/ S% n. N! l2.不会乱 不会重复做功 不会丢失工作 " Q9 Y# q; L! g2 O& g# I* g
    3.经验丰富 总能拿出一种解决方案 3 g/ t+ o& P2 B3 H, g
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
    " @! O" h: b' ~9 F% R5.大致方向总是不差 错也只是参数不是思路 不是算法 ' p6 J( V1 W# o. ?2 G" C2 ?3 g6 u
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 5 d* f. h5 s+ o8 N3 ^
    7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线( d  o% u, E; [" q1 ^/ t8 _
    ---------------------
    4 E" u& X  A3 k* @6 G8 R" |作者:-英击长空-
    9 d% o( s$ {. q" q7 c来源:CSDN 5 m! p/ ?* z: @) t4 X- z
    原文:https://blog.csdn.net/qq_26769591/article/details/80840673
    ' Y: q3 h0 e+ y3 C$ |0 w$ M+ l" F- C; O5 S2 p6 B5 |
    + o8 v& d4 S: M

      s" h+ `$ J( I
    ) l- i3 ?, s$ }( N4 F

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-7-20 11:55 , Processed in 0.478846 second(s), 59 queries .

    回顶部