QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3789|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结. e; o0 {+ `+ \5 ~2 o
    数学建模大作业中涉及到的知识点总结:
    9 @, w9 B; ?4 `/ T' R1 u( B8 r1 c, D. |( h/ W6 m
    (1)写作缘由
    / w0 g$ W( |+ q2 `- v' N(2)统计描述:
    3 S7 \$ I) P. T' J5 K追加用excel 做频率统计- g: T! \0 ~# a! g0 n( n$ s
    (3)相关分析(点二列相关 )
    , _" k" e4 N8 |9 s, ]' [(4)回归分析. H2 ?0 E$ A' h& r+ w. ^! h0 {
    (5)特征选择和数据预处理
    7 i3 s  ?, r9 q7 w9 Q% }(6)缺失值的填充8 q' ?! S9 O' h3 H
    (7)文档编辑的一些技巧2 T2 E# [6 ?: }
    (8)团队合作的一些心得
    3 K2 j* t7 ~8 I0 M+ E- D  r# w(1)写作缘由; Y) S' b8 t  U( m  ?
    5 j" Q8 Q6 @: n# N; E/ N
    在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下- }4 {. D- N8 u1 X% N5 S  A' u) k7 W
    2 T* X7 N3 I" o0 ?
    (2)统计描述:! h7 }' W6 _/ X- @" ~; g- T& n
    5 q, J* v9 u" D+ z4 t6 Z
    ① 频率统计 6 X8 E& `* d- w
    ② 中位数
    ' l" d4 B& L) d& o1 U( m7 Q③ 众数
    * w3 A- L6 I' s( k3 U: A④ 平均数
    ) Q; r. z( h4 }' J5 n⑤ 方差
    $ l) P9 l# s% u) H  g' {) n⑥ 标准差
    2 N+ C. a# e. C$ d; g用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 ; ^( c* \) L7 _/ t3 Q" C* |
    5 W& O. z3 t3 f6 _
    6 r1 ~( W: r: u
    追加用excel 做频率统计/ A, P5 b4 r+ E5 i6 S) F, h& j
      j7 {3 y# J4 f$ |
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html- j' S9 |' u* n5 N" r' [' w# M* U4 g

    " f' U) X8 S% j8 r  P* X  E% Q0 }% n: L(3)相关分析(点二列相关 )6 N! f" l9 P7 N/ C: `) S! Q

    ! v# T+ M( P' E8 T# W8 P6 A# ~$ m# X, H. @- t7 S! S$ L: X
    5 U& D" [" l7 e, s2 M; G

    ) Z- T0 j: ]. n4 ~
    3 J4 w& f  w+ T. Z% v9 G5 d: J9 `" A(4)回归分析
    : d$ {0 V. d7 `
    + t4 z2 R- _; n1 L4 O# W" v6 ?% ULogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
    ! g9 B  }$ u+ E6 `6 I2 D7 y$ ?( d9 B9 l9 @) W2 [6 }
    因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。; ?  |7 b& H5 D, g) Y
    ' a% r; u6 }$ Z# P5 v6 Y! f" J, d) Q
    回归分析一般有这几个操作: - W/ p( T+ [+ G7 q+ |' T0 x
    ① 设置筛选条件,刷选数据集 valid 9 S' i+ a( i& q# M2 |  |; c9 A6 q; q

    % |: F7 l* _% u! N
    7 Q( A  F7 z1 n5 W% R# Q4 a; D; M, V1 t+ y% M  S- S
    ② 模型拟合度检验 # o9 m) |. }+ G' X

    7 V% F/ e. [* ]* [. G. D" _
    * Y3 I6 T7 E% D& \( q" j
    ) I2 {% I: D; V0 J3 A; f' c- e, Z③ 预测的模型参数
    ) H$ c5 D) g' }% D. P- Y0 k4 p # M" H  U6 J9 F( b: A
    ④ 预测结果,准确率
    1 b7 T# a. _4 C% ~
    3 x( s8 b, f" x. y$ q* v( n0 q9 E
    : B3 |1 y$ I1 ~1 l& Y: z5 A# I
    . A* L2 ~  i/ G0 G4 x
    ! o9 Q$ f% Y9 `( F) g/ A; d# T(5)特征选择和数据预处理  Y, H6 S$ W9 d6 B) I" Z

    / i  r/ N9 [( g  s  b/ ]9 K特征选择,主要是gzh的想法
    # e7 b- ]" n; i. m特征筛选的思路:
    7 O" q2 l5 b7 n  ~1 L分类变量用1 2 3 4 离散值 $ m0 {6 {3 c5 U  k
    对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 9 m0 l; L- P6 _; \9 `7 ~
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值! X! U8 R8 F3 B1 O5 D7 z
    ! q& h( Q: k. {' `7 i6 k2 K" ?9 k
    注意了:
    * h# t( q5 F! A( {3 T' n  v# e" r筛选特征的时候,重复性要考虑、缺失值要考虑: ?; T* G) v* a$ q0 x" p5 e" `2 T

    - i- o0 T/ u- h. |+ ^5 _(6)缺失值的填充, K; [' i, g6 X
    4 p+ h( q' F: X2 B0 Y
    2 d6 o; E& q! Z; @0 w" t& y, s
    " o% x2 n7 s( j' Y5 B& X( c
    (7)文档编辑的一些技巧
    # v# k+ b6 v: ?9 W2 S: v4 d
    2 N: y" M$ J( H6 Vhttps://blog.csdn.net/qq_26769591/article/details/80848841
    " }. Q* S6 D/ H3 {5 F
    / X6 d( T2 _4 b3 b(8)团队合作的一些心得
    . E9 I' F' b* T& ^- q7 F  o% S8 x, e; A
    1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 # G- n) i5 v! I2 ]0 d3 h: i0 ?
    2.不会乱 不会重复做功 不会丢失工作 2 z9 p" W. A9 S% J  f0 W8 f5 s
    3.经验丰富 总能拿出一种解决方案 / {' s5 X9 ^; r* S2 G' n
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
    ( B& {; Y6 u3 ^8 \7 C5.大致方向总是不差 错也只是参数不是思路 不是算法 2 w$ G  J/ t3 x4 q# M
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
    9 v. X3 e& l9 f0 M7 L7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线5 ~( U0 b* O; t8 J) n
    ---------------------
    . M! Y9 h8 ]: E作者:-英击长空- . s; m4 J5 p! _9 {, a6 N
    来源:CSDN
    : W- ]: {2 v- o5 _, E$ L, y原文:https://blog.csdn.net/qq_26769591/article/details/80840673 ; B! O3 t" _5 Z! E

    0 `% y# H+ w$ j" r: N* X
    7 U9 n) E. _- M; \* y. g- U# p% Q3 i
    8 m9 o' f6 w0 Y, C% O) J0 b
      t  A5 s$ C) n# g, E

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-8-16 01:06 , Processed in 0.412666 second(s), 59 queries .

    回顶部