QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4189|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结3 }/ f( \5 Z. C$ @6 Q+ [& ^
    数学建模大作业中涉及到的知识点总结:
    ( f2 a5 l4 E" P9 E
    : r  [, l2 c1 S3 _' a(1)写作缘由' z2 p3 E- W! t* h* l3 P
    (2)统计描述:
    ; J* u) d7 ]; j追加用excel 做频率统计# V# g( g2 {* i/ X2 `$ \4 s' T
    (3)相关分析(点二列相关 )
    % n: E  X1 n/ B  @7 S- `(4)回归分析
    5 |. z" s4 J5 N8 I& G* u1 e; O(5)特征选择和数据预处理
    ; }2 S% ^4 Y# [5 d: _1 N( J(6)缺失值的填充5 ]( y  J& y. a: m6 V) X! C
    (7)文档编辑的一些技巧
    9 s4 g/ r8 f$ [: {(8)团队合作的一些心得8 ]) y6 h* c9 ], U; ^2 Q
    (1)写作缘由, c& I/ {7 k/ H& m. w7 j

    " e7 ^% S7 h: `. L# e, j" W在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
    6 f% ^5 V' A- z: s& `0 c) }2 w! o' Z3 d' r0 b7 u
    (2)统计描述:. @$ m' L* p  U: q
    2 v8 r. {- b: `1 n
    ① 频率统计
    2 U, j" ~+ H4 j' @& O: m7 n② 中位数
    0 o" n9 i3 D5 L& [/ Z③ 众数
    % s6 |, Y+ o7 {④ 平均数
    - |9 r6 \0 h( s) ~2 U" a⑤ 方差
    0 f0 b1 p$ X9 {9 ?⑥ 标准差 8 D1 U4 D2 I% N8 F- U3 x2 h  D. {
    用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
    ) B: }% U9 T4 q3 H$ R3 \4 |/ j" Z' V/ ~" [$ |9 n' B

    ) X, ~' J* G6 e- E, z: b! @6 ]追加用excel 做频率统计
    / q6 f; X& C1 ?  ], k: d, D5 @- c$ n- f) B- \2 [- G" \+ Y' ]
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html$ V; `" e9 y! K. w- T5 H7 i  q' i' q
    4 E/ ]' q0 j/ q3 \( Z# d
    (3)相关分析(点二列相关 )
      Q9 a& J& O; H, ~' w! u- p  @
    ) {4 P( z1 Z  Y: I; h, k
    - y6 N& P5 r+ T! V, U& y2 L6 V0 X0 S  p0 r- X  U
    & B/ \' R4 m2 X! K
    8 _1 V* N, K  M
    (4)回归分析
    + ]0 N7 M8 c4 K6 C& `6 z6 c+ j( N% j- n1 {& i
    Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
    7 @$ V. `, V: I8 W6 i$ g
    4 H, M* a2 e- e, Q9 G8 {因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。5 {3 h. ?! h/ T* [: a( E) M
    ! W+ [$ _% U, r- _. {  \6 d
    回归分析一般有这几个操作: " e# A0 _  }9 G9 \* n% v* L
    ① 设置筛选条件,刷选数据集 valid $ w' |& ]! [: x: w

    2 s7 Q! `0 _4 S2 o9 X$ t" A9 L- W# ]0 f

    . I! q2 s- f/ r( H. X2 Y6 a: T② 模型拟合度检验
    , B* o$ @$ F2 O1 ^0 G9 |
      C; l6 Q4 c' s9 ~7 g/ I: q) R: C2 D9 |- i" d2 D  U% x

    , b5 H& a8 L+ B③ 预测的模型参数 2 L: o" u9 ^" n7 y

    8 t- p  A. O, ~) F$ ^1 p④ 预测结果,准确率
    - U* [8 Z4 G3 ?0 N
    * v& _( S. F( a* _
    % T7 u: R4 B" I. I+ i; n8 f0 n! D; r$ [" H' T/ R3 X2 K
    8 U3 U2 n3 T8 ], x
    (5)特征选择和数据预处理
    + e" C. H' y% _' Z6 `8 A$ h# M& t$ J4 F* c- r" `) r* ^* X! ^
    特征选择,主要是gzh的想法 / `! \- l5 ^& g" Q+ M, ~4 g. Z
    特征筛选的思路: ! R  ?' b9 i' s' }' u0 T7 y- ^1 \
    分类变量用1 2 3 4 离散值 2 D. ]. y$ i3 G1 w
    对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值   v; _  g! S3 S4 G! d: p
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
    & K/ Y. B2 N, F7 s5 g: [
    5 B9 I$ T# g- H8 F& }- `注意了:   x, c) s7 P* \' n9 g4 D& d
    筛选特征的时候,重复性要考虑、缺失值要考虑
    8 j- ~- N7 y# i( S$ Q' I+ j
    0 U! ^0 J; {0 j$ C+ \! f(6)缺失值的填充
    , \! w  s' [2 \) j$ w0 o. r7 V* U4 y: B5 y, e$ z

    3 S! d& W" m- j1 `1 i1 K* k6 H5 Z) U3 U+ c6 F
    (7)文档编辑的一些技巧: c1 T; i; }4 V# r
    " Q# X! N9 D0 J) g* q! c2 a; {
    https://blog.csdn.net/qq_26769591/article/details/80848841
    ( Z9 t7 A$ t% b, D8 k- X$ x' q
    ) f4 l3 |! g' n0 }9 N, G(8)团队合作的一些心得
    ; n5 G7 d% A9 [' m8 a6 P6 ^
    * V0 ~, i; a, p# z$ K1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
    ' ]0 g6 a3 L0 r+ t  c1 c2.不会乱 不会重复做功 不会丢失工作
    - `* Z; G" \+ ~5 a- ~3.经验丰富 总能拿出一种解决方案 0 Y# @( n$ Z' I( d5 H) r
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 0 K+ B2 R# s! Z% `6 B3 l
    5.大致方向总是不差 错也只是参数不是思路 不是算法 8 }% w5 u4 ?+ C' y
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
    6 S* n+ L% R. E7 q7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
    ! u' j9 x" b, w---------------------
    9 f- X! K% N2 G3 C& m作者:-英击长空-
    ( Q/ w6 l/ K; h4 G来源:CSDN
    * j3 a7 E+ e' T! a& ]4 K0 u原文:https://blog.csdn.net/qq_26769591/article/details/80840673
    . A7 M- @- |$ q. U
    % j; G6 @" ~3 I
    6 |, J0 A1 h  C5 l% Q# ~2 Q' u
    * @, K8 S) H  |7 r+ y
    0 `' U' l2 P; P  U  J. `% Z% S5 N' D

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-5-8 06:47 , Processed in 0.488286 second(s), 59 queries .

    回顶部