QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3904|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结
    ! l5 i: l( r3 @6 N# j, |数学建模大作业中涉及到的知识点总结:6 q% l9 {8 a, M; H
    6 U1 B1 V: i6 [; {! q' j( r+ y
    (1)写作缘由4 S$ K0 y% N9 Q+ R
    (2)统计描述:
    + E% B" }, o$ ], m1 b4 i追加用excel 做频率统计
    8 r7 S- S  d% o  I(3)相关分析(点二列相关 )
    5 G  S# `3 b7 p) U# b+ g3 y( E(4)回归分析" ]8 ?2 Y& A7 X' W+ n& U2 q. \4 t
    (5)特征选择和数据预处理
      ~, _, {+ R" h(6)缺失值的填充
    ' l! o7 ]: g8 I1 s- Q4 G9 m- {(7)文档编辑的一些技巧$ T0 ]/ u8 A% V7 X. C0 L; h& J- d
    (8)团队合作的一些心得, h& o# A% r" }2 `8 S: u
    (1)写作缘由
      k8 R; D  a3 H! O
    8 k7 @( f2 o/ O) L0 |) k在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
    ; F  i# k( V1 M7 D/ }5 {
    9 O7 f# {3 k2 n* r' t  D* `2 p! e(2)统计描述:
    ( ^9 k" |* @; i; A7 p  ]: v  L- h/ y- J
    ① 频率统计
    - c' Y, Y$ F# C- ], g2 m* u② 中位数
    7 ?, ?6 _$ S4 _* w' L  A9 L  M6 z③ 众数
    + i+ V% c% J% c# E) t+ t④ 平均数 % c5 [- b6 S3 u5 i5 K) U
    ⑤ 方差 # z; ?0 M- ?( h: C( z% z# w4 k
    ⑥ 标准差 ; y+ r0 l# }' p2 T. b6 |
    用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 ' L* f0 ^) @+ O  `, r

    8 f6 a1 D3 G9 X. y) p7 O0 c6 v+ t% x, f; F" @( [& E
    追加用excel 做频率统计8 P4 q! u5 ?* h2 F9 e% P

    ' b+ g8 D( g9 {; F6 K# Shttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html, Y+ U5 J9 U) D1 b( ~" U
    / p% w; I5 [: V- C" Y/ I5 L
    (3)相关分析(点二列相关 )0 g: ?8 Q8 k& c# L4 O. [
    , {# H* o0 h( W, J" c' a

    * ~- F2 b  q( t# o) k1 X$ Y
    ) k; c: S2 H2 }% p  j' k& r6 s# _$ _2 t' D' P+ x  Z, I* H$ R9 W

    & o1 }' U  ?* s' V. b(4)回归分析
    3 S4 ]: [+ {& G; e$ f3 B8 g6 \
    0 C9 C) H5 b2 ?% L- }! V! Q7 u$ OLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
    % z% q% [3 K  f: a) t& O
    + j3 N: C9 g9 n6 m因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。# Y0 M7 |, y& }; O0 j4 x$ Q

    ! \3 [7 z% V  `( N& n: ]* c3 F回归分析一般有这几个操作: : v5 S6 X8 r; @; A( p9 S
    ① 设置筛选条件,刷选数据集 valid 5 _8 e- E% I( W2 l/ j
    7 w) q4 o0 C0 h' I. C
    * X: @2 R! S4 {: x  S- m

    : K! M- m+ Q  V7 l② 模型拟合度检验 1 y  A5 J7 H. o! q4 m

    # z0 l* B3 D# F( c: ]% s
    7 }' A! s9 e& p9 b- V3 B2 i, j5 b/ `2 F/ V
    ③ 预测的模型参数   z' t" i" k- o0 p6 c2 u* W. Y

    ) |" O" @6 O# i2 l④ 预测结果,准确率& K2 x& a* e+ o3 J" i: H
    1 y) A8 W0 u$ h# O% r

      p: d& U! V& D& s: l
    1 S) }6 _3 D. ?. _" }) F9 J
    - L9 v* G0 O* @) Z* E(5)特征选择和数据预处理
    * ]( `( C2 d8 o: S0 n! r3 A3 @  B5 \8 y' X( y- L3 W
    特征选择,主要是gzh的想法 0 `& I) _+ w, |
    特征筛选的思路:
    " e# v3 W& o* [4 u0 d8 J# M分类变量用1 2 3 4 离散值 ' P! \  p+ w" N' S7 m& w% x
    对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
    3 B/ B7 y0 Y% L% X% }* H$ B+ K对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值, v& ^4 X* }3 N4 _4 V
    , D. r$ g8 m& D! b
    注意了: & u- V9 C% n/ s
    筛选特征的时候,重复性要考虑、缺失值要考虑
    3 M- u$ i) b3 h' m( i# f( L
    # |7 q; f5 J3 h9 ~& n$ a(6)缺失值的填充
    ( V% w/ u- s8 j& Z
    0 X' N( G8 e' w$ V
    % J: n% l1 }$ Z+ z
    4 x( ^1 a" d8 B4 i( b(7)文档编辑的一些技巧1 j0 J) s: K% M- n: {

      ~0 J6 P. J. Y2 O7 o/ N: [& ghttps://blog.csdn.net/qq_26769591/article/details/80848841
    2 ]6 O5 G/ D: w3 T, H2 ?7 T6 [! c+ k/ b. j& h
    (8)团队合作的一些心得
    # s3 S) A' r  z2 V! F1 e/ O2 ?( N5 t  W0 E, W- I/ E
    1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
    % w  F7 A$ a) D' Z2.不会乱 不会重复做功 不会丢失工作
    4 d, w& Y5 W6 g; f3.经验丰富 总能拿出一种解决方案
    2 b4 {; v5 i9 @$ a8 {4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 : E5 m0 r0 L9 j' P& j6 A% z; J
    5.大致方向总是不差 错也只是参数不是思路 不是算法
    0 p# {+ D0 K* t8 ?6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 ; m/ `& T* A% ~2 B, C3 s
    7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
    ( u. u3 c9 `0 r2 j& Q0 Y--------------------- - w' U8 r& F, {( R$ `) j* b+ c
    作者:-英击长空-
    , C8 k# b7 V$ i6 e来源:CSDN
    + @' F3 q% |4 n0 d0 l) }/ y5 v0 J: u2 l原文:https://blog.csdn.net/qq_26769591/article/details/80840673 . d; ~$ c( `. k1 M0 X" c- x

    " E! c) i8 t9 L6 K
    3 F8 L6 R; X6 ?" l( ?8 \4 H* a
    2 d$ ?+ N$ y% L2 ~( f& y+ f8 \# ^. }+ r+ c

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-10-29 22:06 , Processed in 1.111320 second(s), 59 queries .

    回顶部