QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3793|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结
    ' K7 l/ e' V/ L' i+ O2 M4 {数学建模大作业中涉及到的知识点总结:
    9 o$ s5 n7 v, o, K3 Y3 {# S' J8 @) L$ ^/ B6 Q5 R7 l( [
    (1)写作缘由
    : d- k5 D; T$ P$ z  K: v* p; a9 n1 E3 }(2)统计描述:
    . ^9 H/ g$ p- d, h追加用excel 做频率统计
    : M) H) G! V- W9 S2 _; o$ P1 {(3)相关分析(点二列相关 ); H, I5 D! V6 V
    (4)回归分析
    8 _; \4 D- ^- f# H7 |(5)特征选择和数据预处理  D- r9 B& W# b' g2 q6 g6 K
    (6)缺失值的填充
    ; ~0 c- f7 ~8 @2 F(7)文档编辑的一些技巧
    # V6 ]8 @# {0 ?( N) K: M# x4 E(8)团队合作的一些心得
    # \+ T- j" S. ^) z1 H(1)写作缘由8 R" P' `# F' T; N
    ) y' ]; A5 E6 p; u* S* K# q
    在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
    2 B; G6 n; k4 W7 D0 F# E; H1 q2 _% W( M4 j
    (2)统计描述:" E: L( M2 F4 _# _1 T  R, Q

    & e! f$ y& `5 `& n( G5 \① 频率统计 " y5 b' o" N) Z" O, n
    ② 中位数 & q* i# }2 x7 ^
    ③ 众数
    9 G5 w' p- P% g! h( w④ 平均数
    1 c9 Y8 i; }+ s1 X⑤ 方差
    1 x# Z: {$ X! M- x* g  M⑥ 标准差 0 a7 |  z6 L+ ?& v
    用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
    7 I5 m( ~& J$ q; y1 R. o
    - W) |# D+ p1 y! z& U+ O( g! F% n
    4 ]$ _4 C; C' ^" T: \追加用excel 做频率统计
    * h0 n- z) ]9 c5 W9 G" R, z) L6 T7 \
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html* X/ p, f: l  M  _

    ' |* q/ U, ?; X# \, q. o- s( X(3)相关分析(点二列相关 ). K0 O, @% e' p0 _5 g
    + Y. F0 b4 D9 m; w  k

    7 X5 K: o# |. p- q( x1 a7 g" o/ e% P  K3 O+ q* m# R  H
    ! e/ H# c# k: w
    . r( R2 \+ Y+ s/ }& H; E5 B
    (4)回归分析3 P2 w9 r8 K- J) `, z; B

    " r5 O5 C* Z5 N* Q7 g2 r, OLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。+ [9 \  @% X  x2 C/ L
    + @3 A# K0 R: }
    因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。0 I" I" R0 `9 m. l* p# K+ @

    # L( f& i& _+ h. y回归分析一般有这几个操作:
    " w  Y1 K: b5 _/ o. H$ h  F1 v① 设置筛选条件,刷选数据集 valid ; C9 c8 I; P) F- K  w& Z1 T
    2 k# w7 x- r( L7 N( j- l

    * @0 v4 ]! f. j$ u, e" t8 y- j4 C4 Q9 v- q
    ② 模型拟合度检验 % R) I; `' z& A. \
    + S$ F8 Y# P, m' Q4 V* T/ I1 ]

    ; K, p$ t$ c+ T# H3 k
    5 h2 u- _# f/ x③ 预测的模型参数 % j6 N8 W, T+ }6 N6 Q
    0 S1 d" j' ]0 [- q2 Y
    ④ 预测结果,准确率6 w% x0 d1 f! H  k* q
    : b7 ]7 W" f$ _

    . ?, h9 f, T3 Y8 |( Q! n1 z: F! M8 Y' D/ H! S. S
    , b2 D4 W- n3 p+ ^1 L* l
    (5)特征选择和数据预处理
    $ S% P& j0 ?2 C! i4 b* B! y+ e2 W# U: p+ H
    特征选择,主要是gzh的想法
    ( J  p  N1 w# y  J- C' H+ q. d. ?特征筛选的思路: ; ~. t7 }4 ?. T: k* `7 Z- j
    分类变量用1 2 3 4 离散值 : c7 q1 c8 b: K9 p
    对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
    ! I. A/ t* t, a+ t, b& i对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
    6 J& B4 a/ V  t6 S  I3 C4 {- H/ A3 i" V. E1 h
    注意了: 0 }$ D5 ~# E/ R4 |- G; r  ?
    筛选特征的时候,重复性要考虑、缺失值要考虑( x/ F0 e3 m+ o3 N+ [/ V

    ' U3 |/ ~9 i- v( x2 `# U(6)缺失值的填充5 x. o* R6 a# m. v0 ]' I( ]! {

    % ^8 D. |$ B$ C7 z8 s) V
    # S3 u4 K/ D- S2 x% S3 K0 A- u* _
    (7)文档编辑的一些技巧
    - B/ y! S5 V8 X2 w
    . m9 u0 r& H' C+ _# B6 _https://blog.csdn.net/qq_26769591/article/details/80848841
    ! H' U- R6 M" `$ k
    6 G7 o2 ]" M# }: T(8)团队合作的一些心得+ z6 X- G" `  o# T3 u

    $ }# Z5 U* h' K6 }0 n1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 0 X) Y9 p7 w7 ?8 m3 S2 r$ B: s, K
    2.不会乱 不会重复做功 不会丢失工作 & E. p2 Q+ }7 o. m& A
    3.经验丰富 总能拿出一种解决方案
    ! d6 W5 i2 `6 ]2 V& R+ \4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 & _* {& |3 v" A. A: ^- ?& U7 T
    5.大致方向总是不差 错也只是参数不是思路 不是算法 5 ]) n: N- O  X% {
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 * i* I/ \* @. s# w
    7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
    7 R' N1 z. P3 q4 j" [: d---------------------
    ( Y5 ?2 c9 ^; F$ I/ P. R6 z作者:-英击长空-
    : }2 t5 }: f; V; }0 H来源:CSDN
    6 I$ X' d% e( c. l0 r原文:https://blog.csdn.net/qq_26769591/article/details/80840673
      ^  q7 v: u0 G" g5 _: d) _  G$ r: z% X2 A' p* Z8 R
    / M, J' T) v+ P: {. Y% T- M5 N
    $ D1 t1 g9 e/ I+ f& @7 f

    ' K0 W6 ~; C* O$ \4 k

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-8-16 15:16 , Processed in 1.092763 second(s), 58 queries .

    回顶部