QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2594|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5250

主题

81

听众

16万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结
    ; D- G: q% V, @3 Q* ]# Z0 \数学建模大作业中涉及到的知识点总结:
    8 U+ N, C2 o; }4 o. y
    , X$ t8 Z) U3 d8 o2 F* j( L) `(1)写作缘由' v! Q1 S" n; Y* |7 n. K, h
    (2)统计描述:! P' p# ]* K+ y2 k/ A6 |
    追加用excel 做频率统计* ^3 j* f, U6 o4 O" w& M3 W
    (3)相关分析(点二列相关 )
      Z# D- T5 z+ V9 c(4)回归分析) u: C) w% P0 r, Y2 F' d4 f9 W
    (5)特征选择和数据预处理
    % U$ e* i# V( _; j% \6 N(6)缺失值的填充4 X6 ~8 W$ i( }3 e3 K3 U: f
    (7)文档编辑的一些技巧) |7 N* g0 a- {9 a, I
    (8)团队合作的一些心得# B% |/ a) o. C9 e  n2 `4 y  G
    (1)写作缘由) u# j/ r/ p7 y" k5 @  Z  r6 W

    4 l3 D, Z3 c0 s' E在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
    ! Y5 M2 E% d0 F6 T- o0 {/ ?
    ' T! ~6 f% N. Y" q(2)统计描述:# \; d% m$ l) N! l1 o& ]

    * e* g4 ]# E; R# F① 频率统计
    8 s: s; K0 O1 [② 中位数
    / j( V. Y& C/ L' }7 p2 e③ 众数 : l: j" N1 V$ q' J1 {
    ④ 平均数 " i( a6 d% S$ {# M5 ]5 q" V5 e8 I
    ⑤ 方差 ; M/ I4 @& D5 V, C4 P8 o% C, ]
    ⑥ 标准差
    $ F& Q3 T. q3 Z, C+ f& x用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 $ v# g! T) H/ \6 g$ B
    : f8 y5 E/ ?' r: W  \" a2 L
    : r1 h) F. w6 `3 s4 _
    追加用excel 做频率统计
    ! ?) Y# H; N( y5 ^5 n& e
    4 v6 x. A$ Q; ]1 qhttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html8 l( J6 {4 t: p

    # a) P/ y9 ^- P2 A(3)相关分析(点二列相关 )
    8 Z" Q5 D9 ^0 I3 l" U" k6 F  o; D' Z+ n/ O+ J1 Q3 i9 D
    - B2 Y( {: p4 L* X  p

    4 @4 K. F3 F4 m. G0 d
    9 |- K+ r, d, ^6 G, {; t6 R5 X
    ! n" n# Q) p6 C. Y! e" L3 X(4)回归分析& ?- F- G' C% N6 W3 _- N8 L
    ! I( P% r/ ?) S+ J, f3 P
    Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。7 _) g( K8 ]. F/ E: k$ X* U

    6 E/ C5 i* Y* S因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
    : g7 S. |) g$ S. z# m( |* K( I  S3 n4 b( r' q- \% ]! u& u  k
    回归分析一般有这几个操作: $ D0 a! K( K0 }
    ① 设置筛选条件,刷选数据集 valid 4 Y. }& A0 m- s. T; P; q
    ; S- {. a0 J) J. F& R" A
    ! f( c; D* H, M8 p

      O0 K! k7 {( W- I. R② 模型拟合度检验
    , D/ U1 D) O6 P4 V: f: \5 j; H0 Z
    " {0 T. \) i$ G4 k$ s% y
    ; l, `( a$ Z, a, ]7 ~) B  S7 V2 X2 H. Z9 R% o+ s
    ③ 预测的模型参数 3 Z! \- o' C# `1 M
    * ^8 Z; S/ R8 q6 d: y  a
    ④ 预测结果,准确率9 [4 o  s0 o5 X
    " J+ a# [/ A* I( |3 `

    3 G- c- }1 O" \* V7 g0 S) A
    % |3 i% I! |0 y! \$ [3 f1 b
    % a( W5 N$ @. \4 L(5)特征选择和数据预处理
    % S: R0 H0 F% X1 Y
    0 @6 e' P' Z/ h- N* V; }特征选择,主要是gzh的想法 & U- F8 V( D9 b/ k2 u; r1 `* `
    特征筛选的思路: 7 f( i  v) F0 O' ]% `
    分类变量用1 2 3 4 离散值 ( g+ C; K; u4 R$ b+ r  V7 x& k
    对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 ; i; }" G2 B6 j. j
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值. w  H" a0 A# i/ ?

    " ]  s. a( [3 `: Z注意了: % a  _+ S. a0 k: m* H6 ?
    筛选特征的时候,重复性要考虑、缺失值要考虑
      {1 j# E6 I0 L% B: Z/ g, @: B6 z% e! \; Q% G6 l/ E
    (6)缺失值的填充2 s4 A' T" J% H. X8 t# K

    ( ]8 v/ {& ]( @/ H2 x5 R( X' h5 n  x5 j2 R
    , r1 p$ b/ I' X9 _
    (7)文档编辑的一些技巧) p1 f' ~$ q9 v" F+ Q% c6 z

    ' v" \3 \$ G$ k- W6 g0 e2 V9 e7 Ghttps://blog.csdn.net/qq_26769591/article/details/80848841
    $ H6 Z# ]3 X$ G  T4 ^- _% x) @2 [7 J% a) ]
    (8)团队合作的一些心得
    : s' K% J/ }5 W1 Y, P5 Z% N& w2 z
    / \' L3 h9 E  I/ S1 C1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
    - z  @3 @, R! P' k) p& v" l2.不会乱 不会重复做功 不会丢失工作 $ u# d& a* f; \: [" J- x
    3.经验丰富 总能拿出一种解决方案 ( I3 Z% P0 ]8 z/ {4 K; X
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
    6 a) I  L+ F  F- F) r' q5.大致方向总是不差 错也只是参数不是思路 不是算法 ( D9 L! R5 i! @/ U0 p9 ~
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
    ! s) b* {1 I) Y* ^7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线3 n% c) ^. T+ ~" N2 x
    ---------------------
    ) s5 l0 l, }+ H9 Z/ z作者:-英击长空-
    & [. r6 K. M- r* Z' y% W来源:CSDN . ^& C" G$ S: o8 V" u: ~
    原文:https://blog.csdn.net/qq_26769591/article/details/80840673 3 l( ?' c0 A/ C! o* w  j6 ]
    ' r7 C4 _) ?/ ]& L3 n2 p1 y* g4 x+ s

    # |& Q5 E) o1 Y; c% V2 E5 P/ s% _+ U1 R
    3 h5 ]- L1 w) b) K" H6 F. g1 ~' g* }

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2024-4-29 05:58 , Processed in 0.322226 second(s), 66 queries .

    回顶部