QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4162|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结* M9 T  \; r0 p
    数学建模大作业中涉及到的知识点总结:- @" m. H5 e% k& x
    - F& x- ?- ~, ], h; y! @
    (1)写作缘由
    / P$ k/ `/ z& W; S& ]* g(2)统计描述:) s, b% Q% H3 P  r9 o: g+ ~. K
    追加用excel 做频率统计
    0 X4 f7 l4 j2 g* H8 ~6 _(3)相关分析(点二列相关 )( ~0 h5 _8 _- d3 e: _* h) T
    (4)回归分析# B0 T7 R$ _* W+ v9 q) T
    (5)特征选择和数据预处理
    % K/ ]/ h" o" U1 F(6)缺失值的填充
    : V( c4 r9 X6 D0 T(7)文档编辑的一些技巧) Z# o$ r: I, y% A* T. M
    (8)团队合作的一些心得
    ' l1 Q1 r0 O" N. X) ?: p) j$ w(1)写作缘由
    7 A! J3 p7 k3 m) \% W2 g+ i7 c/ C& k
    在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下7 y& d2 Z, L' n+ p# q9 M
    & D: w1 O' w: S. ?8 H6 d" T
    (2)统计描述:
    , Y: s3 ~9 A, Q. L% e; B: [0 |, }4 J( v/ b  }" n5 M! L" ?: w. J
    ① 频率统计 & O' l0 P' z8 i/ a; E
    ② 中位数
    # U# V0 T- f' u' x% V; Y+ S③ 众数 % V: A) a5 O6 a: D( @
    ④ 平均数 8 ^; q( \0 Y3 S# T# P  J# P( w$ l
    ⑤ 方差
    8 ]! }6 [4 j  a  t⑥ 标准差
    ) m0 v1 _  y% D8 T! x; y. n用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
    ! c) f* }3 O# U% I4 u% U* }% F2 q& Y9 E$ O
    0 |( Q: ]' Q( c# W- r$ u. \& M) N6 k# |
    追加用excel 做频率统计
    ( _5 Q" e  `/ q5 b( _( U
    . q. R2 `/ z7 p5 q# m7 k+ ehttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html1 f0 q9 o/ v. v

    * g; F+ I- p, \" M+ W(3)相关分析(点二列相关 )7 l" e( i5 ^; ?4 H1 x" Z

    ) g$ X7 D" ]: ]' B# ^9 u+ I# @/ [8 c3 m7 n, r, \

    * U' |7 ^) Z9 m1 N9 V* H! D6 C) {9 b
    - A" `8 |7 t+ \, n* Q! {
    (4)回归分析
    7 }% y- d% l) Q
    $ _" k' a2 Q. F- a: u5 p% ~Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。! h, w7 S: ^& n. n9 M

    $ k' R2 O& F* j因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
    5 h3 {( B# p% u$ c4 k8 k& _1 W  ~; F9 X- W' [
    回归分析一般有这几个操作:
    3 w$ K  u. I* z, O% j& M: S* N8 \" M① 设置筛选条件,刷选数据集 valid $ w  W8 ~9 T1 y5 U7 ]& q# c
    % h! V1 n/ B  N/ _( F
    9 v& x  L2 c% q# [' J

    * R  {, I: f6 n; m② 模型拟合度检验
    - U  p/ a) O& Y, g% O 0 P, P2 ]% c) ]' `  E1 M2 f
    . u4 V5 n9 F( x2 v

    ' ~4 Q0 U% o1 A7 p# _9 y+ B8 b③ 预测的模型参数 5 B4 N, A) u% q# Q7 y9 z

    ' o% O7 {& d& i2 U! J④ 预测结果,准确率; m6 R: s: y" K: D2 N+ e. X

    1 a' S1 T: ]- I, D' o  J9 q# M7 B 0 ]$ p( B6 v' u5 Q3 V. }7 C( ]
    ( C" S& F1 Z2 ~- D) f
    9 b" m1 e2 X7 a' n  V( b, W
    (5)特征选择和数据预处理
    7 |: W& h) z2 k4 @
    3 n* K9 r2 O% \' B特征选择,主要是gzh的想法 2 j# }. \. E$ g' O* g' H- w/ v
    特征筛选的思路:
    * u6 u) V* _( I& @2 [! D  I分类变量用1 2 3 4 离散值 ; v# h! Q/ ^7 ^; V
    对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 ! V: [3 @  p( H+ `
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值/ X; _7 x; s# a! c; R
    , `. ]2 B- A2 V$ S: E* J
    注意了:
    % S, I, i6 a* m2 K8 }1 l3 b3 R筛选特征的时候,重复性要考虑、缺失值要考虑; @, Q2 R% u9 M) _4 u
    ) c- M4 V2 x! F+ v. G
    (6)缺失值的填充
    . V5 S1 k: K$ H7 n, V- ^; x3 Y8 m# X' Q) L

    8 B) p' `7 v; a! R- w3 y0 c
    - n( n$ @+ _& H% l: G6 u(7)文档编辑的一些技巧
    % v& s: _/ f6 G: q; L% W9 G& |9 g2 ]5 q" ~, d2 B: `
    https://blog.csdn.net/qq_26769591/article/details/80848841
    # O# ^, ~7 u% o- u+ ~+ j+ }' g& z7 y9 q7 h8 |/ S. e% E
    (8)团队合作的一些心得* `( X9 N" f1 {) J+ l+ {" f/ O
    # Q# H9 C# T1 ?8 Y6 i
    1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题   C% W$ L+ M% b$ l4 ?  |
    2.不会乱 不会重复做功 不会丢失工作
    ( [) T0 z7 M! q1 e7 H5 d" A3.经验丰富 总能拿出一种解决方案
    ' b8 |3 l0 e6 w9 k  Z$ B5 o4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 # Q- i  r) x/ s: l- X% H
    5.大致方向总是不差 错也只是参数不是思路 不是算法 & Z5 G+ X) ]' n! E6 ?& g
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 ) j' ~; l6 ?  y7 P+ ~7 H2 t/ R
    7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
    : S: k/ P# p( {7 ]4 q- h/ m; r--------------------- + c1 R% s- U5 Y3 @2 L
    作者:-英击长空-
    4 X; D: \0 l/ ]9 \- Z; Q) {来源:CSDN : b% Z6 x5 U9 P7 h
    原文:https://blog.csdn.net/qq_26769591/article/details/80840673 $ |& w! q8 ?+ k/ z" e0 I+ t( X
    / Z$ h1 e  M1 C, Q

    " C$ Z' ~8 f. b+ m8 Z
    $ a# d( l% n& F1 `& E3 T6 e1 F$ v2 J+ \8 ]

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-11 18:16 , Processed in 0.448153 second(s), 59 queries .

    回顶部