QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3795|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结0 P' d3 @% r3 j" r0 v9 Q
    数学建模大作业中涉及到的知识点总结:+ X5 X( f/ y' b3 U' T
    + a+ z; t& E" f
    (1)写作缘由
    2 p3 o% H: g* g* q$ T(2)统计描述:; P3 b2 v$ P+ w/ P2 J) A& F
    追加用excel 做频率统计
    ( ]" h4 a0 V4 Y, o! d/ U: X: Z6 V4 J(3)相关分析(点二列相关 )
    . n6 z# c0 F; C1 C4 V9 o0 F(4)回归分析
    8 e" H- ~' C  a" H, p(5)特征选择和数据预处理
    ; b; ~$ y. b$ e9 S6 }7 N$ q3 ^(6)缺失值的填充
    # k# N7 A$ |  z+ i% ~(7)文档编辑的一些技巧
    9 o; w; c4 @- `2 q(8)团队合作的一些心得
    9 m6 J5 U2 U; o(1)写作缘由7 ]1 L' T9 f0 i) I8 Z1 h2 q
    % K) B" [  d. Z( ^! j  L- C0 R" E: d
    在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下& ]! \( p1 f8 q3 x
    2 R2 s1 j  Q) C6 r; {
    (2)统计描述:' ?( W& z6 j* l5 _9 Y0 B

    2 [+ v- j8 n, E7 n: j, D① 频率统计 0 {7 U. P, {, H) Y! y1 Q6 E+ ~5 r
    ② 中位数 " s  O% P8 C( ]4 g7 X( p
    ③ 众数
    ( |" u) D: ^: v  N+ ^/ g( Z④ 平均数 " }$ X( o: \0 d
    ⑤ 方差
    + H5 B/ _0 {9 u; m/ c. U; ^. H⑥ 标准差 / E+ d$ B* m- T5 K2 y$ n! K0 ]
    用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
    . C/ Z* y7 `% P3 U8 v# O# Y7 s: S
    ' ~+ [( o8 N" M5 N* M3 P3 u0 t6 T$ t' |  B3 E4 y) \7 d
    追加用excel 做频率统计% h% t. W' x, S7 [( |$ b8 \' f( p

    & @, F% O! f: W  j8 thttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html, D, {& S6 m5 V. @8 r0 m

    , H7 G- T; p% l4 D9 C" v5 m) v(3)相关分析(点二列相关 ): C) |; J! e9 o6 x# W
    / y# c0 a2 i; Q+ L3 h
    ( R7 r5 V% N. m! w* \0 p
    1 H7 C: O* _8 O9 \3 J  a

    ( N. r9 Y; }$ r: d: z, q  Z" l' \* ]6 z9 v$ E/ V$ L
    (4)回归分析: j& j( X( f+ b) Y0 q$ F& s

    / P, s& o6 L4 Y5 ]Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。- y* u+ r1 A% x5 S0 Q

    3 V: {' q9 p/ K; i因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
    # K7 w7 U. N, Q0 E2 |: V) V& D/ ^2 e7 x
    回归分析一般有这几个操作: 0 F8 ~* O% |7 R1 a7 P
    ① 设置筛选条件,刷选数据集 valid * Q- ~8 [# H$ T
    : t4 j! v, S3 B) ^+ f

    2 k! A8 {! J8 h: f0 W8 N" b, Y3 e
    ② 模型拟合度检验 3 F+ ^1 s! m7 l
    1 `* W9 V1 U, W! }

    ) g# G% `4 h/ ~0 I  l
    ; J' S5 P6 A& m# S/ X( H③ 预测的模型参数
      b% Y, h" R4 V. D5 i. \- }
    " M% o  V0 S8 k% z+ E④ 预测结果,准确率
    8 f/ h6 \3 |1 _9 N, h5 y$ q( b
    8 p! Y2 f, p. e; t0 j6 @9 Y3 } 4 {! P, @! f9 p4 D' l; [. Q/ p

    ; r5 }3 o# }# z/ ]; s
    % p8 _/ e  b3 S6 c4 b; Q(5)特征选择和数据预处理% u" K% \2 M, ]+ @* X; i

    1 F1 b* ~, u( \特征选择,主要是gzh的想法 6 z6 Y/ L5 r9 R1 O6 r
    特征筛选的思路:
    " u1 @3 @& Y# d* w( R$ d分类变量用1 2 3 4 离散值 * f* I) {- {+ E' `3 g- r
    对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 ; Z& l& r* E/ s; R* t& Y: M
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
    7 ?4 r: F' r5 h8 @7 |6 E
    1 `! m3 h/ Y; Q注意了:
    , z3 Y; h) k3 H$ {筛选特征的时候,重复性要考虑、缺失值要考虑
    , }- U4 M+ _- F# y" m! B
    # k0 V0 L/ t: y6 ?(6)缺失值的填充
    * s! j7 b; m8 X, i/ I3 A3 n; A
      g0 g( x0 o8 B3 a  A
    " J2 P9 p! k, t3 v
    - O; ^+ o# l, a7 ~# Y: x(7)文档编辑的一些技巧& M% q2 F, K" X

    ( T) k- o/ i4 vhttps://blog.csdn.net/qq_26769591/article/details/80848841* R: Z. |+ U( c5 p
    : v- H4 [9 g/ [, B7 q
    (8)团队合作的一些心得
    : A* ^; ]% m: s$ `$ k) F+ T# y4 O  {$ U6 e' \2 e
    1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 0 x& Y+ R. M* m4 Y4 q0 o9 U
    2.不会乱 不会重复做功 不会丢失工作
    ( F/ L" T, f' v* f* {0 j2 N3 g8 u3.经验丰富 总能拿出一种解决方案 - B" ~  P' t8 B6 A% |8 K2 [0 L% c
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 6 x3 ?" S) z( `, G. O) L8 w8 I
    5.大致方向总是不差 错也只是参数不是思路 不是算法
    9 M; ?$ N1 |/ S+ b6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
    6 i$ [( Y; F/ \" u$ g* G7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
    + g  z  ]2 p6 b--------------------- + Z8 k( h/ U0 L+ q% b" z* u/ J& F% N
    作者:-英击长空- 7 G8 N( [3 h/ c$ h7 {2 g
    来源:CSDN
    6 O# Q* P. c; ]7 O0 ^' k: Z原文:https://blog.csdn.net/qq_26769591/article/details/80840673 , e! j6 c2 N  V) [8 d

    ; K8 p) O2 u$ ]/ o) i- Y! z. s; m0 d6 |$ r5 n2 [, @

    3 m& W- M6 K  V, H
    " l3 x* \: g! T) C

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-8-18 19:31 , Processed in 0.490116 second(s), 58 queries .

    回顶部