QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3569|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结' K5 Y( A2 u+ J  x& d
    数学建模大作业中涉及到的知识点总结:
    - w; M* `8 n8 U/ o0 v5 D8 H' J. R4 U, E' ?5 d! U# @' v- u$ ~
    (1)写作缘由
    4 I/ P5 E# j7 ^' P(2)统计描述:
    6 M& u3 w) a6 C+ H% S% Q7 l; A* t追加用excel 做频率统计
    / ], B/ p: I$ |) N, R(3)相关分析(点二列相关 )( d) o5 I  j& v+ E5 A$ v( X
    (4)回归分析. |* i/ ]9 ^" I! y
    (5)特征选择和数据预处理
    - y$ `7 w' `  _; h6 X* @(6)缺失值的填充3 p# W3 T7 C' Z1 L# ?2 F) l
    (7)文档编辑的一些技巧5 _; A* Y$ m* Z; @# `8 S% u
    (8)团队合作的一些心得
    7 ]" D$ S7 a, L(1)写作缘由
    ! g. S. W2 b# U' _/ K7 t4 b5 ^, `& a( X! J6 y3 }7 }9 A
    在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下/ |; j) I) X8 p& B/ [+ l% |
    7 f2 O) Z+ d! q; d3 g4 V( C
    (2)统计描述:3 j- A  u2 q8 S) V4 n& ^" P' r' T& n
    & G4 y# a4 Y' l/ S( E
    ① 频率统计 0 ]5 c/ V/ J! Y( A0 \. ^
    ② 中位数
    5 n7 L! m. q. M③ 众数
    ; e2 R, i  ]4 j$ _" u8 J④ 平均数 4 h" o4 e1 ]. Z! @  m) D1 a) _( R
    ⑤ 方差 & |* H% A5 X; S) I: d$ q
    ⑥ 标准差
    ! N3 K3 y8 C% ]/ z2 H: g用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
    6 j! x: ~$ w7 _' P0 W7 U' _: k% s0 N

    7 N$ P" J% p4 s1 Z! j3 k1 v追加用excel 做频率统计7 y; a8 T8 s: K2 j  U1 Z# G) \

    * G! @' x8 J: P0 J7 V/ C$ ~" [https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html5 P4 U, {$ ~1 }" j7 i( W

    % y5 H% v2 d" w9 }6 Y" l  Y(3)相关分析(点二列相关 )' U0 L! \$ N" h4 t

    2 G1 n8 Y* Y& l! g9 k# ^
      z  C' j# M* n  S
    ! I9 d+ Q6 D0 E3 v. e5 y! C- u6 D  J2 _$ _" O

    * t# C+ M) J0 L' K(4)回归分析
    6 w3 S, S/ {# W& K( Q  G% R# j: M0 A* {# o
    Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。! q! n" z5 g, {" Z

    5 S; S; J/ a" O因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。6 V5 Y$ A+ ~) Q/ M
    8 p' Z4 f0 q9 {. b, Y
    回归分析一般有这几个操作: - w$ X$ ?9 U" n6 r
    ① 设置筛选条件,刷选数据集 valid
    ( X, S5 F9 b1 e; P
    : j; Q( \, @& t0 K/ \7 U) l1 r" t
    ; Y9 s9 K! ]  N' O+ W% R" b% f) v0 q6 }
    ② 模型拟合度检验
    % P& ]: y$ J2 J9 J4 M2 { ( `: Y0 d: \4 h3 e& O# |4 k3 L8 \0 c

    " B2 E  I  F0 s" F3 E8 S* Z6 G% ~$ J  K; @  W. G: m! D
    ③ 预测的模型参数
    7 A. m" G+ k. l9 @7 f  |/ g! D
      P6 a3 s, G* v* e9 P' B④ 预测结果,准确率
    - O0 x4 ?% ?. [1 w" j, k" k
    * e' S$ @& Q+ _4 n: z  f
    ; }1 I, a$ F6 v! }& n. V
    7 U' c7 k# l, ?- ]- l, `3 H* n) ^7 [' g* m" ^( ?
    (5)特征选择和数据预处理8 _9 S9 X1 L. D  s* l- |9 C# [& x, ^
    * v. {  I+ x; f: a/ ]
    特征选择,主要是gzh的想法 4 E& U! @8 `$ F- d& k' B- F  i
    特征筛选的思路:
      i, a8 l5 G$ j2 G( s( b* W$ h8 Q分类变量用1 2 3 4 离散值 2 `  u0 Y% t2 d/ ]
    对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
      L2 W" b9 Q8 a1 e对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值' p8 Z4 y3 m& c# k( |/ B
    ) _9 b! ^8 V; N+ n" |) _# D
    注意了: ! u" T1 @2 H' P% Z
    筛选特征的时候,重复性要考虑、缺失值要考虑+ s* f- `7 k& B- ?2 A7 Q
    / l6 z7 L3 P, z- [1 d% c
    (6)缺失值的填充" i7 v  t) e' p; @8 V

    7 ~3 d6 R: \( u
    4 E. Y/ P, T. Z" J# {" B
    : K8 N! P3 M: K5 M" w5 A. o% X" A(7)文档编辑的一些技巧& Q8 [2 m# U' K

    0 E7 Y2 h( N) H+ ?' d( khttps://blog.csdn.net/qq_26769591/article/details/80848841
    / Y' x+ T+ |5 R
    / M( c4 v' L( G2 z5 G# X. B(8)团队合作的一些心得8 C( [  V+ C6 @  I8 z, e
    ( ]$ t. l' n& H. x% |2 T5 N' L
    1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
    * B- P! b& d. J* j- j2.不会乱 不会重复做功 不会丢失工作
    : q( E1 t+ E4 B7 J5 @+ i3.经验丰富 总能拿出一种解决方案
    . I- [# Y8 [$ T4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
    3 o% A$ ^% x. G" T( r3 e: K5.大致方向总是不差 错也只是参数不是思路 不是算法 8 r  m( O( }+ _
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
    7 P% x1 n6 j4 R4 A8 i7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线& L* R& S+ G$ x4 `
    --------------------- 7 l4 p2 k9 ]7 }; X0 K
    作者:-英击长空- 5 e1 J- N- _) u1 F
    来源:CSDN
    % h' s: S( z. U. G7 `7 K& n原文:https://blog.csdn.net/qq_26769591/article/details/80840673
    % S; N8 I% o3 u9 r
    3 W& @* X0 g, b3 z6 k5 ?
    + y( f9 b, u1 T! T$ d2 \5 J8 R) z$ N" O. ^2 B

    0 S' n$ W& a1 T1 B  o$ p

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-6-25 08:49 , Processed in 0.467491 second(s), 59 queries .

    回顶部