QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3860|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结
    " f% O: Q$ v) x  j5 C8 S  j4 p数学建模大作业中涉及到的知识点总结:' I# D- D% B6 @$ V' S
    % }1 w; ?1 `/ ?& L) ^
    (1)写作缘由
    . a) ?, p8 E: o, Z(2)统计描述:  ?9 m7 F& z# J
    追加用excel 做频率统计
    ) \+ m6 ]% r3 x7 Y(3)相关分析(点二列相关 )
    8 ?/ }1 E( K1 w* |; U& `6 F; |(4)回归分析
    ; S9 G+ x) F% l- K1 }. ](5)特征选择和数据预处理' K5 R: O/ ~% A. i" e
    (6)缺失值的填充
    7 F* F5 [' o# ~(7)文档编辑的一些技巧
    9 O( L# C' m, ~8 s(8)团队合作的一些心得$ u$ g$ U7 G: ^$ F5 e/ S
    (1)写作缘由
    + Y% x- ^+ ]* M. s
    " b1 N/ N3 u! c3 s+ p' d在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
    $ J9 X( C  d! I/ y+ C1 X; i$ f
    3 Y8 c2 t4 Y( h4 G- y(2)统计描述:
    3 d  t6 j2 m  \: ^5 z/ n, K1 s; s6 T
    & ]. J" n$ g& P5 f+ X① 频率统计
    8 R; L! `* i& T1 S5 e; ^) v$ f② 中位数 3 z+ H/ d) e3 A; r
    ③ 众数 , X; l% a3 ^4 R! G- {8 z, S1 e3 [
    ④ 平均数   \; R; w9 E. s; v
    ⑤ 方差 & L. N, z) Z& z+ ]* z
    ⑥ 标准差
    * i% y( s' B3 F  f5 D用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 4 l2 E( L& Y. I( t" Y; V

    3 m; H9 E, |% J7 Z/ a, _
    ( V" A/ F6 G* c追加用excel 做频率统计  F% N# {: S* s. I

    $ U# c8 h  Z. @* p. zhttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html4 K8 Z2 X- h7 f/ q

    7 F/ z5 x+ o! ~- S- T" a* `0 z% w(3)相关分析(点二列相关 )
    . @3 T3 {9 i  N. s1 b/ N/ N2 E) ]" x
    ; v8 _3 N: F6 a# C% ~1 z! c) s

    2 P5 }/ v, \1 D7 k; q6 V
    & p8 ^% |& r$ E! W! t4 g& S+ b  y' P7 b+ E
    (4)回归分析
    ; v  G. ]$ K" ]4 _( ^5 F/ v* x! C4 t+ V4 u+ z+ A
    Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。  H3 G+ S, `7 D) h4 \' d& H( V
      n7 P$ o8 }, I% T4 C4 C
    因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
    % v0 o+ Q, R/ I' U- B% @
    ; v; B! V( y. L. ~# v1 _. S回归分析一般有这几个操作: " t5 _+ g; k) `7 _
    ① 设置筛选条件,刷选数据集 valid
    ! ?8 C$ W# M; A% S9 K" D3 ?# U* D5 `5 [
    ' `. J" h$ y9 P, u% c
    + }! a4 u& B/ b# Q6 @, j8 k- t# o
    ② 模型拟合度检验
    ! S* p0 O# }* e! D 0 x: w7 C: b& }
    1 a4 U! l; w5 {0 z
    6 o! G8 ]+ J; \: N
    ③ 预测的模型参数
    4 q- @( n5 }0 {6 h) v
    - d1 S- Y7 }. K% J0 [5 ?- B1 C! d' v④ 预测结果,准确率/ O/ ]8 r1 [( z- G/ ]4 d

    6 a: V2 i' `2 l' L( f   ^5 G) W. N$ V: n
    5 A0 n, D' C% L( D* Z' E

    8 ]8 C7 q! W' f+ r% n(5)特征选择和数据预处理: q+ s. t. G  o5 {( ]/ _6 t
    # @+ _8 D! M* ~7 p* S
    特征选择,主要是gzh的想法
    , n+ W0 g  E2 X8 U5 u5 M' J特征筛选的思路:
    8 c3 R$ m- q1 v* G; P; G$ d* q! G分类变量用1 2 3 4 离散值
    ' _* w* y( F2 k9 P3 B( R对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 ' \* |& o% U* x
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
    . |) q' y. ~! F, z. ]6 K! x; D, [4 D. O
    注意了: 7 k, a: T+ O# c; y5 o) U5 f% _
    筛选特征的时候,重复性要考虑、缺失值要考虑
    ( `( y7 Q' ^. h. k+ W
    # X* O1 @/ k9 s( c(6)缺失值的填充
    $ F6 F2 n9 N7 e; t/ B' w5 U' c9 q3 }: S- {  L- U. v# Z+ `# c! M6 T, E

    + \( V9 t5 V0 |4 Z) Z3 z! T" W5 @8 |& j9 }3 A
    (7)文档编辑的一些技巧
    . f1 T, }) `2 }( N+ n  L3 |
    ( s: x* n# G/ d% h; K& Rhttps://blog.csdn.net/qq_26769591/article/details/80848841! D6 V6 L% I4 W; I# u8 n5 n
    $ b! m6 C% w8 }9 F5 m: k( s9 ?' t
    (8)团队合作的一些心得/ q; j9 R+ g( ?6 a
    5 H2 h5 g& N! \4 K: P
    1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
    # a7 y- }& q3 c& v( x, e" E+ [2.不会乱 不会重复做功 不会丢失工作
    - v' J( e) N, b3.经验丰富 总能拿出一种解决方案 3 v& n8 E% v  [* k9 P% d$ A
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 2 P2 \7 x" F$ ]( f- Z* {3 f# F
    5.大致方向总是不差 错也只是参数不是思路 不是算法 * d4 f5 K9 I4 _* m9 `
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
    ' k2 T; ~- D0 Y) H% G9 v! u, _7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线. l& ~3 B# U* e
    ---------------------   K* M8 r/ J% N* N6 U/ T
    作者:-英击长空-
    " \7 h  k! y( R8 a2 X* y来源:CSDN 5 {- p, Y! z, `
    原文:https://blog.csdn.net/qq_26769591/article/details/80840673 7 y6 m. v- W; A4 B8 [9 p8 P

      n3 P$ I" |! _! @& {5 N* V3 C& A+ \
    ! a% o' r" K! Y1 R& N- ~+ a0 `

    3 T7 w& D5 |$ z$ ~( }6 _6 r* O8 s

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-9-16 19:06 , Processed in 0.577664 second(s), 58 queries .

    回顶部