QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4222|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结2 Y8 j6 J5 M3 k# ?) D3 h6 p5 c# N. v2 d
    数学建模大作业中涉及到的知识点总结:+ B9 A; V9 h  W$ g/ F

    8 k& ^" g" f' q# ]$ G(1)写作缘由* ^0 s9 C. j% }) q( u
    (2)统计描述:- Q. _% K" x* I7 p" ~
    追加用excel 做频率统计
    2 O- w4 d* y4 _$ C" U(3)相关分析(点二列相关 )
    . F5 P0 t1 o9 x0 V" u4 O; k8 S(4)回归分析/ Z7 c5 M- i. h3 ?7 Z
    (5)特征选择和数据预处理+ m+ U4 X+ f/ M" B1 p# J1 e' D/ [) P
    (6)缺失值的填充  ?, v7 K2 B* C
    (7)文档编辑的一些技巧5 j' Z" t) J- t7 P6 ]* u% o) ~: ^1 ?
    (8)团队合作的一些心得
    # t! @) h; s. C0 C! [8 j0 B: i(1)写作缘由  X3 G5 K) B0 U, e% `
    5 W) H) ]- t) Y& ^$ R
    在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
    . T7 i  W5 [0 D) V0 M- Y2 L1 s# ^* u! V8 \) C' j
    (2)统计描述:
    / o( r/ C5 v) z
    8 a2 y. I/ }# g9 j, V① 频率统计
    7 i, Z  f6 |% V② 中位数
    7 C2 O% R1 j1 w& z% I# D③ 众数
    * e3 E/ D. x0 T% Z, C, g. H3 a+ ~④ 平均数 6 _& i3 Q1 @. i; k
    ⑤ 方差 + y( k8 X8 A- E- a+ Z/ ~# s0 \/ L
    ⑥ 标准差
    - N4 M9 B8 n6 t% h# o用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 6 n5 F) U7 E5 I7 _" Q
    . i6 F* h7 T' c3 p8 q
    1 I( u6 j5 f; E" ]( e% F) H
    追加用excel 做频率统计
    * `% ?% W) ?: Y3 f) d6 H% c: F6 l0 ~4 {
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html/ ~; e8 `; Q3 m! T( u. ^9 N
    7 K- ^2 ^" x$ U! G  f' q! r
    (3)相关分析(点二列相关 )9 F/ }9 R* O3 q3 l

    " h  ^, M* h/ x) f  H9 E
    4 \1 y+ q9 u$ `% h1 O) y+ a( b( z3 y$ P7 z! {( k

    ; f5 i1 j4 k8 _
    - R) b1 m! T! O, r(4)回归分析
    3 a; s2 M4 b( l1 R' X5 a; K8 y6 ]1 a4 o0 B" W, C0 T" c. k5 d
    Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
    / f# d! A* E8 ?( A1 ^4 i+ d' P, J+ X7 r- g: O
    因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。# D" m/ h8 e! y# @5 r

    + V# K7 Z  k0 ?+ M4 T) X回归分析一般有这几个操作:
    ! `- E, v8 }, ~* s① 设置筛选条件,刷选数据集 valid
    8 y% Z. u9 p: n( p& v% t; o6 I" W  U4 Q
    * l- U: n2 d' X. j- t
    8 y( u* \$ V; |# Y0 @2 |4 a0 q0 m
    , d+ i/ k8 e/ T# b* @② 模型拟合度检验
    # C) D- i" @( p) F/ O& G9 } 1 S! j/ ^1 E+ \, \

    8 w! n  i/ e6 B& w1 b6 _2 ~4 s3 d' [8 P% c7 k
    ③ 预测的模型参数 1 _  r' H0 E" i$ d
    6 e+ e% p: e1 u* q: K" H4 F
    ④ 预测结果,准确率% p  B: e, w+ L" P3 g

    : U% T' m, o1 c: V; A - j- w% D- X# x, ]) A7 U* ]
    / V. q- {7 @" h8 F

    % b6 R- l, R5 t- ^& @7 }(5)特征选择和数据预处理
      O/ d0 j' o" W0 i: k
    ) \7 m3 Q! l4 M# b; e/ p特征选择,主要是gzh的想法 / O* b$ ~. G6 ^( m/ G. ^
    特征筛选的思路: 2 n" W0 o0 N% y6 x4 N( c* Z" T! r! Y7 \
    分类变量用1 2 3 4 离散值
    # p/ g0 t+ l1 F对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 3 _# Z) a+ ^+ z6 M1 j
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
    ) o$ G3 O/ R5 X1 F6 R; a, R& l, ~* K! L7 E% R" W+ t
    注意了: 2 V9 Q( y: {1 r: k
    筛选特征的时候,重复性要考虑、缺失值要考虑' z3 p6 ?8 ^, }# H
    - J+ S$ }6 X  p/ l7 p: S9 d2 a& n
    (6)缺失值的填充2 k* {! C7 q! R$ b$ b$ x

    & R. i% x8 F9 m6 ]: _/ E8 [2 m# p3 E2 }
    ! L, d5 H% B0 q( \3 z( G
    (7)文档编辑的一些技巧
    ! a% [# E! H- j# m6 y' S! U, H8 ?7 k* g5 G/ `' {
    https://blog.csdn.net/qq_26769591/article/details/80848841
    5 ?) R7 H4 q# A; {. C/ k* f1 ^
    3 ]( r( l8 n/ X3 ]( I(8)团队合作的一些心得
    . u/ q: Y% J  B
    4 z8 A7 Q2 J) R( A% o# w1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 ) v- q& l1 _, ?' s3 f$ a
    2.不会乱 不会重复做功 不会丢失工作 1 _+ \+ Q, d, W+ [$ d" }, w
    3.经验丰富 总能拿出一种解决方案   c3 u4 {# c/ K1 ^4 e7 }; o
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 , {  b  ^9 V  h
    5.大致方向总是不差 错也只是参数不是思路 不是算法 # d2 v7 G$ J. u  ^
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
    3 [: `4 L2 v0 K% H! C7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
      Y/ `6 Z, G$ G( _, c4 f2 w1 ]--------------------- : R' @3 i& j  x9 v& D2 I
    作者:-英击长空- * J" F# L8 O1 G2 Y# w) b6 i
    来源:CSDN ' |# U& P; f4 r! ^5 l
    原文:https://blog.csdn.net/qq_26769591/article/details/80840673 ) L: k: b% H5 V. M$ q3 \

    # z  n4 e3 P* n# A/ r& e  H/ v% x, I" b: q# N/ {2 [
    * C- j8 i. j6 @' S, T9 F

    ' E) J# l% U+ u' E4 m

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-22 18:18 , Processed in 0.510881 second(s), 59 queries .

    回顶部