QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3908|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结# ?* K- m, e! x" y3 h: s; ^
    数学建模大作业中涉及到的知识点总结:6 A1 U3 f* {3 L( `8 g
    ) H3 w; }1 b# p3 b# E  B4 Z
    (1)写作缘由, T+ x; M' A7 M' w& p% \
    (2)统计描述:
    7 a) W/ k; ?9 {9 i追加用excel 做频率统计" K) j! m/ Y2 I" U
    (3)相关分析(点二列相关 )( N( S% {+ G2 r, ~0 }
    (4)回归分析
    ' P& R0 L. T9 A7 Y- \5 O(5)特征选择和数据预处理
    + ?) |6 I4 Q" a9 X5 g(6)缺失值的填充+ S8 j# \" Q  k; {8 F9 O
    (7)文档编辑的一些技巧
    + T. c. E, E' A( L; w(8)团队合作的一些心得' m3 A% l) S2 L) {) e
    (1)写作缘由- _" |( l: ~1 p, y, R3 H3 ]' M

    ) S$ V1 ?# R' K$ G" [在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下; y# j! m) w- @& M! c2 m
    ! s3 K+ V8 n: w  H6 Z' V" S
    (2)统计描述:
    1 z0 Z! m' i$ L+ w! k* X- L5 B1 H# [* g3 I/ t
    ① 频率统计
    8 Y! A; {5 x+ I& O② 中位数 : E# N* |7 E  J$ U; V3 H0 G4 _
    ③ 众数 / B6 p) k' P  }, V& D
    ④ 平均数
    9 ?; x7 j; P6 s& b% i) i0 U$ e⑤ 方差
    3 _* s3 {. O# K1 k3 r, z⑥ 标准差
    . T1 f* Z0 V8 c: i6 ^3 C6 B用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
    7 ~! a; D$ d! ]5 N4 D2 V& x0 A. v
    1 D( v! x* H: k$ F" ?: G( j) i0 B4 b  ^  `
    追加用excel 做频率统计
    4 ~6 t. y% \- ~* p! ]. y- `1 \+ J0 O- L6 ?) g3 T; P: v
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
    2 t1 P/ k! _  c1 w
    9 f) x1 h7 a) W  ?8 I2 v  R(3)相关分析(点二列相关 )
    # S! e7 G. J; P; }! V* q
    . a7 L9 p& y! E3 Q/ ^$ q& k7 ^& C7 m/ n+ I( a
    : D& G9 U# D2 B0 n( s
    3 K# _  t" s4 ?" A8 D
    ! w  |+ a% N5 u1 y
    (4)回归分析
    " _7 y1 h0 W" C: Q3 E; K; b6 y9 C8 F$ L1 j
    Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。# h4 W( e- P7 A& }* M3 T; q% h0 G
    5 p8 ]/ \- S/ [5 I7 X2 u
    因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
    3 r# k* o$ ?, \0 Y1 L5 `, X
    * H# u% M" H6 P6 R6 d( w/ ]回归分析一般有这几个操作:
    ( V" M  E! W: B' B① 设置筛选条件,刷选数据集 valid
    + f6 L! x6 l, Z+ s9 f
    & |1 s: ?) h! k6 M5 ?9 w2 u
    6 b% ?7 l5 v+ I2 S  p5 q/ y8 y. I
    / c- @8 j# _- g② 模型拟合度检验
    . R/ G& s$ `' Z) y- R, F/ S 1 r5 U+ q, `* X/ h
    & J* F% w2 ]( S( K0 v

    * y  T3 {3 `6 ?# v- U  C, X③ 预测的模型参数
    % k2 ?" S3 x3 Z; n3 [ 1 c1 A8 Z& k1 j& K; F2 T6 d2 Q! N/ `
    ④ 预测结果,准确率
    + k3 k  F- v4 j/ Z; Y& @) c
    - R4 V3 K, a* U! A  k! |$ F8 E
    : O6 a- f1 B% A
    ) `" k" ]* I% E
    1 m! {+ c5 a* _- m: e- `(5)特征选择和数据预处理
    , \; X7 d; j  n* L/ d/ y: c/ m7 O* u! h. @+ D# L6 l4 H
    特征选择,主要是gzh的想法 ; }  F6 {+ C9 W& ~+ F, x( S
    特征筛选的思路: ; k/ g9 W7 q' ?$ d! y
    分类变量用1 2 3 4 离散值 ; w# H4 T/ T% }+ r+ q
    对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
    ( P, Q- M% |" Z7 }对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
    / G( L, ]( q- |! m3 U0 {
    2 Y$ ]: |, ~5 ?' r% W% I+ Y9 a3 x注意了: 1 }/ w' }! [9 o1 t% J
    筛选特征的时候,重复性要考虑、缺失值要考虑  O4 I; T; C/ F

    3 D* g$ w5 H  M(6)缺失值的填充
      d4 m7 z% X& `0 d; J
    ) b' I( \3 R/ ?7 X% j$ s2 ^. e* D, u% O  W
    $ o  @* ?3 i, a7 y2 ~+ J# x, ?' H
    (7)文档编辑的一些技巧8 N- B" S# ^& b/ t  L

    ; E; e7 }* {# y6 uhttps://blog.csdn.net/qq_26769591/article/details/80848841
    9 D1 E7 z, t9 x5 v7 i+ s8 P5 C: o* L5 U% u
    (8)团队合作的一些心得$ v3 \$ e& X4 r
    / H1 b4 n% I( C+ }$ Q: \! o
    1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 - k8 n8 h7 O4 ~# S
    2.不会乱 不会重复做功 不会丢失工作
    / D4 f! j9 f) N) D9 C3.经验丰富 总能拿出一种解决方案 7 I9 w$ i* ]% S0 J( H! e
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
    % h! \7 N& p5 {! h% s0 z5.大致方向总是不差 错也只是参数不是思路 不是算法 7 R; C+ k1 M5 V$ W; S+ Y8 v) j9 q6 {$ G1 D
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
    % q$ F( J3 P* G- \7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线! M  L* d; {: x! @/ V. [' M
    --------------------- 4 O& z0 ]+ q7 k" i; g
    作者:-英击长空-
    " I- c# M& a2 H; }' C$ \: c来源:CSDN " L/ U6 C9 n$ _+ y) L/ K6 ?
    原文:https://blog.csdn.net/qq_26769591/article/details/80840673 9 r9 p& Q7 E5 H  S; G
    + K7 O( _* Z2 |5 V7 q
    0 S+ Y; O6 K4 w* k( o

    5 Y6 h7 \( ~+ b6 x, h( W. [
    , Q5 Z1 y+ q, ?# P

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-10-30 05:40 , Processed in 0.761740 second(s), 58 queries .

    回顶部