QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1926|回复: 0
打印 上一主题 下一主题

[建模教程] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-6-5 11:24 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结
    ' v3 x) K3 E2 p& h# o# g

    9 X( O) B# D1 a& @/ u7 N(1)写作缘由5 Q2 j6 ]7 f8 ~* j
    (2)统计描述:
    * ]8 L. j( h* O# q追加用excel 做频率统计
    ' E* Z- _, a" s(3)相关分析(点二列相关 )% J0 g( b! J* A: O  L1 x( u
    (4)回归分析
    4 k8 H$ B0 V' {" z* ]+ O. Z3 z(5)特征选择和数据预处理- F% w) W; ^* ~% Q
    (6)缺失值的填充% T' X  h! |, ?" H8 P1 [
    (7)文档编辑的一些技巧& |4 u8 ]! |- i2 `& @3 ]5 |7 S, |
    (8)团队合作的一些心得  V0 l4 L  o8 P) s4 Y) W) q9 h
    (1)写作缘由! x) e. `& g( t9 A

    ( y4 {7 W  w# S2 Z, Q在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下9 i/ n. L' ?- q! i4 V
      S  M8 |4 `1 s" ~3 E
    (2)统计描述:) t5 N4 ~6 D4 Y& j7 x6 R
    - m% D2 p+ _+ Y6 B3 [
    ① 频率统计 . e! ^2 V) g+ w' c. B1 q
    ② 中位数 , B" n5 q3 z5 `: p- T3 |
    ③ 众数
    1 [5 s% v4 u- c# Z: h9 K! N: t④ 平均数   n* J+ v3 e& x  p' r& ?+ ]
    ⑤ 方差 ( g2 u$ p1 ^$ x. C) e
    ⑥ 标准差
    , @7 G% C2 R! ?! j用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 / x7 q$ j* z# Q# @: x

    2 }2 b" S5 N3 ^, T" U: m! e$ C追加用excel 做频率统计
      z% _" b. m+ @$ z# z( r. s8 x! V5 R( t2 ^6 N  z; O, r+ l! }
    https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
    * D# ?2 R% p( V  t' k8 w* I6 V: G
    # V" Q% B1 r* z( K  s+ S) r(3)相关分析(点二列相关 )
    " u; ]( Z' A0 W" ^  G8 v0 N# _. V
    9 ?, ^2 n. m& `: r  ~* W
    : _% B! r* p/ k6 q7 T$ U+ ?7 e1 `' X. j# H/ a

    # p; Y$ r! V" m: Q; g# ]
    ! K9 E1 p$ `; k# ]( b/ S- ^(4)回归分析
    0 W* O6 @. O5 n: M0 [0 s, s2 ], |8 y6 f2 B' G5 D( h# W% {
    Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。0 E5 W' D7 p4 Z$ W

    + {* b+ z9 h( T1 t' T/ ]  m, }/ B因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
    . x( K1 v: u0 f' t5 O4 C$ ^! B# k4 W
    回归分析一般有这几个操作: - i1 {. X6 X" f  _1 [( U
    ① 设置筛选条件,刷选数据集 valid 5 b1 L! L+ x" _7 `
    ! ^# t+ X6 [6 u& w* \! d9 o

    ! M) F: g" k5 B0 f; ]
    7 _3 j# c' M6 \② 模型拟合度检验
    * @: T# g1 g# n- e: G$ c
    $ p$ M# J3 _/ r6 p& ?
    # o, v  F2 T' d" S, Q/ c! W2 _3 n4 c9 e
    ③ 预测的模型参数
    3 r# g7 d. a1 G$ ~2 t) f
    7 P1 g" s% B" p: S: t4 i) `* Z, d④ 预测结果,准确率
    # x! y3 T6 `( `9 X7 j- x
    9 }. u: a+ d4 m# G: j
    . \9 d+ ^5 B2 b9 a1 u( g  K# a2 p6 @, d9 [" X$ a
    , j. `# q/ }# \" H) k
    (5)特征选择和数据预处理) ]& d. l3 ^9 e" k' ^! ~8 A
    , R2 Q* F# N) t0 J' w4 P3 C
    特征选择,主要是gzh的想法
    % h5 y, M3 K6 T. J! g特征筛选的思路: " ^$ q* \, a- x( D
    分类变量用1 2 3 4 离散值 8 |) n7 t, m. k! X: y. U; ]5 x
    对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 ; Y% U3 S" T: J
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
    7 I( v8 r) Y, z" L+ _( A) \
      w( r7 V: ^4 ~0 m0 V4 _注意了: ) I+ W+ ]3 p4 t  ^8 t" @7 W
    筛选特征的时候,重复性要考虑、缺失值要考虑& |  [  m$ F& k: S# F
    ; }1 O; C% V9 z3 u, z/ D# b
    (6)缺失值的填充0 {2 q% _' A! _
    ; W' j9 C' u+ W( W6 p# Y
    % v* \8 u& i: z
    $ d0 b: }9 n3 t% y  U7 y( o
    (7)文档编辑的一些技巧' t" q3 P. x9 A. n8 D- t$ g8 B
    $ c; u* @# F6 X7 {( r/ L
    https://blog.csdn.net/qq_26769591/article/details/80848841
    + \  `# ]  P: s9 q2 v- ~8 I. z% |/ w1 n" A6 E
    (8)团队合作的一些心得8 r$ j9 X1 P8 a* N) F7 U
    0 ~" U- Z2 {# z& k" {0 h( ^7 s0 v: M% X
    1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 9 W$ A4 w/ g% @* M- W$ p4 B$ |8 ]
    2.不会乱 不会重复做功 不会丢失工作
    1 C  y  \/ V, z) }8 r4 d3.经验丰富 总能拿出一种解决方案 2 w1 O; C1 z# _
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近
    ( d& F% O# ]4 A$ G2 J2 |1 a$ u/ S: h) R5.大致方向总是不差 错也只是参数不是思路 不是算法
    3 ^9 [, O) W# L1 x8 ~4 U* h: _* i7 g6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 # Y3 K6 I5 |0 b/ \# C# |7 ~) m% D
    7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
    % q5 F6 q& B5 i( h6 y5 [---------------------
    7 Q- E3 v% L$ o' y
    ' ?+ M  O* b7 s: \- T5 N4 v/ ^1 f6 M$ l# x6 g" N

    0 u$ |: d& l0 ^* E7 g

    2016高教社杯优秀论文.zip

    12.3 MB, 下载次数: 4, 下载积分: 体力 -2 点

    售价: 1 点体力  [记录]

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-12 14:56 , Processed in 0.404421 second(s), 56 queries .

    回顶部