QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4166|回复: 1
打印 上一主题 下一主题

[个人总经验] 数学建模大作业中涉及到的知识点总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-3-19 17:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    数学建模大作业中涉及到的知识点总结+ F6 I% Z( H9 m9 k4 a# i& H& ?, L
    数学建模大作业中涉及到的知识点总结:
    5 b/ Q" g) r! V6 v, d( I6 e+ `/ Z  h  A3 j7 n5 X  Q+ u8 P
    (1)写作缘由
    3 b. c; s: L" l5 y' J2 g$ ?(2)统计描述:6 W! z2 C  w$ u7 f" V
    追加用excel 做频率统计+ J* Q9 v! y8 C. f5 R4 ?
    (3)相关分析(点二列相关 )
    $ M: m. F" @7 T* S% W5 X(4)回归分析
    ! Y6 R* D) d4 w: M" U4 H(5)特征选择和数据预处理1 M6 H0 ~8 z2 o  z# {$ U( L3 r
    (6)缺失值的填充
    $ i% q+ P! c* E) B6 M(7)文档编辑的一些技巧
    ) M7 ?9 }' n: t) J(8)团队合作的一些心得* e+ X0 j" m) J0 k# p# \( }
    (1)写作缘由% m: b3 V- l4 {, G# l

    7 U; R/ r2 r( Z: ^) w+ j! x  \在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下: n$ i) e' t2 k( g  I) \/ _

    9 c5 h1 T" n( {- n3 ^( w6 G(2)统计描述:
    + }  ?& s* |9 X, p$ ~3 Y, `7 T" G  r1 N" [' O
    ① 频率统计
    - U+ T0 c1 \: f7 a* I; v+ \② 中位数 % l8 f# t' l3 r6 X4 ]
    ③ 众数
    1 U# n; U: n+ V④ 平均数 . h1 H# W- j+ r0 n
    ⑤ 方差
    4 B) z. A( o6 v  ?3 P⑥ 标准差
    ' N+ g: W, Z6 {% x4 z$ |7 L! l6 q+ v用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
    5 a0 J4 l2 x* `  [8 g. K6 \1 \8 I: p
    : P, _+ ?/ D. c0 O! i
    # F, N! z+ r+ h$ E  L* q9 B2 P追加用excel 做频率统计
    " b7 ^/ Q: o6 p( a8 S4 e
    9 L! F2 L; |8 W; p" L/ ~7 ]* d( Khttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
    , G& V  Y1 o0 H# `% l' h
    ( J- c8 V1 y, N(3)相关分析(点二列相关 )7 E# {) X# _; e2 e: H1 @. W

    5 z) d* D7 {: c+ `# a. @2 O' _
    * U* W' x. P) r4 y' C; h" k' R/ L* B
    . i1 [7 a& a% r* N" K% ]- ?! u) l- a3 s
    * }3 x* u3 ]6 u# h& B8 Z% k& f
    (4)回归分析
    9 j* A- G; f7 e4 U
    1 d( _* L- e. ULogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。2 Z4 z/ o( p9 m' y

    * ?1 K! Z1 o$ ^3 _因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。8 l: i$ k6 f8 k3 X6 k

    1 _! {6 Z4 [6 r. ^- S3 |回归分析一般有这几个操作: 2 U& F: W- m# {! |+ s$ Q0 ?1 ^
    ① 设置筛选条件,刷选数据集 valid
    ( I' Q1 r! C$ D4 o0 V4 U: a. @0 q: R2 S9 ]- J: C* ^7 p
    0 ^8 b, ]# R! o" |: s
    $ _" K2 I2 I1 K7 `- Z- g" t
    ② 模型拟合度检验
    7 h+ H+ U, A8 L& @+ N# Q ) ]: C' L% Z, ?1 U0 Z" Q

    # K. n0 m" w: \: G. a- W/ Q, e' c4 g/ Y$ ?$ D, g. H
    ③ 预测的模型参数 ! Z! |# }6 z! ^+ r% `

    / ]# k; m8 X4 w$ Y& E. k4 O④ 预测结果,准确率
    9 r9 P. K( h& u; X$ Y7 `
    & m  ~+ w! b- V6 j6 O - e+ h: o5 C1 K9 C* K8 l
    " R% d& n+ S4 g& y5 m1 U$ o% [
    5 u* E  Y4 q- s4 ?, z, n
    (5)特征选择和数据预处理
    % T& l! m% c7 ^4 A* n4 B+ o' L5 X: J6 f; L1 v0 S, E! Z9 N, j
    特征选择,主要是gzh的想法 % ?9 `0 h7 i5 G! h, @4 Z
    特征筛选的思路:
    7 r: E7 {" z# @" _8 z. f分类变量用1 2 3 4 离散值 7 l; E9 Q$ N6 p" P2 a" E& {- ^
    对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 5 S! P% A9 J' u0 Z, x4 T8 @
    对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
    * s% ?& k4 a8 p5 x  r+ Q+ @6 F' G0 s! M9 N0 P% s) V0 p* k
    注意了:
    ! g3 M" q  F6 t筛选特征的时候,重复性要考虑、缺失值要考虑" `! e6 `" \0 m8 w

    8 {9 u' e" E. h( B(6)缺失值的填充: v0 ?1 E: u# k3 e

    " H& X8 w2 z6 R5 V4 V5 q
    4 t0 a1 v1 s( ~" x7 U) b; p) a. B
    0 {9 b# Y8 O+ W& {6 Y% g(7)文档编辑的一些技巧0 G5 u1 v: l8 t5 {& [( ^- k

    * f1 M4 c/ d7 p& N* ^https://blog.csdn.net/qq_26769591/article/details/80848841% C5 f8 I3 |% Z) [- S

    ! d3 |8 Q3 ], h" S5 Q(8)团队合作的一些心得
    " c; r& T/ L1 ?
    ' k# m) R5 C& K: n1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 $ [9 T6 K  f7 e6 R
    2.不会乱 不会重复做功 不会丢失工作 # q9 D( R4 p+ f- C; y
    3.经验丰富 总能拿出一种解决方案   {  ^9 v/ @( ~! z& s5 k8 X- S4 n
    4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
    + R# i3 E7 Z, F5.大致方向总是不差 错也只是参数不是思路 不是算法 9 A- t9 g9 M. n/ _2 h' r8 C: Y; u
    6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 $ ~$ e8 W+ e3 G3 r4 E
    7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线3 l, {$ s$ K) e# w8 H) d. ~9 k1 |# R
    ---------------------
    + b8 Y- Z: i9 f- {! \作者:-英击长空- 2 M& e0 g3 z, m& P" f
    来源:CSDN 3 Y  o; \) {0 [: N
    原文:https://blog.csdn.net/qq_26769591/article/details/80840673
    & k2 `9 _( u- P5 d  n( Y- O  r
    # q. O" S; U* r9 n! f+ W( J) F& A* o) p7 s' m) N# Y- T
    : X/ U9 x$ x0 W0 a9 Q
    - d; w! }. S1 n* y' r

    16种常用的数据分析方法汇总.docx

    20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    2

    听众

    8

    积分

    升级  3.16%

  • TA的每日心情
    郁闷
    2019-5-25 20:27
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    网络挑战赛参赛者

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-12 10:15 , Processed in 0.432351 second(s), 59 queries .

    回顶部