数学建模社区-数学中国

标题: 数学建模大作业中涉及到的知识点总结 [打印本页]

作者: 杨利霞    时间: 2019-3-19 17:48
标题: 数学建模大作业中涉及到的知识点总结
数学建模大作业中涉及到的知识点总结5 d& Y3 E# e( o2 j+ T! }% h
数学建模大作业中涉及到的知识点总结:
* @! c, Y6 Y/ a! z# W$ G" o3 |  P# `. o* k; V7 k( D% O" [7 H
(1)写作缘由: Z, }/ O+ i; e& x8 H# O2 c- g& ?9 ~! r
(2)统计描述:. n! J8 k6 O9 I6 A0 N3 i) s8 J' e
追加用excel 做频率统计
0 h1 M; W6 D, l  V9 k( T' u0 h& U( N(3)相关分析(点二列相关 )" R: U1 f$ j- t2 p0 A
(4)回归分析6 Y6 [: t0 c) l5 D5 W
(5)特征选择和数据预处理/ }& ~) ~& q' {+ J" l% y
(6)缺失值的填充
9 l) E& S& q) s8 {(7)文档编辑的一些技巧. F- q5 ]' P, ^. T6 w1 k
(8)团队合作的一些心得
, g' K# q" u- y+ m; ~" U(1)写作缘由: }  u* C) w& {

1 I- |$ b# I1 O; c& T在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
# l) o1 H; z; J& s' I& y9 Q6 f
' R( S4 q* l$ {; y3 }(2)统计描述:8 E. N7 z5 g- v0 b; F) k  ^& y

* P% U. q! U, _6 J① 频率统计
( J" t4 ?0 x! R/ n- @  O; u② 中位数   n/ s" S& B: C
③ 众数 / `+ y* M6 j) f
④ 平均数 " n' w! E3 V4 Y3 T9 R1 \3 x9 N
⑤ 方差   s& n! u9 o' {/ d" M
⑥ 标准差
% D* b5 w( G  X, @5 F用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 - v3 F1 c! i% ~

% y3 o6 q) x$ B; M- d; l! E! k# ]0 T2 e  A+ z  p! e9 B9 t+ U
追加用excel 做频率统计
) L" @# o; o7 `6 Q- q+ J' E- i' I9 C6 S/ t
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html2 m2 L8 R" k9 L) b9 h( S
+ ^/ f$ H; N5 d: |- J
(3)相关分析(点二列相关 )% V' |0 E% K- i" K% ^) z! }, |
' L# K6 a% P2 B4 |; T7 m( H& V; D2 C& H
6 {% T3 m$ o$ E& O0 d5 z

  r0 j- N1 f9 L" s- _
& M' a( z8 \; M5 Z9 P& A: d0 T& V) }0 o& O5 q- M
(4)回归分析! W4 I& q' w. u' u( m" c" x

9 e, \4 v7 J0 I" A& r$ LLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
/ u; z9 h8 u* K% |1 ?" m( O' C
$ _$ L, A; m0 G( V# R- E6 t  E2 [因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
! i9 r3 ^& M1 T8 o8 o6 L1 d# c
: }, |! [+ }1 s; N6 L% I8 G$ p回归分析一般有这几个操作:
) F/ U7 W! O. L( F+ @! \① 设置筛选条件,刷选数据集 valid / @$ N/ d  I( w  ]
+ g& G5 ]( s8 t. `$ h4 {' }+ m
5 c1 e2 Q+ p& n* H( u) N
4 ?/ }3 t5 i# V! W4 m" j* S$ @
② 模型拟合度检验
) `3 A/ ^* x. f! H2 f% ^
# Y9 O* w1 y7 k5 x/ u7 E8 w2 v( I5 T; d+ h" Q& e3 q
5 p8 @7 P0 F. G+ N, N% w  K: b
③ 预测的模型参数
$ u5 L. m5 l% b$ i7 _
2 g6 d4 \- d; [: U5 Q5 @④ 预测结果,准确率
' E: Y$ J! h% I+ ?- h) U- l
2 Y1 U; @/ y5 K  D. b* f
1 v# I; g0 \5 o1 l* k% [) @& g5 |3 m4 k" s9 q- \/ r

* |& B  p5 D2 J(5)特征选择和数据预处理
. V' z7 H8 r6 ]% ]! H" r+ D! w& T
" \. Z6 E# q/ @特征选择,主要是gzh的想法
' M8 U0 ^( H! ]( M( C& h特征筛选的思路: , N% C* l; F- B0 K* @( k! n: `
分类变量用1 2 3 4 离散值 * H: }$ Q) a8 w2 q5 r% ]0 k. z) b
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
/ E: J& X* F5 W9 J3 K1 Z% P& S# w/ C对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
* {' a9 V2 R8 p" a" |0 N" t
4 P6 e- N- t# ^* v' o  a注意了: * I/ [* v" Q" R* U# T% m7 Y
筛选特征的时候,重复性要考虑、缺失值要考虑
% }1 v! |+ P- K' ~) d; ~" X! _! x7 o0 t4 m* D
(6)缺失值的填充
5 P! h1 j/ S0 R- o( c' E, \! R4 z0 x1 v5 W

; g" q5 t  Y) a7 Y0 i. s' {) ]
(7)文档编辑的一些技巧
) n7 S3 S7 }: ?& ?# _( d
* N/ c' r, R% \5 rhttps://blog.csdn.net/qq_26769591/article/details/808488413 o3 N0 K! M; D6 G

0 p. a& i1 `0 e( w  v2 _5 o/ n(8)团队合作的一些心得
" K, ^! `, h! P; ~% Q& U, P& X$ r# D1 D9 F; c6 U
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
4 n; m; x( L) r6 B' t- f2.不会乱 不会重复做功 不会丢失工作 / D/ q9 Y- K; G
3.经验丰富 总能拿出一种解决方案
# Q* X( E  ^+ {. e2 n( E4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 & ?$ i6 L. c3 H# v  [
5.大致方向总是不差 错也只是参数不是思路 不是算法 * z- n4 W  l! d. K( i, |
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
" H) w9 d' f6 V7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线5 l$ n; Y0 A! M' T: [+ {$ {2 Y6 L
--------------------- 1 l) H) e1 y4 w5 w( U
作者:-英击长空-
3 ?# }7 w3 q1 W8 F  [来源:CSDN ! v- d" u  Q; T$ |0 C+ j: \; E
原文:https://blog.csdn.net/qq_26769591/article/details/80840673
% V0 L! k* r. F, ~8 l# r$ U1 B# s
. U0 _- W2 u" d$ H
" A- ^( p0 I7 S" j2 ^4 j6 n; C* m  W
, @/ s; H1 C* f/ {

16种常用的数据分析方法汇总.docx

20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点


作者: 1714830332    时间: 2019-5-17 13:59
学习学习了
  Q5 u( K7 W3 g: m8 p




欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5