数学建模社区-数学中国
标题:
数学建模大作业中涉及到的知识点总结
[打印本页]
作者:
杨利霞
时间:
2019-3-19 17:48
标题:
数学建模大作业中涉及到的知识点总结
数学建模大作业中涉及到的知识点总结
, n' j6 b- |+ M) F+ c2 S1 `
数学建模大作业中涉及到的知识点总结:
3 n+ {$ p" g* T, ?( _2 M
9 V/ N! c& O5 E4 ?! P4 O% @
(1)写作缘由
1 J9 @! V" A0 P2 Y9 w& I$ L' ?- U' t; P
(2)统计描述:
# g5 I0 o5 |0 w+ l3 k8 X8 C# h" l* z
追加用excel 做频率统计
5 V' O& y% g9 {) S, T+ O
(3)相关分析(点二列相关 )
/ u, O# Q9 i" c
(4)回归分析
7 _" i- O8 e& a% d
(5)特征选择和数据预处理
3 Q% n3 X) d9 _( _2 z" F
(6)缺失值的填充
9 H8 n# |% |/ y" r3 S0 L4 B+ Z
(7)文档编辑的一些技巧
3 ^ |6 N1 L6 @/ e6 g: S" y; n8 k( \
(8)团队合作的一些心得
' s! y- g! Q& g+ u3 t3 x/ T* F
(1)写作缘由
" \# g" F: ]; i6 U: j
1 F4 }. ?' L& f# o) M( ^
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
v3 t( s1 I- y
7 G! e& v8 f/ ] z. ~
(2)统计描述:
1 |) m9 d- ` h" D
( \; _; F1 v5 E/ G% J! \3 l
① 频率统计
9 g4 E5 F# D) y& Q2 u
② 中位数
: F9 ^7 c: b1 J$ n' n8 u- p% W9 i f
③ 众数
0 q8 @7 Q/ P$ |* h' H' z/ t+ U
④ 平均数
8 y. @& [# f9 T& b+ ]" b
⑤ 方差
' r- m" ?( J! ^+ J' e
⑥ 标准差
. l; W$ |) l4 w U: X
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
i, L8 E0 F$ T- y" a. j+ s
7 O. } M8 p5 x5 G! w
& O8 E! _8 e$ @# Q3 v! {
追加用excel 做频率统计
1 F* t6 S- E) J3 X
' ?1 I% t: |4 y1 N2 y
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
/ \4 C5 N* l. f$ `' Y
2 L# L0 R5 ?0 }! b% p( w
(3)相关分析(点二列相关 )
3 c, c5 h2 m5 C- l
3 o2 @- S, M! m
! ~0 M1 b- B4 m, |- g
& M5 z A" |' k, m4 n+ C3 `
5 b7 ~' L3 o$ G5 u) N& E: U
& i5 L# B+ R* N& v: u
(4)回归分析
c4 F# G/ L! Y& W Q
9 t' B. ~; a, I: v9 t
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
% ?% {9 m, Q s6 z
& H6 B% `. V4 @' m& t
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
3 N3 t3 G# C% h3 x9 p9 t8 @
! X' P' X/ J2 c3 f
回归分析一般有这几个操作:
6 }& e. _8 f! s* k, A
① 设置筛选条件,刷选数据集 valid
6 x5 @4 G( T6 N/ _' C3 h& F
9 i2 R9 C) z! ^( y
' J% _$ Q6 {% ]( v% U* Y+ l
- w) ?6 K& g w3 P
② 模型拟合度检验
* z# V' K; o" R7 d5 r/ W$ J% e
/ h, }. `6 ~% V# z! M- Z( ^: r
+ j" A3 _4 V. W1 I
, |4 [9 M' `. Y/ a# C6 ^
③ 预测的模型参数
* W. v, `) r2 Z6 w& i
1 d3 M( X, V0 I" q
④ 预测结果,准确率
, K3 T1 M$ y$ `+ R
( ?5 h6 H) C- ]1 {
3 e6 X3 v. T, _) M# ^) Q; F7 j
0 q5 V# [7 z) j, c" h4 [
) T5 \% V0 w; ?9 ^$ }( o7 j
(5)特征选择和数据预处理
1 s4 j% f+ R; F
% e/ o' x/ N" k* ?9 L% \
特征选择,主要是gzh的想法
, }& {- a- p' ]) e% }
特征筛选的思路:
: X0 M. r% }3 d- y+ Y
分类变量用1 2 3 4 离散值
1 j+ _& M* K& K
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
: @9 M0 a" X# W
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
# n4 w/ K d' z: W k
( l$ {7 |; e/ G( T1 F" N
注意了:
! w( R; D" ~! A/ K
筛选特征的时候,重复性要考虑、缺失值要考虑
5 A* V; _; s' [* ^
& _/ i6 Y! @9 q! {: _4 _2 m/ J
(6)缺失值的填充
# u0 v3 q* n( ~/ x- a6 q/ C7 |
# _( Q- ^- M6 f0 @. x7 w+ [# g
f) O ?4 B' a% `, K
5 n' C0 Y! y: l, H D4 _
(7)文档编辑的一些技巧
! |% o* p/ }8 t% `5 V$ C# f$ J
) O/ |0 j# e- Y8 \
https://blog.csdn.net/qq_26769591/article/details/80848841
; `4 K9 R* P- {9 c( |
1 s( F) a4 A! Z: l# l
(8)团队合作的一些心得
' @6 n* j7 W: I, F% g1 P6 U! T0 Y
( c* {) ]5 N: W; F" _
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
, Y$ d6 M) n: S- p7 d& A& U; A
2.不会乱 不会重复做功 不会丢失工作
' E" C8 E$ ]1 {* s
3.经验丰富 总能拿出一种解决方案
$ v9 {9 _' d# ]) l6 ` M
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
) J+ I, @ Y( p- H
5.大致方向总是不差 错也只是参数不是思路 不是算法
/ o' f4 G6 z, h9 m; x0 J# S$ o; \
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
4 ?* F& c6 T" g' V" W2 R1 z8 G
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
$ P$ i8 C: m0 X# X- j' f
---------------------
% J' F$ x1 M7 ]$ _1 W' r5 w
作者:-英击长空-
z7 ]' M/ E6 o% J
来源:CSDN
9 y+ V* n5 q' b2 R" j0 ^) O5 j
原文:https://blog.csdn.net/qq_26769591/article/details/80840673
7 [$ J/ [4 E$ u
8 s G3 }# S, S$ r* h
+ B" k$ [& ?% p" g5 f) b
9 ` T0 ~- r5 d$ ?. [5 M* G
( B. Q' B) M2 j1 e& E
16种常用的数据分析方法汇总.docx
2019-3-25 17:33 上传
点击文件名下载附件
下载积分: 体力 -2 点
20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点
作者:
1714830332
时间:
2019-5-17 13:59
学习学习了
; D3 A2 `; d6 L8 }2 P
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5