数学建模社区-数学中国
标题:
数学建模大作业中涉及到的知识点总结
[打印本页]
作者:
杨利霞
时间:
2019-3-19 17:48
标题:
数学建模大作业中涉及到的知识点总结
数学建模大作业中涉及到的知识点总结
7 m, ?' y0 o y7 }
数学建模大作业中涉及到的知识点总结:
9 G* N. V+ N+ j' Z9 W+ J3 b
y1 O" K1 _7 ^+ {) y
(1)写作缘由
1 I( U! H+ W& B; u
(2)统计描述:
! W$ P! ~4 l- Q5 E) P
追加用excel 做频率统计
5 h: ~ C3 ]8 v+ K6 p! q
(3)相关分析(点二列相关 )
' @9 Z- `% ?* \/ j
(4)回归分析
$ L( P8 K8 i4 p: @
(5)特征选择和数据预处理
# T# \% D. l; i7 T+ L6 I. a4 S- g
(6)缺失值的填充
. G; W8 r! R& ~! h
(7)文档编辑的一些技巧
& V1 j# x+ y& g+ @9 v6 H4 c. u5 d# m
(8)团队合作的一些心得
" Y( V. r9 W" r9 l
(1)写作缘由
& I; r/ s3 I: h* l1 o4 `) [* D
# R. y, ~" G3 U0 h6 B
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
! X8 ]7 l/ ]0 }2 j
; N5 f; l* S) s: }+ h: `
(2)统计描述:
0 ~ x% ^: H; c3 r; B3 M. n
" z2 v/ Y0 N1 s' Y& g
① 频率统计
9 v" S% A3 @6 H7 j x6 h2 z
② 中位数
' T$ j% q! N2 x, K5 k Q: ~! p
③ 众数
9 s$ A# N4 j5 p8 I0 }
④ 平均数
4 R5 W% v! X9 Q \$ o% \$ `
⑤ 方差
4 f5 W* m3 q8 j6 T" ]% y* e+ Y6 S
⑥ 标准差
' A- s) ?4 C" w* O/ a& c8 n( I4 T
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
) n, c- L7 ]/ j" v
0 _! |% ?" S3 }: |4 ^7 q* t
6 \9 ~! W, o3 D3 \8 Y
追加用excel 做频率统计
8 k0 C7 Z' s* t# R* A: M) @
2 C( x) W4 c# s. Q# }5 j( @$ c
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
2 g- H- T8 J# Q' O; R' \. R- r/ Z* G; I, C
" m9 S z; D6 C$ F! Q2 s
(3)相关分析(点二列相关 )
- O% T0 k$ k. t% \0 B# \! P
" L' i [5 l5 V7 h V
0 c) e3 i- u# J R, |
M0 R1 z: I% ~) X* B0 d" G$ s8 s
4 y# G0 N& J y, V! q- l4 T$ L, y
* N0 ?$ i; L" i, N+ ]' m$ G+ B
(4)回归分析
w" D d- {" Y, F" G1 E
; W5 m" v2 t- Y# h9 x
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
6 E a0 ?0 W- q
3 y# @# H9 v! N, o. u
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
; B! X3 q7 B0 I2 e5 P4 }3 Z4 h! f
. k: t- i+ o* l% g* r
回归分析一般有这几个操作:
0 P' }' [+ J6 Q# D
① 设置筛选条件,刷选数据集 valid
$ a! \) U' Q& W# ?( C9 T+ p. }1 a8 N
! {8 \, m: c3 P" z, m l# {* M
+ B5 s6 G6 {% @, e# }* r2 K1 o7 m) v
) d" X: Y) i+ ^5 i. v# F
② 模型拟合度检验
* S- J/ Q9 |5 B( z3 W# b# B
: z" k3 ~2 o* t" j# n; E
* A7 k5 b$ @6 p
4 u1 L* S$ A, d9 Y4 d5 P* }
③ 预测的模型参数
- _5 U9 G; v0 J+ K5 O
$ X% `9 L. |% y0 x+ U
④ 预测结果,准确率
( q% H/ ?, y0 N
! i: F. M5 n/ \ i
) L: G3 Z% X2 y0 ?
3 Y% Z0 e6 {3 C! M) z
+ h- t% P! ]( F- o, e
(5)特征选择和数据预处理
4 a# I6 v* c' \1 c2 D1 ^; Q! v
2 k: s9 l% Y" n D' Z8 q
特征选择,主要是gzh的想法
7 j7 B6 x# ~8 q( [/ Q
特征筛选的思路:
$ V" b& x' \5 r; X) a! p; L6 q) D
分类变量用1 2 3 4 离散值
- r3 |; p7 z2 _7 [, } {
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
$ p( H6 ~& E! b* r8 i
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
0 U( R6 g5 l- K8 z
3 C% c" s n2 V
注意了:
& G8 ?9 J% x$ M I9 a3 j
筛选特征的时候,重复性要考虑、缺失值要考虑
& r9 D9 |4 ~) l1 A2 \! ~ T" c
) q" `( z+ V" h( A+ z
(6)缺失值的填充
% G3 O- q8 ^. k- E
- Z A7 H7 x$ b; ~1 c
/ M, J0 m# r7 _# c2 \& ^
" F6 N4 P' _& s4 Z; s, b
(7)文档编辑的一些技巧
2 @1 U2 R0 l. p* A9 g
( S' E; G' G. P3 U. m* w* J, A
https://blog.csdn.net/qq_26769591/article/details/80848841
) D) L! }* i8 Z A1 C
) R N4 } W! _( R5 d
(8)团队合作的一些心得
2 S+ U* n4 Q: q5 H. h( R; v: J2 w
7 {% h/ v9 I2 V
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
+ y/ v! p3 `9 Y+ r& D
2.不会乱 不会重复做功 不会丢失工作
" ~1 L9 _, o+ [/ v6 t7 X
3.经验丰富 总能拿出一种解决方案
/ i G- z% T* w# O+ {# E3 ?' Y
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
! l! T" N' L; \- @! k1 i
5.大致方向总是不差 错也只是参数不是思路 不是算法
8 d: S @9 \1 \3 l; X; G
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
2 x1 E* F1 y. M+ m6 N6 s4 {
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
9 Q* R9 j, \$ t( N0 t, ]
---------------------
1 k' `7 f! h4 ]9 F9 ?
作者:-英击长空-
% M& K; a) x6 V4 }! f( x+ P
来源:CSDN
, q& a7 v& {' W$ K: X: W2 J1 M7 {
原文:https://blog.csdn.net/qq_26769591/article/details/80840673
* @8 \4 F2 y* J( x& y, R4 K1 y9 r
) u; b) k% U% L0 U% o6 b
6 J% m/ T2 e/ o& A
9 B. c$ f2 z3 Z6 ?/ y9 R5 Y/ z
: D# ?. V* m( p9 B# W# B
16种常用的数据分析方法汇总.docx
2019-3-25 17:33 上传
点击文件名下载附件
下载积分: 体力 -2 点
20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点
作者:
1714830332
时间:
2019-5-17 13:59
学习学习了
* D$ u# s2 o5 E; N
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5