数学建模社区-数学中国
标题:
数学建模大作业中涉及到的知识点总结
[打印本页]
作者:
杨利霞
时间:
2019-6-5 11:24
标题:
数学建模大作业中涉及到的知识点总结
数学建模大作业中涉及到的知识点总结
:
- S: u- @' M3 c( K! z j
$ H+ {, F3 y+ f; A: `! |
(1)写作缘由
2 w+ G/ P1 C7 {5 O) S
(2)统计描述:
9 d/ y4 x- t8 P* z
追加用excel 做频率统计
M7 P8 s; n- M- ]
(3)相关分析(点二列相关 )
/ q9 l1 ]; s# w" d! t: {* H
(4)回归分析
9 ~# q9 u \, V# K# z9 S
(5)特征选择和数据预处理
; @3 g# t7 F* V* r$ {0 `- H
(6)缺失值的填充
" C; U! P# w- J B5 G
(7)文档编辑的一些技巧
- N. c) V/ F" ^
(8)团队合作的一些心得
% K/ g4 ~9 S" z
(1)写作缘由
/ c3 g# c: l# `( e
/ \+ H7 A; T. \) |, L
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
! q1 `- m1 C1 K8 y6 c5 J
9 [: G( e0 k* w+ S) ?, G$ E
(2)统计描述:
3 c$ Q" B! J) X+ Y5 R, C
+ n) i6 O0 u' O7 h! t6 e
① 频率统计
- k) V( _; `) e0 R/ D, b: {
② 中位数
2 @& b: o3 c* E; a' p, J3 E
③ 众数
$ i7 n: Z' l7 `- u! c
④ 平均数
" p- o- ]0 l9 W, X- }% Z I
⑤ 方差
6 ] q; o. q: A$ R0 O7 W6 a* F/ _
⑥ 标准差
, E/ A' p# D) N" L1 J' H3 a7 m
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
2 i& M8 H9 ]6 \9 u
3 L1 j* ]9 C# T' ?: d
追加用excel 做频率统计
+ c2 ]* Z* |0 s) I* X0 {- K
2 I1 s/ A0 J$ `! l' Q5 j& r
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
% }4 s6 S4 Z/ b8 [7 v
8 ~) S% B( ~$ p+ T% b: k
(3)相关分析(点二列相关 )
9 X; C) \) V/ M. J5 R5 M
k7 X$ P. K+ f" m
. ?. }7 ]9 n. k% n! j# K# Q
4 C. V) b# ]7 h+ U- y
' m: }' T" `) j/ \2 [' s/ {
/ {; ?$ u9 x* m7 z
(4)回归分析
, A( H7 V; z& H3 d' d6 c
& g6 Z' h3 k+ V+ ~& b6 ]) M P7 A& {. \
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
1 y* s. q* o3 b7 s$ `+ c) P4 ]
X% s% @% a5 P
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
' g$ [* g5 M+ y4 {5 I
$ r+ l( _8 Q' P* I" x& M% H
回归分析一般有这几个操作:
8 o+ M6 x* L6 t2 P- y; D$ E
① 设置筛选条件,刷选数据集 valid
3 U+ K# \# k, s$ J8 i
: F3 L! w; Y# e; }
$ b5 T, _' b. A* g! J' d
# X* M! O" r5 F3 l7 d, Q2 ~+ h& z
② 模型拟合度检验
5 q1 r; \5 V; X- k
& G! g: y6 b" T8 l' b
) p, W6 J: f3 K/ y# ~; V4 a
$ h; [+ ?) G3 e- a Z3 ]
③ 预测的模型参数
v4 W# d2 w) S" s+ E# m
0 N; s! k. i; a+ t# M
④ 预测结果,准确率
6 e$ a, ?1 r) ~* y( n
8 _# R3 w" u. g7 p: E$ b: T8 S
D1 D0 ^ O b9 w5 c
2 a2 y4 v- a$ h
( c [0 G @( R" ^
(5)特征选择和数据预处理
4 V2 A: j( R+ k% ~: E7 x1 C
) c; F3 ^, W4 O3 I- ?& E( F; N- ]
特征选择,主要是gzh的想法
9 O3 Y' F& ?/ g- ] g: U; S2 e
特征筛选的思路:
5 A9 z* I+ r4 \2 n8 [) G
分类变量用1 2 3 4 离散值
9 Y% ~# ?3 g3 l# K
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
1 F8 U" w6 C3 f
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
( a/ Z& \; X2 }; N" ^
6 r$ P! e+ V( v2 ` Y# B5 D; {
注意了:
8 [. F# R0 v0 k) J# A
筛选特征的时候,重复性要考虑、缺失值要考虑
1 h! V5 H Z# f
$ u0 g) ^' z8 @, _
(6)缺失值的填充
C3 y' v& F X
; j7 R" }0 L1 A8 P4 x% J5 I1 ?
+ f2 b/ s# ]" u( r
4 F# O# H1 p J" E
(7)文档编辑的一些技巧
$ w" m' ^- r- W. f
+ w. M: j! B3 t- J$ ~0 W
https://blog.csdn.net/qq_26769591/article/details/80848841
; l! {. h, y8 r! V3 o2 B3 C
/ E* N, J$ s: ?3 Q
(8)团队合作的一些心得
I2 S! \* @: N" `" _) s$ L
/ t& h& G/ L: o; p) e, Y7 ]' G% X# h
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
$ S/ e' C" ?& n8 x4 d. v% k
2.不会乱 不会重复做功 不会丢失工作
* o( J. q# o @1 {, ?& D5 e& x
3.经验丰富 总能拿出一种解决方案
. z8 D3 J0 r( W( l+ P
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近
1 @7 @8 O$ f- p s$ a1 v
5.大致方向总是不差 错也只是参数不是思路 不是算法
3 z0 D# J0 L9 B% B: q+ C
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
5 a' [9 z+ ^: G0 r/ s
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
5 [; ^( ]1 ~' w/ @9 k
---------------------
0 P6 A. Z. W& J: T* J4 }
! o# c1 m" l+ b7 R4 V
6 b o0 q$ i; Z
+ g6 s) n/ y" _; B) W: q- ^" w7 U
2016高教社杯优秀论文.zip
2019-6-5 11:28 上传
点击文件名下载附件
下载积分: 体力 -2 点
12.3 MB, 下载次数: 4, 下载积分: 体力 -2 点
售价:
1 点体力
[
记录
]
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5