数学建模社区-数学中国
标题:
数学建模大作业中涉及到的知识点总结
[打印本页]
作者:
杨利霞
时间:
2019-6-5 11:24
标题:
数学建模大作业中涉及到的知识点总结
数学建模大作业中涉及到的知识点总结
:
5 k! g. u; S6 N3 U. n4 t
0 x1 h* A6 j2 f
(1)写作缘由
. `) N& R* h: ~8 M) t4 { ^
(2)统计描述:
$ M0 o# ` N; u/ F1 {) X: Q
追加用excel 做频率统计
( o& _9 w: v3 ^; S1 O
(3)相关分析(点二列相关 )
8 o9 V" F( z; p3 C, Y! H4 ]. ~% z% M
(4)回归分析
! l( V2 G3 s" ~, q4 p
(5)特征选择和数据预处理
7 o8 F |: i; T- p! }3 l
(6)缺失值的填充
& H4 ~+ }; }& Q$ A
(7)文档编辑的一些技巧
7 }* R9 N& H# d& U% O( U
(8)团队合作的一些心得
6 J( c) F4 x4 o/ K# g* `
(1)写作缘由
. D! L6 e9 X5 @% h1 w
/ I k# f3 ?9 P" |' k' ]; L. |
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
( d4 i& u9 N) Z2 e2 C& ], g# Q
5 d# v9 T7 _5 W7 w; g- U
(2)统计描述:
( ]% ]; c9 `/ Z' ~" o( F
( g; h8 C/ a' n! @. ]
① 频率统计
; T/ O+ |9 S: p6 U6 M
② 中位数
1 {9 }4 V+ r$ W* }
③ 众数
. b6 p$ o8 f$ T
④ 平均数
) X# \4 P8 u! a' z
⑤ 方差
1 n C. |3 ]( A$ `; c
⑥ 标准差
2 n+ z% r: }% d9 H, z
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
9 X" R# H- f" z" Y n$ l( Z
& n3 ^7 T& \/ g! _* I
追加用excel 做频率统计
8 T1 y$ w8 M+ V" B {/ L
% A$ @, G2 Q8 U$ m- Y
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
+ ?% }2 }9 v# \3 m1 Y
* T4 i, C& h3 b' N% {% t$ T' i7 y
(3)相关分析(点二列相关 )
/ }6 v" @9 E4 A$ C+ R9 o0 m0 ?
/ @! g3 k0 w. S# W- S
& i0 x/ i/ E' k
# v: h3 R# W$ l0 y+ P
8 w) F* {) R) F- l; s
! b) `; o( \0 V+ b& W
(4)回归分析
9 k. t; ] Z! I7 t! ^
+ R m Z; A7 G+ y" D2 E$ v% R
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
( G5 u- I9 _( X, F/ @
& ^& r7 \) e, q0 Z3 y$ T5 o
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
( L4 m1 v$ y! C$ l0 M
( U/ B! e& n. E8 l$ O/ n0 \
回归分析一般有这几个操作:
; _- i& Z+ \9 @' }" K2 g
① 设置筛选条件,刷选数据集 valid
; E6 T" q r. k8 f/ e
6 P) m4 |' M/ ~4 i! G3 ^
4 K; Q9 t0 w8 ~( b0 }# G
: z) F; ~2 e, D4 ~# `
② 模型拟合度检验
0 |% V. B* n, o B8 w2 c" _3 w
* W" ~! K1 Q+ F7 P
1 m: g& P8 [ Z3 S( d+ Z& H3 v
1 A0 `7 l' K5 F4 O# s4 x0 u
③ 预测的模型参数
. C! n9 p( p3 C
- s$ k) O. e6 W K- u2 \ O
④ 预测结果,准确率
& c) P! ~0 x- d0 X( M! E) Z9 i
; y+ V6 ]! s$ V
6 f* F+ H/ r' J7 }
2 h& B z5 C$ E0 D
: A* Z1 W, J8 L8 ]( k. X
(5)特征选择和数据预处理
6 h5 n' I: ]" ?+ i0 _( _
( T9 H( P! b& G5 y
特征选择,主要是gzh的想法
. H* y( J1 {% I9 o9 F: m5 z) s3 f
特征筛选的思路:
( z! @9 d' M' e+ O
分类变量用1 2 3 4 离散值
, i3 e F6 ` b9 X" e& k: n. u
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
1 f: l7 D7 |! X
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
- V" g, W+ _1 A' B' T
2 d: E0 _% F0 k1 f" I" J
注意了:
9 Z E1 @+ x9 ?3 _9 D
筛选特征的时候,重复性要考虑、缺失值要考虑
9 |- {& G7 k* o6 N, ^9 Z
3 X, M" V4 Q U: S
(6)缺失值的填充
2 u* e8 ?9 |6 ]1 D6 A
$ g- l. v6 o9 {+ L8 t8 f6 n
6 n4 X4 i3 f' l8 X M+ Y0 ^ C
3 V8 N$ A. X& ?- e% W
(7)文档编辑的一些技巧
0 ~: a1 D) m- g! J+ p8 A0 Q
) P+ H5 ~2 u5 d+ w+ W
https://blog.csdn.net/qq_26769591/article/details/80848841
: S# w; Q* T1 N& u6 P3 F
3 z( F) g. |! n+ @* \
(8)团队合作的一些心得
8 i3 @6 v" R7 J& E' e
5 L$ C$ W, W! O+ N* k- }; w6 m8 I
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
* h( G$ e5 i+ v2 @+ G" B/ f
2.不会乱 不会重复做功 不会丢失工作
" r1 T5 [0 Y! n" Q$ q3 H; D& t( z
3.经验丰富 总能拿出一种解决方案
" }5 i% D- j3 G4 R
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近
- m7 |% y/ V1 F5 @
5.大致方向总是不差 错也只是参数不是思路 不是算法
4 k+ a- G" [9 c0 o7 H( S7 b+ ~
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
" s% t6 f6 A4 L! r* h: o' W! W
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
5 l7 M: P% U" N3 `) w2 U& u
---------------------
! m0 g2 _6 T! ~4 L/ T: x
( V9 }0 j2 w$ l- `6 ]- R0 L
2 ^ @- U! ~9 h0 x+ l M, f: g
& F1 _* {/ Z3 V5 Q
2016高教社杯优秀论文.zip
2019-6-5 11:28 上传
点击文件名下载附件
下载积分: 体力 -2 点
12.3 MB, 下载次数: 4, 下载积分: 体力 -2 点
售价:
1 点体力
[
记录
]
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5