数学建模社区-数学中国

标题: 数学建模大作业中涉及到的知识点总结 [打印本页]

作者: 杨利霞    时间: 2019-6-5 11:24
标题: 数学建模大作业中涉及到的知识点总结
数学建模大作业中涉及到的知识点总结

0 x) F/ b" }: u4 i, e# ~9 q8 X2 |' s' G; j8 ^' J* i. N7 w0 H- C* q9 l
(1)写作缘由+ ]* z; L  q  l! ~8 D$ X
(2)统计描述:
& _' o" D; j6 t% j追加用excel 做频率统计
! Y) D# ~7 ~5 Z6 H( f5 G, y% H(3)相关分析(点二列相关 )) e( _# ?5 Q. X& }- E
(4)回归分析1 n  q/ a. P# B3 {; m6 x! d3 x
(5)特征选择和数据预处理
/ S* E/ e! Q, y& k8 g/ d+ @(6)缺失值的填充7 R" {0 _: ~0 j1 T( O, \
(7)文档编辑的一些技巧; Q, U. J) R$ C) a
(8)团队合作的一些心得$ }* I7 B3 a( O( q1 @) s
(1)写作缘由* O* T- J4 N  n
* S9 B6 Z, v" |$ ]6 I) C$ R* f
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下$ ]+ X, K0 m' Q' i- R! G

6 x( D# L- S, ~4 W4 u6 C  L(2)统计描述:
2 s- B2 r& }0 v/ t4 K, L1 L2 m# t2 c( g4 X% d) f
① 频率统计
) ?1 _0 a+ o2 G* q$ V: n0 i9 g② 中位数 , z* t7 j- U$ p3 G0 \1 k
③ 众数
3 f$ z7 A1 Y8 A④ 平均数
" B! R& `; M- a% t3 _- _0 _⑤ 方差
' B9 u% e( K+ m- A8 r) N0 t⑥ 标准差 + f; O2 ~' A) L, h
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 ' Q* e! ]$ W7 C$ X

0 @; Q" g6 }4 W; s& c追加用excel 做频率统计  z" j6 |1 `' V& Q7 x9 Q2 [) i$ {
& q4 o9 p/ |" W1 J( ^
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
- ]2 U& ~) U. R: z9 W) e! N6 o3 ]/ t: n8 F; v7 z! S( V
(3)相关分析(点二列相关 )6 H. b4 a  v# u4 D& {
* n5 x5 K" l# p7 E) B) D

0 }  W  h, u3 @& }6 T- m/ `, [7 H: p6 C6 V3 g' D
; n8 u, h% n( d" N8 s

' B) @+ n# B! u1 b(4)回归分析2 [6 d, U. w9 Y9 n+ H- O

6 m/ M! `7 X" u: rLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。: O' B$ k- b4 a6 T* {4 h1 }0 U3 q
. `" Q. c& `% u3 Q% _/ b; d6 ^
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。$ x# c2 J- d1 l" D# e$ L
' ]( l3 z2 w9 ^9 O4 P+ w. z* e
回归分析一般有这几个操作: 2 g2 O+ f9 Q; M
① 设置筛选条件,刷选数据集 valid
7 k  o& o# E, f3 G8 L8 ~
' y* }* m  s! @7 @) E. n! p: j' W9 d! b2 W

8 w% C# a/ |$ U3 Z. T5 \' B: `② 模型拟合度检验
$ a1 s( Z- k3 M( e% U7 W. }% u* y& q7 w2 M) u; [! M& a# c3 ]
# S6 O/ F/ H* b, h2 l* E7 Q, Y
$ ]3 i# B+ J  \$ b2 H
③ 预测的模型参数 * R( z: u+ n' m
! N# o* i' H* h
④ 预测结果,准确率, D* V% X+ l3 e7 ?, Y
$ D+ X9 b, R0 Q3 l! J' g

* Z* i7 g7 ]9 _$ b+ \# D
0 c. P3 {8 H$ n$ N* \5 o9 ~4 n5 m4 d+ I1 L. W' k' q/ q
(5)特征选择和数据预处理! g, r* M/ M% K! q, p  W

1 y9 J6 W( w5 _& i  d特征选择,主要是gzh的想法
, w4 Z1 D. `8 b% ^特征筛选的思路:
9 f0 {9 \- B- H; \分类变量用1 2 3 4 离散值
$ R* |8 \! i, h) @$ |% q6 `对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
$ T: C+ A$ \6 t1 |* s9 G对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
" ]6 R8 O: u$ z
0 I+ ^7 q) u2 e# v注意了:
7 i: e2 A/ I/ b1 \5 N3 X筛选特征的时候,重复性要考虑、缺失值要考虑8 s8 L- b' P+ J2 j0 L4 [
& d9 l7 X8 g3 W. W7 L" Y  g
(6)缺失值的填充5 ?: {3 ~8 D) I+ N, j5 |+ P
1 w' c1 U& R/ ?8 Y7 m5 B6 m

2 l5 D: A5 ^! \9 i. @5 U
5 g; k# p# Q2 W(7)文档编辑的一些技巧
; k" j$ Y  k* e3 F
6 i% w% I9 g7 t/ Hhttps://blog.csdn.net/qq_26769591/article/details/80848841
8 B. S2 H0 X' e% q$ Q3 x) z% Q5 L  `
(8)团队合作的一些心得
  v+ W/ I+ B$ F  {# Z5 l4 l/ ~- E
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 ' }; m1 [4 s- L- V6 [
2.不会乱 不会重复做功 不会丢失工作 " A1 R9 y0 k; [' A1 x
3.经验丰富 总能拿出一种解决方案
4 Y$ ~& W  Z* b5 X$ R7 D4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近 7 ], d- j1 V" n7 a& B/ ~
5.大致方向总是不差 错也只是参数不是思路 不是算法
( K; K+ m2 b0 w6 ]6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 ' t' _: V& s2 [7 S* @- c* ?
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线( R0 N, r& g9 d/ y0 p8 I! Q
---------------------
0 v+ z5 K# L) a0 Z' S
; U! o) N6 [4 {0 o3 x; r: k; F/ E# Q: p' Z# p& x8 S/ n
  G0 |& _! Y" _3 d

2016高教社杯优秀论文.zip

12.3 MB, 下载次数: 4, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5