数学建模社区-数学中国

标题: 数学建模大作业中涉及到的知识点总结 [打印本页]

作者: 杨利霞    时间: 2019-3-19 17:48
标题: 数学建模大作业中涉及到的知识点总结
数学建模大作业中涉及到的知识点总结
7 m, ?' y0 o  y7 }数学建模大作业中涉及到的知识点总结:9 G* N. V+ N+ j' Z9 W+ J3 b

  y1 O" K1 _7 ^+ {) y(1)写作缘由
1 I( U! H+ W& B; u(2)统计描述:
! W$ P! ~4 l- Q5 E) P追加用excel 做频率统计
5 h: ~  C3 ]8 v+ K6 p! q(3)相关分析(点二列相关 )
' @9 Z- `% ?* \/ j(4)回归分析$ L( P8 K8 i4 p: @
(5)特征选择和数据预处理
# T# \% D. l; i7 T+ L6 I. a4 S- g(6)缺失值的填充. G; W8 r! R& ~! h
(7)文档编辑的一些技巧
& V1 j# x+ y& g+ @9 v6 H4 c. u5 d# m(8)团队合作的一些心得" Y( V. r9 W" r9 l
(1)写作缘由& I; r/ s3 I: h* l1 o4 `) [* D

# R. y, ~" G3 U0 h6 B在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下! X8 ]7 l/ ]0 }2 j
; N5 f; l* S) s: }+ h: `
(2)统计描述:
0 ~  x% ^: H; c3 r; B3 M. n" z2 v/ Y0 N1 s' Y& g
① 频率统计
9 v" S% A3 @6 H7 j  x6 h2 z② 中位数
' T$ j% q! N2 x, K5 k  Q: ~! p③ 众数 9 s$ A# N4 j5 p8 I0 }
④ 平均数
4 R5 W% v! X9 Q  \$ o% \$ `⑤ 方差
4 f5 W* m3 q8 j6 T" ]% y* e+ Y6 S⑥ 标准差 ' A- s) ?4 C" w* O/ a& c8 n( I4 T
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 ) n, c- L7 ]/ j" v
0 _! |% ?" S3 }: |4 ^7 q* t
6 \9 ~! W, o3 D3 \8 Y
追加用excel 做频率统计
8 k0 C7 Z' s* t# R* A: M) @2 C( x) W4 c# s. Q# }5 j( @$ c
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
2 g- H- T8 J# Q' O; R' \. R- r/ Z* G; I, C" m9 S  z; D6 C$ F! Q2 s
(3)相关分析(点二列相关 )
- O% T0 k$ k. t% \0 B# \! P
" L' i  [5 l5 V7 h  V0 c) e3 i- u# J  R, |
  M0 R1 z: I% ~) X* B0 d" G$ s8 s

4 y# G0 N& J  y, V! q- l4 T$ L, y
* N0 ?$ i; L" i, N+ ]' m$ G+ B(4)回归分析  w" D  d- {" Y, F" G1 E
; W5 m" v2 t- Y# h9 x
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
6 E  a0 ?0 W- q3 y# @# H9 v! N, o. u
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
; B! X3 q7 B0 I2 e5 P4 }3 Z4 h! f
. k: t- i+ o* l% g* r回归分析一般有这几个操作: 0 P' }' [+ J6 Q# D
① 设置筛选条件,刷选数据集 valid $ a! \) U' Q& W# ?( C9 T+ p. }1 a8 N
! {8 \, m: c3 P" z, m  l# {* M

+ B5 s6 G6 {% @, e# }* r2 K1 o7 m) v) d" X: Y) i+ ^5 i. v# F
② 模型拟合度检验 * S- J/ Q9 |5 B( z3 W# b# B
: z" k3 ~2 o* t" j# n; E
* A7 k5 b$ @6 p
4 u1 L* S$ A, d9 Y4 d5 P* }
③ 预测的模型参数
- _5 U9 G; v0 J+ K5 O
$ X% `9 L. |% y0 x+ U④ 预测结果,准确率( q% H/ ?, y0 N
! i: F. M5 n/ \  i
) L: G3 Z% X2 y0 ?
3 Y% Z0 e6 {3 C! M) z
+ h- t% P! ]( F- o, e
(5)特征选择和数据预处理4 a# I6 v* c' \1 c2 D1 ^; Q! v

2 k: s9 l% Y" n  D' Z8 q特征选择,主要是gzh的想法 7 j7 B6 x# ~8 q( [/ Q
特征筛选的思路:
$ V" b& x' \5 r; X) a! p; L6 q) D分类变量用1 2 3 4 离散值
- r3 |; p7 z2 _7 [, }  {对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 $ p( H6 ~& E! b* r8 i
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
0 U( R6 g5 l- K8 z
3 C% c" s  n2 V注意了:
& G8 ?9 J% x$ M  I9 a3 j筛选特征的时候,重复性要考虑、缺失值要考虑& r9 D9 |4 ~) l1 A2 \! ~  T" c
) q" `( z+ V" h( A+ z
(6)缺失值的填充
% G3 O- q8 ^. k- E- Z  A7 H7 x$ b; ~1 c
/ M, J0 m# r7 _# c2 \& ^
" F6 N4 P' _& s4 Z; s, b
(7)文档编辑的一些技巧2 @1 U2 R0 l. p* A9 g
( S' E; G' G. P3 U. m* w* J, A
https://blog.csdn.net/qq_26769591/article/details/80848841
) D) L! }* i8 Z  A1 C) R  N4 }  W! _( R5 d
(8)团队合作的一些心得
2 S+ U* n4 Q: q5 H. h( R; v: J2 w
7 {% h/ v9 I2 V1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 + y/ v! p3 `9 Y+ r& D
2.不会乱 不会重复做功 不会丢失工作
" ~1 L9 _, o+ [/ v6 t7 X3.经验丰富 总能拿出一种解决方案
/ i  G- z% T* w# O+ {# E3 ?' Y4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
! l! T" N' L; \- @! k1 i5.大致方向总是不差 错也只是参数不是思路 不是算法 8 d: S  @9 \1 \3 l; X; G
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
2 x1 E* F1 y. M+ m6 N6 s4 {7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
9 Q* R9 j, \$ t( N0 t, ]---------------------
1 k' `7 f! h4 ]9 F9 ?作者:-英击长空- % M& K; a) x6 V4 }! f( x+ P
来源:CSDN
, q& a7 v& {' W$ K: X: W2 J1 M7 {原文:https://blog.csdn.net/qq_26769591/article/details/80840673 * @8 \4 F2 y* J( x& y, R4 K1 y9 r
) u; b) k% U% L0 U% o6 b

6 J% m/ T2 e/ o& A9 B. c$ f2 z3 Z6 ?/ y9 R5 Y/ z

: D# ?. V* m( p9 B# W# B

16种常用的数据分析方法汇总.docx

20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点


作者: 1714830332    时间: 2019-5-17 13:59
学习学习了* D$ u# s2 o5 E; N





欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5