数学建模社区-数学中国

标题: 数学建模大作业中涉及到的知识点总结 [打印本页]

作者: 杨利霞    时间: 2019-6-5 11:24
标题: 数学建模大作业中涉及到的知识点总结
数学建模大作业中涉及到的知识点总结
- S: u- @' M3 c( K! z  j
$ H+ {, F3 y+ f; A: `! |
(1)写作缘由2 w+ G/ P1 C7 {5 O) S
(2)统计描述:
9 d/ y4 x- t8 P* z追加用excel 做频率统计
  M7 P8 s; n- M- ](3)相关分析(点二列相关 )
/ q9 l1 ]; s# w" d! t: {* H(4)回归分析9 ~# q9 u  \, V# K# z9 S
(5)特征选择和数据预处理; @3 g# t7 F* V* r$ {0 `- H
(6)缺失值的填充
" C; U! P# w- J  B5 G(7)文档编辑的一些技巧- N. c) V/ F" ^
(8)团队合作的一些心得
% K/ g4 ~9 S" z(1)写作缘由/ c3 g# c: l# `( e

/ \+ H7 A; T. \) |, L在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下! q1 `- m1 C1 K8 y6 c5 J

9 [: G( e0 k* w+ S) ?, G$ E(2)统计描述:
3 c$ Q" B! J) X+ Y5 R, C
+ n) i6 O0 u' O7 h! t6 e① 频率统计
- k) V( _; `) e0 R/ D, b: {② 中位数 2 @& b: o3 c* E; a' p, J3 E
③ 众数 $ i7 n: Z' l7 `- u! c
④ 平均数 " p- o- ]0 l9 W, X- }% Z  I
⑤ 方差
6 ]  q; o. q: A$ R0 O7 W6 a* F/ _⑥ 标准差 , E/ A' p# D) N" L1 J' H3 a7 m
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 2 i& M8 H9 ]6 \9 u

3 L1 j* ]9 C# T' ?: d追加用excel 做频率统计+ c2 ]* Z* |0 s) I* X0 {- K

2 I1 s/ A0 J$ `! l' Q5 j& rhttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html% }4 s6 S4 Z/ b8 [7 v
8 ~) S% B( ~$ p+ T% b: k
(3)相关分析(点二列相关 )9 X; C) \) V/ M. J5 R5 M
  k7 X$ P. K+ f" m
. ?. }7 ]9 n. k% n! j# K# Q

4 C. V) b# ]7 h+ U- y' m: }' T" `) j/ \2 [' s/ {

/ {; ?$ u9 x* m7 z(4)回归分析
, A( H7 V; z& H3 d' d6 c& g6 Z' h3 k+ V+ ~& b6 ]) M  P7 A& {. \
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
1 y* s. q* o3 b7 s$ `+ c) P4 ]
  X% s% @% a5 P因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。' g$ [* g5 M+ y4 {5 I
$ r+ l( _8 Q' P* I" x& M% H
回归分析一般有这几个操作:
8 o+ M6 x* L6 t2 P- y; D$ E① 设置筛选条件,刷选数据集 valid 3 U+ K# \# k, s$ J8 i

: F3 L! w; Y# e; }$ b5 T, _' b. A* g! J' d

# X* M! O" r5 F3 l7 d, Q2 ~+ h& z② 模型拟合度检验 5 q1 r; \5 V; X- k

& G! g: y6 b" T8 l' b) p, W6 J: f3 K/ y# ~; V4 a
$ h; [+ ?) G3 e- a  Z3 ]
③ 预测的模型参数   v4 W# d2 w) S" s+ E# m

0 N; s! k. i; a+ t# M④ 预测结果,准确率6 e$ a, ?1 r) ~* y( n
8 _# R3 w" u. g7 p: E$ b: T8 S
  D1 D0 ^  O  b9 w5 c
2 a2 y4 v- a$ h

( c  [0 G  @( R" ^(5)特征选择和数据预处理
4 V2 A: j( R+ k% ~: E7 x1 C) c; F3 ^, W4 O3 I- ?& E( F; N- ]
特征选择,主要是gzh的想法
9 O3 Y' F& ?/ g- ]  g: U; S2 e特征筛选的思路:
5 A9 z* I+ r4 \2 n8 [) G分类变量用1 2 3 4 离散值 9 Y% ~# ?3 g3 l# K
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 1 F8 U" w6 C3 f
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
( a/ Z& \; X2 }; N" ^
6 r$ P! e+ V( v2 `  Y# B5 D; {注意了: 8 [. F# R0 v0 k) J# A
筛选特征的时候,重复性要考虑、缺失值要考虑1 h! V5 H  Z# f
$ u0 g) ^' z8 @, _
(6)缺失值的填充  C3 y' v& F  X

; j7 R" }0 L1 A8 P4 x% J5 I1 ?+ f2 b/ s# ]" u( r
4 F# O# H1 p  J" E
(7)文档编辑的一些技巧$ w" m' ^- r- W. f

+ w. M: j! B3 t- J$ ~0 Whttps://blog.csdn.net/qq_26769591/article/details/80848841; l! {. h, y8 r! V3 o2 B3 C

/ E* N, J$ s: ?3 Q(8)团队合作的一些心得  I2 S! \* @: N" `" _) s$ L

/ t& h& G/ L: o; p) e, Y7 ]' G% X# h1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
$ S/ e' C" ?& n8 x4 d. v% k2.不会乱 不会重复做功 不会丢失工作 * o( J. q# o  @1 {, ?& D5 e& x
3.经验丰富 总能拿出一种解决方案 . z8 D3 J0 r( W( l+ P
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近
1 @7 @8 O$ f- p  s$ a1 v5.大致方向总是不差 错也只是参数不是思路 不是算法 3 z0 D# J0 L9 B% B: q+ C
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
5 a' [9 z+ ^: G0 r/ s7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
5 [; ^( ]1 ~' w/ @9 k--------------------- 0 P6 A. Z. W& J: T* J4 }
! o# c1 m" l+ b7 R4 V

6 b  o0 q$ i; Z
+ g6 s) n/ y" _; B) W: q- ^" w7 U

2016高教社杯优秀论文.zip

12.3 MB, 下载次数: 4, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5