数学建模社区-数学中国

标题: 数学建模大作业中涉及到的知识点总结 [打印本页]

作者: 杨利霞    时间: 2019-3-19 17:48
标题: 数学建模大作业中涉及到的知识点总结
数学建模大作业中涉及到的知识点总结
, n' j6 b- |+ M) F+ c2 S1 `数学建模大作业中涉及到的知识点总结:3 n+ {$ p" g* T, ?( _2 M

9 V/ N! c& O5 E4 ?! P4 O% @(1)写作缘由
1 J9 @! V" A0 P2 Y9 w& I$ L' ?- U' t; P(2)统计描述:
# g5 I0 o5 |0 w+ l3 k8 X8 C# h" l* z追加用excel 做频率统计
5 V' O& y% g9 {) S, T+ O(3)相关分析(点二列相关 )
/ u, O# Q9 i" c(4)回归分析7 _" i- O8 e& a% d
(5)特征选择和数据预处理3 Q% n3 X) d9 _( _2 z" F
(6)缺失值的填充
9 H8 n# |% |/ y" r3 S0 L4 B+ Z(7)文档编辑的一些技巧3 ^  |6 N1 L6 @/ e6 g: S" y; n8 k( \
(8)团队合作的一些心得' s! y- g! Q& g+ u3 t3 x/ T* F
(1)写作缘由" \# g" F: ]; i6 U: j

1 F4 }. ?' L& f# o) M( ^在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
  v3 t( s1 I- y7 G! e& v8 f/ ]  z. ~
(2)统计描述:1 |) m9 d- `  h" D

( \; _; F1 v5 E/ G% J! \3 l① 频率统计
9 g4 E5 F# D) y& Q2 u② 中位数 : F9 ^7 c: b1 J$ n' n8 u- p% W9 i  f
③ 众数 0 q8 @7 Q/ P$ |* h' H' z/ t+ U
④ 平均数
8 y. @& [# f9 T& b+ ]" b⑤ 方差
' r- m" ?( J! ^+ J' e⑥ 标准差 . l; W$ |) l4 w  U: X
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可   i, L8 E0 F$ T- y" a. j+ s
7 O. }  M8 p5 x5 G! w
& O8 E! _8 e$ @# Q3 v! {
追加用excel 做频率统计1 F* t6 S- E) J3 X

' ?1 I% t: |4 y1 N2 yhttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html/ \4 C5 N* l. f$ `' Y

2 L# L0 R5 ?0 }! b% p( w(3)相关分析(点二列相关 )3 c, c5 h2 m5 C- l

3 o2 @- S, M! m! ~0 M1 b- B4 m, |- g

& M5 z  A" |' k, m4 n+ C3 `5 b7 ~' L3 o$ G5 u) N& E: U

& i5 L# B+ R* N& v: u(4)回归分析
  c4 F# G/ L! Y& W  Q
9 t' B. ~; a, I: v9 tLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。% ?% {9 m, Q  s6 z
& H6 B% `. V4 @' m& t
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
3 N3 t3 G# C% h3 x9 p9 t8 @
! X' P' X/ J2 c3 f回归分析一般有这几个操作:
6 }& e. _8 f! s* k, A① 设置筛选条件,刷选数据集 valid 6 x5 @4 G( T6 N/ _' C3 h& F

9 i2 R9 C) z! ^( y
' J% _$ Q6 {% ]( v% U* Y+ l- w) ?6 K& g  w3 P
② 模型拟合度检验 * z# V' K; o" R7 d5 r/ W$ J% e
/ h, }. `6 ~% V# z! M- Z( ^: r

+ j" A3 _4 V. W1 I
, |4 [9 M' `. Y/ a# C6 ^③ 预测的模型参数
* W. v, `) r2 Z6 w& i 1 d3 M( X, V0 I" q
④ 预测结果,准确率, K3 T1 M$ y$ `+ R

( ?5 h6 H) C- ]1 { 3 e6 X3 v. T, _) M# ^) Q; F7 j

0 q5 V# [7 z) j, c" h4 [) T5 \% V0 w; ?9 ^$ }( o7 j
(5)特征选择和数据预处理1 s4 j% f+ R; F

% e/ o' x/ N" k* ?9 L% \特征选择,主要是gzh的想法
, }& {- a- p' ]) e% }特征筛选的思路: : X0 M. r% }3 d- y+ Y
分类变量用1 2 3 4 离散值 1 j+ _& M* K& K
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
: @9 M0 a" X# W对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值# n4 w/ K  d' z: W  k

( l$ {7 |; e/ G( T1 F" N注意了: ! w( R; D" ~! A/ K
筛选特征的时候,重复性要考虑、缺失值要考虑
5 A* V; _; s' [* ^& _/ i6 Y! @9 q! {: _4 _2 m/ J
(6)缺失值的填充# u0 v3 q* n( ~/ x- a6 q/ C7 |

# _( Q- ^- M6 f0 @. x7 w+ [# g  f) O  ?4 B' a% `, K
5 n' C0 Y! y: l, H  D4 _
(7)文档编辑的一些技巧! |% o* p/ }8 t% `5 V$ C# f$ J
) O/ |0 j# e- Y8 \
https://blog.csdn.net/qq_26769591/article/details/80848841
; `4 K9 R* P- {9 c( |1 s( F) a4 A! Z: l# l
(8)团队合作的一些心得
' @6 n* j7 W: I, F% g1 P6 U! T0 Y
( c* {) ]5 N: W; F" _1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 , Y$ d6 M) n: S- p7 d& A& U; A
2.不会乱 不会重复做功 不会丢失工作 ' E" C8 E$ ]1 {* s
3.经验丰富 总能拿出一种解决方案 $ v9 {9 _' d# ]) l6 `  M
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 ) J+ I, @  Y( p- H
5.大致方向总是不差 错也只是参数不是思路 不是算法
/ o' f4 G6 z, h9 m; x0 J# S$ o; \6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 4 ?* F& c6 T" g' V" W2 R1 z8 G
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
$ P$ i8 C: m0 X# X- j' f---------------------
% J' F$ x1 M7 ]$ _1 W' r5 w作者:-英击长空-
  z7 ]' M/ E6 o% J来源:CSDN 9 y+ V* n5 q' b2 R" j0 ^) O5 j
原文:https://blog.csdn.net/qq_26769591/article/details/80840673 7 [$ J/ [4 E$ u
8 s  G3 }# S, S$ r* h
+ B" k$ [& ?% p" g5 f) b

9 `  T0 ~- r5 d$ ?. [5 M* G
( B. Q' B) M2 j1 e& E

16种常用的数据分析方法汇总.docx

20.53 KB, 下载次数: 0, 下载积分: 体力 -2 点


作者: 1714830332    时间: 2019-5-17 13:59
学习学习了; D3 A2 `; d6 L8 }2 P





欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5