数学建模社区-数学中国

标题: 数学建模大作业中涉及到的知识点总结 [打印本页]

作者: 杨利霞    时间: 2019-6-5 11:24
标题: 数学建模大作业中涉及到的知识点总结
数学建模大作业中涉及到的知识点总结
5 k! g. u; S6 N3 U. n4 t
0 x1 h* A6 j2 f
(1)写作缘由
. `) N& R* h: ~8 M) t4 {  ^(2)统计描述:
$ M0 o# `  N; u/ F1 {) X: Q追加用excel 做频率统计( o& _9 w: v3 ^; S1 O
(3)相关分析(点二列相关 )
8 o9 V" F( z; p3 C, Y! H4 ]. ~% z% M(4)回归分析
! l( V2 G3 s" ~, q4 p(5)特征选择和数据预处理
7 o8 F  |: i; T- p! }3 l(6)缺失值的填充
& H4 ~+ }; }& Q$ A(7)文档编辑的一些技巧
7 }* R9 N& H# d& U% O( U(8)团队合作的一些心得6 J( c) F4 x4 o/ K# g* `
(1)写作缘由
. D! L6 e9 X5 @% h1 w
/ I  k# f3 ?9 P" |' k' ]; L. |在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下( d4 i& u9 N) Z2 e2 C& ], g# Q
5 d# v9 T7 _5 W7 w; g- U
(2)统计描述:
( ]% ]; c9 `/ Z' ~" o( F( g; h8 C/ a' n! @. ]
① 频率统计 ; T/ O+ |9 S: p6 U6 M
② 中位数 1 {9 }4 V+ r$ W* }
③ 众数 . b6 p$ o8 f$ T
④ 平均数
) X# \4 P8 u! a' z⑤ 方差
1 n  C. |3 ]( A$ `; c⑥ 标准差
2 n+ z% r: }% d9 H, z用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 9 X" R# H- f" z" Y  n$ l( Z

& n3 ^7 T& \/ g! _* I追加用excel 做频率统计
8 T1 y$ w8 M+ V" B  {/ L
% A$ @, G2 Q8 U$ m- Yhttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
+ ?% }2 }9 v# \3 m1 Y
* T4 i, C& h3 b' N% {% t$ T' i7 y(3)相关分析(点二列相关 )/ }6 v" @9 E4 A$ C+ R9 o0 m0 ?

/ @! g3 k0 w. S# W- S
& i0 x/ i/ E' k# v: h3 R# W$ l0 y+ P
8 w) F* {) R) F- l; s

! b) `; o( \0 V+ b& W(4)回归分析9 k. t; ]  Z! I7 t! ^
+ R  m  Z; A7 G+ y" D2 E$ v% R
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
( G5 u- I9 _( X, F/ @& ^& r7 \) e, q0 Z3 y$ T5 o
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
( L4 m1 v$ y! C$ l0 M( U/ B! e& n. E8 l$ O/ n0 \
回归分析一般有这几个操作:
; _- i& Z+ \9 @' }" K2 g① 设置筛选条件,刷选数据集 valid
; E6 T" q  r. k8 f/ e6 P) m4 |' M/ ~4 i! G3 ^

4 K; Q9 t0 w8 ~( b0 }# G: z) F; ~2 e, D4 ~# `
② 模型拟合度检验
0 |% V. B* n, o  B8 w2 c" _3 w
* W" ~! K1 Q+ F7 P1 m: g& P8 [  Z3 S( d+ Z& H3 v

1 A0 `7 l' K5 F4 O# s4 x0 u③ 预测的模型参数 . C! n9 p( p3 C

- s$ k) O. e6 W  K- u2 \  O④ 预测结果,准确率
& c) P! ~0 x- d0 X( M! E) Z9 i
; y+ V6 ]! s$ V6 f* F+ H/ r' J7 }
2 h& B  z5 C$ E0 D

: A* Z1 W, J8 L8 ]( k. X(5)特征选择和数据预处理
6 h5 n' I: ]" ?+ i0 _( _( T9 H( P! b& G5 y
特征选择,主要是gzh的想法
. H* y( J1 {% I9 o9 F: m5 z) s3 f特征筛选的思路: ( z! @9 d' M' e+ O
分类变量用1 2 3 4 离散值
, i3 e  F6 `  b9 X" e& k: n. u对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 1 f: l7 D7 |! X
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值- V" g, W+ _1 A' B' T
2 d: E0 _% F0 k1 f" I" J
注意了:
9 Z  E1 @+ x9 ?3 _9 D筛选特征的时候,重复性要考虑、缺失值要考虑
9 |- {& G7 k* o6 N, ^9 Z3 X, M" V4 Q  U: S
(6)缺失值的填充
2 u* e8 ?9 |6 ]1 D6 A
$ g- l. v6 o9 {+ L8 t8 f6 n
6 n4 X4 i3 f' l8 X  M+ Y0 ^  C3 V8 N$ A. X& ?- e% W
(7)文档编辑的一些技巧
0 ~: a1 D) m- g! J+ p8 A0 Q) P+ H5 ~2 u5 d+ w+ W
https://blog.csdn.net/qq_26769591/article/details/80848841
: S# w; Q* T1 N& u6 P3 F
3 z( F) g. |! n+ @* \(8)团队合作的一些心得8 i3 @6 v" R7 J& E' e

5 L$ C$ W, W! O+ N* k- }; w6 m8 I1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 * h( G$ e5 i+ v2 @+ G" B/ f
2.不会乱 不会重复做功 不会丢失工作
" r1 T5 [0 Y! n" Q$ q3 H; D& t( z3.经验丰富 总能拿出一种解决方案
" }5 i% D- j3 G4 R4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近 - m7 |% y/ V1 F5 @
5.大致方向总是不差 错也只是参数不是思路 不是算法
4 k+ a- G" [9 c0 o7 H( S7 b+ ~6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 " s% t6 f6 A4 L! r* h: o' W! W
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线5 l7 M: P% U" N3 `) w2 U& u
---------------------
! m0 g2 _6 T! ~4 L/ T: x( V9 }0 j2 w$ l- `6 ]- R0 L
2 ^  @- U! ~9 h0 x+ l  M, f: g
& F1 _* {/ Z3 V5 Q

2016高教社杯优秀论文.zip

12.3 MB, 下载次数: 4, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5