- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563283 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174208
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结# B# O# M- x& J8 a( V0 K% W) ?$ ~
数学建模大作业中涉及到的知识点总结: w6 c+ Q$ d. U- M; p' Z) l
) _8 l0 H2 H6 P(1)写作缘由9 q: q6 F2 d) g% S: S
(2)统计描述:
( _/ @+ R0 I+ T追加用excel 做频率统计8 ~: \! B3 ^2 D# z7 F" N
(3)相关分析(点二列相关 )
& r0 [; h4 ?9 D1 }9 ^; u o+ c(4)回归分析
7 z: e( l1 O9 q(5)特征选择和数据预处理6 ~$ h; u* \; s X
(6)缺失值的填充& \/ i+ `/ ~# D, B6 K( V3 M- \( }
(7)文档编辑的一些技巧
" V9 Q; j1 ~1 Y9 @4 Y, g(8)团队合作的一些心得( }7 A' u9 u: l; |/ v
(1)写作缘由( { F1 b4 h. |8 B7 I: ]
* a: u" u# n5 E: K2 k在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
* R$ }" A9 \* S, }$ \$ z4 P" D: ?3 [' I* Z. `- g$ F
(2)统计描述:' Y5 L* t0 `' K# l; D2 M
, D$ w# X# Y8 v) \
① 频率统计
m+ o& S/ y& R7 C1 E+ `. `4 h② 中位数 8 Z; ^: z2 ]4 V- g+ v9 `3 ?
③ 众数 ) { ?, k/ N7 |
④ 平均数
. k2 s9 w& U; B8 s) a0 J! \⑤ 方差 & r ?, p$ x1 {" ^- w* r. k
⑥ 标准差 / k4 p4 s/ Y b( Z9 `
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 8 ~9 f+ N2 P+ c H# ?8 H; ^, f' n
. Z. K0 ^7 `2 u |2 m7 b: J
4 G$ L2 x$ ]$ D9 ^5 F( k7 X追加用excel 做频率统计7 \) x( E* x% o/ t, S) C( z
9 n3 q- y2 T e# b! r
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html2 q# l7 E) `/ y
2 j' r' H" p3 p5 [" J5 a5 B
(3)相关分析(点二列相关 )
( u, s6 I |& v/ n4 I![]()
5 C) ]4 m, q& B
, X% b$ G; |/ l/ M' u& I![]()
2 Y4 d4 q* X" a! o# z$ [$ C* O; ~' k& _' i
0 H# {4 n, i$ F- B7 z# e
(4)回归分析/ {% f; m# `+ }- a8 V: n' y" s
. ~3 L& R+ I% j
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。0 \+ F! H' ?0 t$ D
8 ~( S- j) l, ]5 p5 _0 I
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
8 W2 U) \& E! m/ O4 L* ^5 ~' N G0 r6 g. I2 \; K3 X; w* y8 Z( ^7 ^7 X" k/ \
回归分析一般有这几个操作: ; ^2 R6 R# P$ ~# Z3 j
① 设置筛选条件,刷选数据集 valid 3 H. d7 a1 V' p: B
![]()
* v j, B' l0 t! H9 m4 I8 L1 ~$ H% a1 E0 g+ W
![]()
, u5 w, g m9 v8 p② 模型拟合度检验
8 `' d) j. l9 d/ i) H6 X5 Y0 L F / Z) D+ C, F; P" x
![]()
/ T4 X" l4 a$ n+ z
4 E8 _( f' q$ P7 M③ 预测的模型参数
- I3 }' B6 _2 T7 @" H; E ![]()
& E0 p a n! |: r④ 预测结果,准确率& a: X$ k7 r: _5 d0 O
: q' D; r$ X! u* _1 b3 y4 B5 |: z
/ o/ Z9 b: g5 P- H! }
3 s3 N! s" P' H6 J
. a4 ^0 ~+ k5 `: Z
(5)特征选择和数据预处理
! _9 }9 s' [3 W1 z- g
! J( h2 j- M5 u1 |) c. v特征选择,主要是gzh的想法
4 b! A2 t( c. ?特征筛选的思路: * H5 s7 X; X9 {+ w) W+ J, \0 j
分类变量用1 2 3 4 离散值
* o1 M: E2 J3 z8 J对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
v3 T! U- I; e& s对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
1 B+ {9 j' t" T! c; Q+ |$ m; Q
注意了: 9 u9 L+ B9 F) E7 c9 L N( X* \
筛选特征的时候,重复性要考虑、缺失值要考虑
; o# r, T- U2 |5 N4 e) S
. C% [: u/ [/ y' q% f* f$ K0 ^(6)缺失值的填充
% j) @) E$ [3 P: E# q0 ~* m. P1 Q P7 G
4 H' d5 V# E3 c7 E" H* Q& ~- d
# `/ W. O2 C9 d; n [
(7)文档编辑的一些技巧
, y! k2 {/ b. O
2 z1 ?; `3 x/ R9 k# Y; c2 A/ b- ]8 Whttps://blog.csdn.net/qq_26769591/article/details/80848841
0 [+ N4 Q: L ^# g2 h5 G" f8 x2 E) k2 t( s
(8)团队合作的一些心得
D5 c& Z1 C9 P& o
& F# B" ^0 `% x3 b/ [- G1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 , y9 b$ Q. y: p( }7 ~
2.不会乱 不会重复做功 不会丢失工作 5 M+ y7 G* m3 U" H4 T" y
3.经验丰富 总能拿出一种解决方案 ; {" b' T3 c6 G& Q+ ?$ p, d
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
/ ]) i/ Y# B e' n( |5.大致方向总是不差 错也只是参数不是思路 不是算法 3 w5 E0 W* O0 M! l
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 8 o U5 a1 r) p. H" m4 a
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线* @5 F; E. Y4 c' g6 S# I
---------------------
6 E4 D! ^0 h. o A" w6 M5 I作者:-英击长空- 9 s, B$ k+ l5 c2 r
来源:CSDN
5 E K0 |& j6 [( ~7 s6 O原文:https://blog.csdn.net/qq_26769591/article/details/80840673
9 n# l" w8 C/ J( q% Z% a/ Z& r
( H" B( B+ n- O$ \4 H
f) r7 c$ A4 t$ E6 q8 d
5 \0 M! T0 V3 h2 h9 A
8 {1 S: O7 Z) u& \* |$ g |
zan
|