- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563288 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174209
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结
* e0 m- ]3 G' S$ \3 f( b数学建模大作业中涉及到的知识点总结:$ D0 N1 t: s1 u: i, E, |- U2 s. Q% d5 P
. R; R" w3 Q8 @ W/ g8 b3 z
(1)写作缘由$ _% M, e, N- [: O; M; x6 H9 ^
(2)统计描述:; a! x. i' @! h- P8 |0 U
追加用excel 做频率统计
& m4 q8 o4 B* T6 a(3)相关分析(点二列相关 )
6 r( f$ H/ p# x(4)回归分析
+ K. y. b V' O3 e9 E+ o/ {' W& I(5)特征选择和数据预处理 B3 ?6 p$ G: ?5 |6 O" ?1 d
(6)缺失值的填充
/ N$ T& }0 @ n* n) c! [7 a0 h(7)文档编辑的一些技巧1 z1 m( ~8 g# {2 r
(8)团队合作的一些心得; R* A; H" I& Y9 i, o- {* N+ w/ Y
(1)写作缘由
% B# t4 r; Z+ d9 O/ c+ i0 v5 r5 W! `/ \$ f9 x6 V: n( }
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
) j- @8 K7 |4 J# v9 M, I% ~; i7 G9 H0 o! G
(2)统计描述:
; `! \! |+ x* V9 }5 V6 ]: n; h( g5 _: m% p3 H
① 频率统计
" W( W' Z0 f* N$ G+ F+ W; ^② 中位数
: \0 _1 m# g) q+ Z }6 A③ 众数
2 o: h1 P5 @$ \1 b- d8 B④ 平均数 7 @# l- v( {/ N/ N
⑤ 方差
7 S2 H" _, E ~* D% j+ T& z+ L0 f⑥ 标准差 % {, n7 l1 [* z) Y$ A
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
+ X$ _' [6 [0 W1 N7 H4 q
1 R7 P( T( P% H: X0 v" |* M& h! d" W+ H( d0 B4 p
追加用excel 做频率统计
9 ~9 r5 C( U! n- x![]()
* s+ a4 q- W/ F: `$ f n3 p: i/ I9 ?https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html8 S8 m+ z, A6 M* W. S( F! Q7 w( ^
@; s) a- X( c" L* |4 W
(3)相关分析(点二列相关 ) _) q9 Q0 @1 |4 |! G
) W3 \. ~- N* n+ W: t6 w5 k
% v1 a* M6 E' |$ W1 H5 x7 I7 Y
' f$ M3 d& b& J7 G# J& S
V- ?: c; p- q2 c; c
I0 V0 p" b% w
(4)回归分析
' |/ A2 Q G( l4 H/ [. u0 u; s3 r! n, W- J$ {% B
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
" p+ n$ ], B- O
' Z, X! l9 t/ Q! r e因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
& a# _1 h! Y4 y" x$ I
% _1 `# Y4 \& K3 @# o% S回归分析一般有这几个操作:
/ ?3 }7 V1 y) N2 g① 设置筛选条件,刷选数据集 valid
. y( I; T9 R! |7 f2 u" m![]()
5 t; j4 c4 V& D" g% C v9 |. |
" q! Z5 L7 S4 Q3 c* C: E2 U![]()
6 @0 q X6 i: v② 模型拟合度检验 ; m% U0 ^/ g5 h! m. `6 y
+ k$ m7 k) F7 [/ [9 D2 b$ t# l
) p, C) S4 M2 f, [+ L
/ `: r, H+ g/ N! H* n③ 预测的模型参数
2 E, `/ ]5 X) O& V 6 ~ g3 |# E7 g
④ 预测结果,准确率/ d- \! T) J8 B4 X1 o: k) g- R. I
![]()
4 ?: j/ X+ D @, B% H: P% O ; e x. }# q: v8 B6 g8 l. B `5 _
. `' W) w5 _% ?/ m
: k# i# {! F% _: @' e8 t3 R
(5)特征选择和数据预处理
$ [7 H( V* m/ F( o% A. h, \+ I/ E9 H9 `9 l) Z( X: _( H; L
特征选择,主要是gzh的想法
" o* `; e: S) e+ s( B特征筛选的思路: 5 {! i2 D- Y. ]
分类变量用1 2 3 4 离散值
) W8 ^1 i& S: g5 ~" |; j3 K6 X对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
$ X; d4 s O# M- P2 |8 J对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
5 S; P1 I3 ?/ l: |- s3 w* n8 f" N. H8 K% b$ k# z! F: f+ j: {
注意了: 1 o1 G' n2 }/ R# p1 T1 [
筛选特征的时候,重复性要考虑、缺失值要考虑
0 D) Y0 w5 Z% v8 `1 }/ w1 G1 s
1 {. r5 _# P3 G1 ^, ]" y(6)缺失值的填充0 @5 X+ h8 K6 m/ {$ }2 ?
: y$ E* ^6 s& @; ~: S2 _
![]()
) f. ]# N3 E @2 i. F; ]: D: z6 b F1 I) i
(7)文档编辑的一些技巧
]! t" }/ N* H- Y7 W G. ]! t% Q" K$ {# P% M/ [6 n$ F* W! J
https://blog.csdn.net/qq_26769591/article/details/80848841
% h3 k) n5 @6 ^7 s* f9 P2 ?* E, J' [) e7 ^8 e% T
(8)团队合作的一些心得# J. e6 C7 @0 W9 A1 v, O* d0 q1 @
* G: U- q+ J5 P1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 3 i5 v9 |) G5 d# s: f
2.不会乱 不会重复做功 不会丢失工作 ' g2 k8 N+ H+ r) d
3.经验丰富 总能拿出一种解决方案
3 u; d8 D4 X2 V6 j+ }% }% U, I3 Q4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
; k Q D; Y2 K2 F3 L# j5.大致方向总是不差 错也只是参数不是思路 不是算法
. ~) A: d* X! `" ]5 r; U X# @6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 # I& k, A! [3 E, T
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线% R/ Q9 l" y" E
---------------------
+ W# F" j7 s" Z G作者:-英击长空-
" m$ |% ?. M8 q2 @& v i! a; r来源:CSDN 3 M; S$ |* p3 M: h( j5 z
原文:https://blog.csdn.net/qq_26769591/article/details/80840673
3 |2 U: p" Q5 @' ~8 s# z/ E9 K2 g0 [$ D" V% {+ |/ D
8 V8 |0 f# k! L
/ t2 V+ d7 ]; z9 T) G X- U' F
0 x w7 Q; P3 J6 Z8 N4 U9 w |
zan
|