- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563290 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174210
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结6 ~1 Z% O8 r6 [5 C( Z7 r% z! J, U8 C
数学建模大作业中涉及到的知识点总结:
6 E4 R$ n0 o0 U2 k. Z1 j
* W- o4 E6 D; d1 M$ v(1)写作缘由% T* M# ?4 Q/ K
(2)统计描述:
: W- {( l' O, J$ S追加用excel 做频率统计
& A- [+ S% h! C- ]1 ^# O& G(3)相关分析(点二列相关 )0 h1 i- n V M
(4)回归分析
4 V, V1 o9 n6 n, v* c(5)特征选择和数据预处理# D# j, o$ W2 j; E
(6)缺失值的填充3 ?1 C. \; x( B; l- }$ f
(7)文档编辑的一些技巧
$ H! x# p8 U6 a: ^2 X(8)团队合作的一些心得
7 Y" z& I+ y* d* Z( o) \(1)写作缘由
4 i$ n7 }# u; p. k9 p4 |( t# V y3 |
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下& O( {1 e* f3 ^( R4 [
& x/ [' M/ Z9 R4 m+ e2 `(2)统计描述:4 E9 n4 U7 n0 D) C
* c8 v4 J8 d5 X G; s5 S2 O① 频率统计
3 m, ?5 q3 I ]$ l- `9 r/ z$ a7 R② 中位数 * q+ e9 _3 w! X! |
③ 众数
! F" Z/ B6 [6 ^. Q④ 平均数 0 {) V# G" }- ^ U5 b8 k3 r. O
⑤ 方差
' N5 V. y* V8 z% N+ z4 i⑥ 标准差 1 h+ w% K S7 G- Y* k- _% f
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 ! p! ]0 {7 C/ V. ~ t6 X
* U! p8 A/ K! \" u* q% B7 u# @1 p
& U* H6 {+ L x3 C3 I4 j
追加用excel 做频率统计0 l( \1 h4 f5 X- n- r
![]()
4 a( h* E6 u+ i+ M- L, I* o) d0 Phttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
4 n+ N, | P; r0 F6 A, y2 _( _$ v9 R; I$ n
(3)相关分析(点二列相关 )
* {$ i1 t' \ _3 T& n![]()
2 W% b- y, b& H( E3 w
8 v' ]) i' x; l4 U! A : G* k ~& E# i3 Z
6 J# V/ G4 v# c6 i. g6 b
7 c" k1 Q; z; ^2 { M7 N1 a(4)回归分析
% z; {3 l9 }+ P7 K8 _) U
# Z. }2 {/ |8 xLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。! G( A$ o9 X$ i7 t% q( V% R# D
- y8 F( T+ C8 E8 g% \* Q, x因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。$ m. M1 C, h E$ ?1 K5 [* s$ `
( @0 v# ?1 }0 |1 Z
回归分析一般有这几个操作: 5 ~8 N3 L9 n! Q" A, w3 m
① 设置筛选条件,刷选数据集 valid 1 s% x+ E( j. ~* R3 C! A) c
$ U( m* C/ \+ s( ~: s
: h. W" w) r( V# k
# u0 n4 N" E" C
② 模型拟合度检验 . }0 q' \* I8 N( |! j, r
![]()
! l8 k {; i3 n* G8 \& N + p+ @! w: g6 r; d1 d- ]
" G4 v( i: x1 P! }9 r- W③ 预测的模型参数 # }) t! ?/ F- Q
$ f$ p: n0 t, b* I! F
④ 预测结果,准确率
( v) a# F6 c. z' g% ~5 C0 S 9 c7 s0 l+ Y- l* ]+ T
![]()
. P* N4 _( i3 _3 h. z' Y6 k" j( y/ f) D; o6 @$ ]! x
4 I1 A% g4 @% {, s) I(5)特征选择和数据预处理
z7 s2 ?4 D) ]9 }: l5 `3 y% D6 W( m) r9 w2 a
特征选择,主要是gzh的想法 - B/ j/ N2 c6 Y1 l; V8 v
特征筛选的思路: ; l9 K, R! Z' }4 r( C
分类变量用1 2 3 4 离散值 , v& B3 e; N, Z) @
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 4 x/ ]9 E5 S }& f8 T0 b
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值* ^/ X: l* s7 c7 [ T
5 e* x7 N5 m) K8 n5 S5 P5 m; w
注意了: # C9 i8 T0 r* d1 ?1 P# `
筛选特征的时候,重复性要考虑、缺失值要考虑- [& b8 n% E. T* M& ]5 y0 T1 ?3 m
8 { G4 ~( J: f4 {(6)缺失值的填充6 q. I* D" o8 \
1 Z* U+ v& c5 o5 p9 D* Z& v![]()
?2 y5 R N7 y0 V% y) A3 N
! s& k$ S* p' R. V r {7 n( ]4 c, u(7)文档编辑的一些技巧) d, s* _: \. {" {5 R
$ H: y5 m) B9 E8 m4 y5 V
https://blog.csdn.net/qq_26769591/article/details/808488419 A$ W6 g4 m0 k7 `& y* ?, Q
: J5 m8 a/ }- B- ~( p
(8)团队合作的一些心得
7 h; v( G- }& s
# f6 }. a5 ?0 G4 h1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 3 y1 J2 p) y" a
2.不会乱 不会重复做功 不会丢失工作 9 T6 |7 p" g9 _
3.经验丰富 总能拿出一种解决方案
U8 ]8 {# _8 {4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 8 i' P# m' l7 A, o" q# _) X8 p
5.大致方向总是不差 错也只是参数不是思路 不是算法 1 T; @% R) r" s- l
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
$ k/ {5 K6 E2 L7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线% l# k+ Q4 o% A* w p4 M) o
--------------------- : N' Z [5 z1 K- j
作者:-英击长空-
' Q" h* K( H7 w5 |$ l& X来源:CSDN & l8 s( F G+ |3 f+ {) D% Y2 C
原文:https://blog.csdn.net/qq_26769591/article/details/80840673 + _9 v$ ?. Y% U5 p: j6 u
2 z( U, l0 N# F+ g! y
1 F0 q( w0 P; U6 g1 f' f" y U
5 I- ^* w5 k% M" j! G$ p: m, ? r/ W3 c- G- `' o$ i* W& _' s
|
zan
|