- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564616 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174608
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结. T/ H1 G* G4 _+ p5 v: j# W2 q/ s6 a
数学建模大作业中涉及到的知识点总结:2 G" d' I4 e5 H- d/ j7 D
% K D8 P& ]: t' `7 R(1)写作缘由+ S( k0 y8 T8 _* t5 f
(2)统计描述:) M# a7 c: F" C) k8 n
追加用excel 做频率统计: J- C4 l+ ]8 X8 Q% }
(3)相关分析(点二列相关 )
# c; k/ z& ] x a& E1 y7 _2 I(4)回归分析
0 Y# z6 ~ w+ z+ _' e9 c(5)特征选择和数据预处理
. S O5 n# _( {4 E j(6)缺失值的填充
1 I& x2 b% b7 i8 j4 q(7)文档编辑的一些技巧0 d3 P2 G% T4 n7 j" m) r+ i. w
(8)团队合作的一些心得" u' ^ q) S! f* A2 V1 M. w
(1)写作缘由* z& e7 _* w; c) v3 m' m
L% }4 |4 m( x) @- d. o# ?在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
. M! a) L$ M. W, Y- }7 C: `( x
* A6 W- C. G. |7 g v9 o(2)统计描述:
1 e& H2 Z1 Y; t, k# I2 B/ o) ^1 h f9 M& A* b |6 `
① 频率统计 1 C; [4 s, R7 ~( l: ~, r2 d6 p
② 中位数 ! [- U' e5 S4 w+ S6 k8 x
③ 众数
1 @6 R- a( g1 F Y ~7 I④ 平均数
$ } b& j; o+ y. h$ s9 f⑤ 方差 1 |* V) x, l% P) c8 d& \
⑥ 标准差
# V9 X- [8 l; I" e/ P用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
1 d, ~! Z: M8 f& I) o! i
; Z1 N8 P3 b# ~0 N/ X) R1 a- D6 \
追加用excel 做频率统计2 d+ C, R& W2 W/ o/ {% L4 j
5 D5 c! Y8 [4 h0 W3 w& c
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html0 d& ]5 O9 |# D) S% m9 }
" H' W2 u* {$ @6 {( \# j(3)相关分析(点二列相关 )7 S5 ?* h1 y6 d G/ @4 i
* z6 P* Z% z6 R. j
/ O$ ~, B7 \* ?' ]3 v![]()
0 N, \: ?$ j' g9 W3 i5 Y
& w- Z! L5 o: K( {9 Y+ y+ s3 U; }) P: e R) _3 I c; w$ W
(4)回归分析
, K/ Z( a6 ]# G* F0 P( W5 ^+ A2 M2 ?9 L
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
G+ f( x* t" d5 e1 Z N
/ a8 r7 A7 B, l. |+ g因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
8 T* T- k0 H: X, g9 D
$ z/ p* F% @& U% j8 s回归分析一般有这几个操作:
7 g7 I Z/ x8 M/ }① 设置筛选条件,刷选数据集 valid 0 r" U' _! Y$ {2 m3 z- n
![]()
" c2 n; p# F" A5 `5 X! Q) g, o; H; e; h9 e3 [/ y) d6 ^( r
![]()
' u& f1 ]/ j8 I3 H; j② 模型拟合度检验
* U- b$ `4 e: J" a' ?, a ![]()
! K# w3 `2 R; `! y![]()
6 j' c2 c) b+ i9 v3 f# D; C; p, t; n% q Z( [4 m) n7 Y; @ w
③ 预测的模型参数 5 F7 g" s% ?% |8 R# z
![]()
' k! B( B1 p1 T; G: {7 ^& r④ 预测结果,准确率5 G7 X7 E- k# V
. J$ S# }; P- ?
3 g+ d8 E/ ]. ?3 a/ R) f
) \9 h- Z' D4 C" F- ~( T
- z5 B' T4 \! t: ^(5)特征选择和数据预处理' P2 {7 d$ n6 z" v0 R+ m
7 K; R9 C+ f$ ^* v& v( A7 o7 t特征选择,主要是gzh的想法
$ ^* U7 A. _# x特征筛选的思路:
7 l# h$ q0 \4 f. _$ p3 J分类变量用1 2 3 4 离散值
' M( ]2 m8 }; o对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 3 n; ` R3 X+ O7 P
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
\+ e8 ?" Z* f+ r
) P( C% ~ c9 f8 b' x注意了: 6 j% {9 l J5 ?( N
筛选特征的时候,重复性要考虑、缺失值要考虑
) k9 }- O6 v! V( _' K' G) z$ W( v
2 D- U2 N& y( w m Q(6)缺失值的填充
. c {. x1 i7 Q T4 ^. T' H2 \
1 M- n$ X X0 H$ i2 v![]()
# ?/ m! {- A4 @) P9 b
8 G" ?- U# [1 A8 J0 ]! r9 s3 g(7)文档编辑的一些技巧
- x8 h) f: M6 Q' [! G2 O& R/ ]- S" q" B3 Y# l# O
https://blog.csdn.net/qq_26769591/article/details/808488418 ^6 r4 x% O" B- J) t
1 b) H' D! H( \1 d
(8)团队合作的一些心得5 \4 y4 L7 M, g2 e1 P
/ H/ B6 t7 p% v9 a& p
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 6 D$ |- q+ f( @$ K4 ^/ Q# h( b
2.不会乱 不会重复做功 不会丢失工作
$ Q y3 p) o! g& k; j3.经验丰富 总能拿出一种解决方案
4 J U, B7 s4 I! P9 C# g }8 L* P4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
, B* ]# d1 s* r+ k5 i2 x8 c" I5.大致方向总是不差 错也只是参数不是思路 不是算法 % u) y) i( l+ [5 ~) |
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
3 y" \( E/ [0 s8 `2 i6 M' m7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线9 }" ?; e3 J2 D6 \! z8 u; A
--------------------- # O$ ^; p5 Z* s' t# z2 D# w6 a
作者:-英击长空- , Q5 {: G- M c0 Q( `
来源:CSDN
* B- j# M2 {/ m* J# n7 S6 X原文:https://blog.csdn.net/qq_26769591/article/details/80840673 2 V9 g6 h/ j7 l" H+ b* _. e
; J9 \6 F9 P% w# c
% o8 p# {- ~/ G8 C" L5 c
0 T1 x5 @6 g0 `6 R
% r( w- d" B9 s1 M- B |
zan
|