- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564664 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174622
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结:
/ \+ ^; n7 z: T8 m4 H+ T3 K* ?9 R% G+ X2 C, y$ C
(1)写作缘由) G( S$ A' V) I) k5 G! q% ^
(2)统计描述:
8 ]* Y9 k; B% |; F0 \+ t% ~( ?追加用excel 做频率统计1 x( O' e, j' x/ Y- F
(3)相关分析(点二列相关 )
7 V8 d0 [" } I" F' s7 L2 Q* Q( V( h(4)回归分析+ q g! Y# p+ P4 M$ l
(5)特征选择和数据预处理) q- X, n9 i, y
(6)缺失值的填充
) w5 s' \4 Y" n- p3 z(7)文档编辑的一些技巧4 N! G) L4 _% S5 p" b
(8)团队合作的一些心得
+ u0 k2 o N: H: k5 h) |0 d% ~# D(1)写作缘由+ U+ j& y5 j, i, r& M7 Z
# y+ {, S" {$ I+ p在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
1 H7 F1 F( Y7 u' b4 v3 d
# h% t R$ ?& x, S# B3 F! d2 y(2)统计描述:
5 m) j" _6 V) h8 ^) j) A6 {: u1 ~
% e0 p: c6 O! R) T5 V4 o8 c3 e① 频率统计 * _& z. `( q/ w' W
② 中位数 9 e3 S _+ p; Z0 m
③ 众数
) p/ x( {+ x, @+ r$ X6 o④ 平均数 4 H. {! v) Q" s" w6 A; j4 y: B
⑤ 方差 8 {' @4 [( [; Y h) _: M
⑥ 标准差
6 p# D2 l* v- K$ G, u用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 . S* m2 {" a3 U( B7 J" W1 y' m$ a! d8 P
' L, R5 T( R/ O* I/ N- z3 C& l追加用excel 做频率统计8 |7 q$ B( b+ [, x4 |% f
# I- @1 T% R# W3 i2 n1 L8 W& |9 u4 }https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
7 C a. C4 c; f9 D& l& l6 `2 d$ ?! B+ s0 ^ W& |
(3)相关分析(点二列相关 )0 j- Q+ J1 [0 V
6 p5 W! L6 x& S7 w8 x; x$ n. ?
7 A: i4 M* H3 A1 J) Y
3 m& L+ {$ |6 J. V4 o1 O3 f' Y5 D+ J0 E) C9 ~
/ S1 G3 J/ `) ]- d
(4)回归分析( u" J% a* t0 K
6 T( j- A4 ^+ VLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
, }2 T; i5 N- S& b" J3 _
$ H N4 f( W1 Q. c, A3 E7 o+ o因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。$ ]5 u/ l) A% x5 u8 G. k1 J
' O+ {0 C! a. A8 L4 x9 h
回归分析一般有这几个操作:
) |+ ]& p, D* H2 L! Z% R% [& d① 设置筛选条件,刷选数据集 valid
+ A0 ?% {- I; [ m; n8 J! r3 i; ^( Z
# M8 \' U5 Z6 d& e0 i
5 n$ D. X$ r/ c1 j
② 模型拟合度检验
' @# s& j2 q% `. m% }% ]) N- j" J7 l$ `& w
" O5 C/ t' _* H4 W6 ^
% D _5 `: P; a6 F& V* s③ 预测的模型参数 " T- h; v1 \' D1 R9 d7 A. d
8 a7 E7 n' ~1 b7 v! U9 Q! W0 J9 ~④ 预测结果,准确率
& x% ]* b! \, F6 n
% K" a! v& q p j9 F
9 z4 f6 k* u4 o! l) F
$ y' V' b2 e. _) c, A: |' f; P( `- }) L+ O- q$ _
(5)特征选择和数据预处理0 J, h# ]6 |8 r& X2 H3 C( X0 P
- H# c' U- W1 n1 h特征选择,主要是gzh的想法
% W7 S2 h; @8 |特征筛选的思路:
3 G( J! u; @) x+ c) O$ Y分类变量用1 2 3 4 离散值 2 @# J9 m% _3 c0 z6 c+ G7 M
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
& C8 r4 T; \& l: H; Z- z对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值' Y' v- `; F2 r0 n# L
* v, ~! {* w, N注意了:
5 N1 K; l) ^& B8 |, d筛选特征的时候,重复性要考虑、缺失值要考虑" o. Y& J* j0 A/ m) O# k7 k2 {
8 E. }1 x7 q2 K' V0 n4 L(6)缺失值的填充$ K# P- a6 ?3 r! n7 V
- f% R c% y' W' n7 z8 C) j; e( j: F4 l/ P
" V0 X3 f3 J/ p) Q, i/ ?3 x(7)文档编辑的一些技巧- U; _" q& P+ y4 |/ s
( I! y; O4 P2 c) u Y$ nhttps://blog.csdn.net/qq_26769591/article/details/80848841! N6 _ _' X$ V& k# n
' C) c, F: i5 R0 @4 l(8)团队合作的一些心得
2 ?* g8 @' K n) Y) w
2 o/ e7 w! Q8 \1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 # x, n. k* { h% U/ X; S6 S8 @( p' I
2.不会乱 不会重复做功 不会丢失工作 9 K1 I9 ^2 K' `+ @
3.经验丰富 总能拿出一种解决方案 % D1 M" r* {0 w7 i/ L/ R7 |: k, a0 _
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近
5 Z0 w9 h8 ~4 D& _+ D) ?5.大致方向总是不差 错也只是参数不是思路 不是算法 & n% e) |$ ?5 Z" d
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
7 l& Z7 }* u* `+ ]# X7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线4 u$ l4 C. h! N2 G9 ]" z2 V0 g" O
--------------------- # O" c$ m' H# M/ w
. G$ y% a7 t. D, R
: o( K D( m: Q
& Z3 a# \3 J/ a1 U |
zan
|