- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563347 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174227
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结:
# N" q! r# `/ h$ A2 D% q
* ~2 E; F9 T$ o3 n6 X3 J(1)写作缘由9 v+ j. H4 Q* Z0 _7 R% i# Q
(2)统计描述:7 C1 e# ]! u* C4 k* P" z
追加用excel 做频率统计( |! w, [1 `( H4 f& x
(3)相关分析(点二列相关 )
! a4 a7 } i% f- E7 ?0 }1 _(4)回归分析$ |+ w C9 j, ]% v+ q9 @
(5)特征选择和数据预处理/ Q! U! | m# _3 }
(6)缺失值的填充, g( g" }, H6 m U' m+ i5 Q2 X
(7)文档编辑的一些技巧
5 R" m4 H2 b" Z(8)团队合作的一些心得& h, J* S# Z/ R$ ?% Y# S2 B8 x
(1)写作缘由5 ^ T5 o! Z$ g0 h6 w4 n. ~" c1 C
- D) n3 v: g5 I( c
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下$ u) p! B2 Y5 k0 n' t4 F$ I
" X# Y4 _$ R* H8 _, I6 D8 [
(2)统计描述:, J, P5 i& S& c N5 |# x J
& x, Q& }2 {/ j: |
① 频率统计
9 m+ U6 f& G# m② 中位数
" m0 h% c/ F- {3 K③ 众数
. d4 ?! d; F' B! \, U' J, L④ 平均数 n8 K6 n9 g' H; Y: Z/ i q
⑤ 方差
, o6 g4 Y' s$ d⑥ 标准差
% |# w# \4 g8 b0 h用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 3 V( e+ y; q0 X+ I& ]( [
- Q: h; O7 a7 @8 L2 w K1 N追加用excel 做频率统计9 E- N! p6 @0 E4 D! S6 Z+ O7 F! ?9 Z, j1 [
0 _ l7 j# @! C8 D- Bhttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
" X% Z) ~/ u5 T$ u9 a! J
$ G$ E$ O9 U5 |2 v! A/ ?% u(3)相关分析(点二列相关 )
& y5 Q4 l! Z" K( J% I( l" p1 C2 j6 Y) I1 Q( Q+ l8 W9 V
. E2 Q( [9 @3 D+ R5 D
- Z0 V" H# b5 X1 V
/ e: P9 C9 R3 J1 I- U
, K- Z' Z9 n) e3 L2 U) S(4)回归分析
1 \: O! w: q: k/ I
5 y3 }$ S6 f4 }" D* s2 t2 }7 H7 i; YLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
; \5 Y% ~/ i' l6 l
2 b7 i/ ]( M. r6 k7 ]% ?7 t因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
- Q e) _9 _/ H6 U+ U" d( k9 |7 N1 o2 |2 U" V6 s* d( S
回归分析一般有这几个操作: $ A) d: ^1 [( I. ]/ {2 S
① 设置筛选条件,刷选数据集 valid
* f* B! H+ Y9 M' k6 |0 b! S9 |- b& q8 k! T% H
, V% k; X# F# n5 }- B7 @
7 r; b3 w& O9 E1 K7 j② 模型拟合度检验
6 ?, e" p8 v4 P; j# K% ]+ @ e; \
$ Y N, E" |7 K; O$ s, j4 z
' K- d4 p% {0 A) V4 a, I
③ 预测的模型参数 3 n" V+ l: Y; ]( ?. W8 P/ O
8 n4 B# t8 b; ?8 N4 n. R④ 预测结果,准确率
2 e) n7 H# ?/ A! ^) x6 q1 u6 {7 [- j! f; G; q4 x* N
. D& x# `# S3 y0 [- z' l" k: v! U5 g3 @
* h. {+ M4 H- F) ]7 @
(5)特征选择和数据预处理
" _3 K9 B2 G8 Z7 L9 t( O8 ~: ?9 j! r5 _- |% O! ^7 P1 Y
特征选择,主要是gzh的想法
4 d: t' |4 j8 m/ l( ^3 @特征筛选的思路: 3 |: o, h# ]. `7 n* |% \
分类变量用1 2 3 4 离散值
8 {6 }& w1 L2 d1 v7 E8 _+ c9 Q; a4 }对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
# G- B4 o' [* M' l$ s对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值' B7 w1 |2 K: u" _: e9 H4 t
; x/ S9 I2 `' ^' Q注意了: , v+ A0 Y3 w R, S c
筛选特征的时候,重复性要考虑、缺失值要考虑
- @& @: M3 }) h0 U+ N: R. A% j2 _0 L. l4 J3 t1 j6 C5 N4 ~
(6)缺失值的填充
2 K% s0 O& d; a$ Y0 Y; a' F4 t# R6 f7 }! K3 a: @
8 M: N! f, N, h* H5 }* z* L1 S$ o# o. T
(7)文档编辑的一些技巧" J, Z3 }& W% r
# g Z. @/ C: I* _/ _( L8 y! r! L2 Z; J
https://blog.csdn.net/qq_26769591/article/details/80848841% @2 }+ Q' G3 @; j/ x/ M0 P7 E
. T' O. N% C, o6 Q: E4 ^- s(8)团队合作的一些心得5 r8 L( x. W* Z% s, y$ |. x, V. j
2 m! W4 V3 I3 A4 C& W1 A/ @9 b8 ^
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 ' y! M; w8 N+ z! D9 h0 x% L8 q
2.不会乱 不会重复做功 不会丢失工作
7 L8 V" a( R# h+ @3.经验丰富 总能拿出一种解决方案 " t$ S, a' @+ z' s- L) h
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近
* m0 X% {2 v1 {" ~. P. g% L5.大致方向总是不差 错也只是参数不是思路 不是算法
" x6 r* x+ D) h% h5 x w6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
6 }% X# M4 W, ~: L/ o7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线 B# c( w3 x" W f5 c5 {+ E
--------------------- 2 Q, O& h/ u3 N: H, G6 D$ e# ]
* V c) E2 ]& p5 x) b u! `) z+ w; R4 |/ K9 C( j
. `5 l! u! Q: r) V: f |
zan
|