- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564664 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174622
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结:
2 R( Z0 Q/ v2 E* h9 b* C; |7 k: _; Z$ Z5 L0 U3 T
(1)写作缘由2 `, Q# y& s a# f3 M
(2)统计描述:
$ I B" u4 }9 P0 t/ B8 D- f追加用excel 做频率统计
2 V7 O7 B* d6 P: w+ g2 h* P(3)相关分析(点二列相关 )
/ m3 i, x2 \: m( T% I(4)回归分析
/ b: E8 f* J3 Q; z, c3 [(5)特征选择和数据预处理9 t# }, A1 H1 o. Q% S/ W( l! f
(6)缺失值的填充
2 S) j5 x) C/ U! V/ e(7)文档编辑的一些技巧0 Z* W+ i0 d* t1 ]. D( i( \9 `
(8)团队合作的一些心得
. g. m6 Q! b( e) _5 f# m(1)写作缘由
( C) B1 e6 ~; w* K1 X' t0 {4 m7 b: P4 Z, H
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
2 K& P. }. C5 q0 o0 B( R
! I, f' ^$ u4 R$ q$ w2 p9 @8 W(2)统计描述:
2 d9 x/ n+ O$ Q
# t) u& V% I, c& k① 频率统计 % [# Y, Y* s* t$ h+ R# \
② 中位数 ) S) H0 F- o3 m
③ 众数
- [; ^) [ T$ Q! K3 |④ 平均数 7 L g! \& i2 O# r+ ]0 g3 N
⑤ 方差 & w& {5 r; s# y- ~( }& q3 D
⑥ 标准差 ! X% _ f2 d+ X
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 5 I, ^# y2 l, N+ u; |
2 s% G5 u0 X1 D" A追加用excel 做频率统计
) L7 e& q! F; ~& a' X" H2 X
z& Y0 Z! x/ b. u4 `, A# C9 U, Ohttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
# ~6 m a- \! v0 \) Q7 \: R1 I+ v9 m) c# c' {: q$ Z8 C
(3)相关分析(点二列相关 )+ A% S, Z" _( P
: G2 X& |& O; h
, f M" c5 G) c& r( H
; `7 y, d+ v- r/ L. a, ~* S2 F# x7 _: R
: K* T5 t0 G+ Y3 a+ ~' Q6 J3 }
(4)回归分析
* l8 f6 S) k9 x' H# y, v
9 ?3 Y! I' u1 [* O( T! xLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。1 f. \% z; f$ A0 i# _: W% B& V6 b
9 q) L! F7 m, _$ M3 f因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
' m" S! Z* R5 N* G1 i
; j, T8 S; t/ v3 n! w" s( Z回归分析一般有这几个操作: , c! q. i$ N/ P+ J% ^+ c
① 设置筛选条件,刷选数据集 valid ; G5 @+ F2 p% Y& L/ {9 U& _
2 W* ? @+ c' O, R
- j V3 j' x1 {9 v5 I R8 t+ C+ {2 a! l1 X( f( I' w* t' Y9 k
② 模型拟合度检验
3 }9 }" x( J6 C0 |1 L7 R1 N) P# L0 W# q
2 T/ }1 F8 z5 D) V6 _
' D+ v3 M ~* [% r* p: W③ 预测的模型参数 8 K m; f' \/ V4 v8 i: J/ M! z
8 F2 L6 @: E1 |6 B1 A* E
④ 预测结果,准确率1 Y& E3 e9 t7 G& P
" V. ~/ V9 \& _
/ g* b# r* j$ E1 m( h5 N0 V2 b& {% D; s4 B" V
# O+ Q: I. c" e9 @$ L(5)特征选择和数据预处理
2 q5 w- m% n m4 X0 o& y2 s% c+ A# b$ O2 b2 L7 P3 Z/ k: t0 c+ ]7 B
特征选择,主要是gzh的想法 + N$ ? P; x: V/ T) z U
特征筛选的思路:
# j% r( K* k( `+ K分类变量用1 2 3 4 离散值 ) U$ X' Y) I ]& o7 \
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 2 U* F: D3 i* J5 r o8 X( }+ k1 v
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值1 V- Q2 @& [; a) l2 J! k
/ v; }6 W T; B7 w& r6 t, V0 q6 Z8 O
注意了:
( r H- Z1 h8 J2 P筛选特征的时候,重复性要考虑、缺失值要考虑, j. S @$ o9 P8 M% U( N
) W) j! j3 k. A# O(6)缺失值的填充( s' D1 c/ D P g$ N% D5 Z
( ~9 x1 N$ K. |1 g, v+ w2 ?% s8 x
' |. _7 i2 {8 t* o7 Q& g
" i8 S1 p! m2 Z3 w! q' ]
(7)文档编辑的一些技巧
' W i1 K9 L7 G$ f# C3 ?. ^7 P3 E, Q/ X8 A
https://blog.csdn.net/qq_26769591/article/details/80848841
+ A$ H* c9 E5 |; x, y- P! s. l u1 a# c8 B3 H1 p; R( M: X
(8)团队合作的一些心得1 t0 @3 }/ r6 m
6 ]- {5 f$ Y k7 Y* O0 U% ~1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
5 ~. u# ?: d9 h( ? K3 L1 W( R2.不会乱 不会重复做功 不会丢失工作 * L+ b4 s1 k/ V& \
3.经验丰富 总能拿出一种解决方案
& ^! C- c& }) A% { C4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近 , o V, u# f# g2 T) t- e5 U5 \
5.大致方向总是不差 错也只是参数不是思路 不是算法 # W: V: q* C6 d. n, f
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
1 `+ l$ Q! J) l9 s7 U0 P7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
; X8 A' Y- w2 O8 Q: K9 Y--------------------- ' N/ F( i" w, x! N
4 ~: f4 S3 Y5 \6 c
' w; g) c+ ?8 p) R4 G/ i" K1 D# X4 A, t) z1 |/ c: _
|
zan
|