- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563330 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174222
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结: % D# Y$ M( c1 X7 G7 K
( j2 t* c/ h& J& b4 ~(1)写作缘由2 l. m/ e% d. F" _) {" l+ J% F
(2)统计描述:# w7 H6 |% o6 j( {/ r
追加用excel 做频率统计4 o9 A3 H& F5 m; B8 J- x! C: T) w
(3)相关分析(点二列相关 )
- a/ Q$ [* r: S0 k3 U9 R(4)回归分析
$ [$ i ?, l* N(5)特征选择和数据预处理; ? H' } v, ~+ v- L3 @
(6)缺失值的填充
9 D2 a* }6 K( h- u$ d8 G(7)文档编辑的一些技巧% Y/ |- ^/ X( k
(8)团队合作的一些心得- \" o; t: O; L; P
(1)写作缘由, w7 |8 g0 v/ ?$ Y4 P( j+ y
, m9 r. k2 X" ~' p
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
( e4 D' Y, S. }5 x, E; l! G% D5 e5 D2 K% k. \7 b4 g5 x4 Z. Z
(2)统计描述:0 C8 T: {2 q/ c o6 ?5 z2 J
3 g3 u5 @# [7 Q0 ]' M
① 频率统计
6 z* D: R# b. ~② 中位数
7 m6 _9 T, o0 f y9 j4 ~* \③ 众数
4 e( j( Z" ]4 p4 z# n& C" f④ 平均数
. O. ^2 \; c- A4 A: z2 P6 l⑤ 方差
. c+ y Z# M- i" s2 J' k z1 i, `⑥ 标准差
# D8 X! {+ T: D6 `; S& i" X用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 3 W0 P& e; ?& g( Q: [& t$ a
t# p# z- n( l/ L# P" }. U. a追加用excel 做频率统计
$ |0 E- H, X) E0 g3 W& E+ D
V9 w w7 i1 p V9 \- @4 jhttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
6 |6 k2 n, g, r D1 c( t4 \! Z, r* G: w8 O- Y) t7 @7 S
(3)相关分析(点二列相关 )4 y+ ~5 p. \( J* q/ D8 G6 j! g
, W% g# F4 h5 z8 J
1 B; f* Z. _4 N9 d k
% F, j, i; |$ @# R7 G; u3 l3 @ V" R7 S( t' P8 j! E' M1 Q( b( |
& {0 k$ g D8 S5 n(4)回归分析
/ q7 h. j$ C; l$ f* ^1 T G
% E+ ]: g& K$ L$ l- b1 Z6 b6 c! O vLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
H2 [6 ]4 `, ] }) ?9 u
1 ?: g1 G9 h v, h; c% K因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
, y& S7 q6 ?" H' L) ?
5 F! N" W$ Y: Y2 {4 L( {* q: c回归分析一般有这几个操作:
% l2 S$ _+ G% F, d( p① 设置筛选条件,刷选数据集 valid
) C. k# b6 Z/ ~' A0 Q8 `: C; K! i# S7 u' L0 k8 r; c
" w5 S4 Q* A1 d9 u3 l
4 {3 @; z3 v$ b2 {6 @% ?8 |$ V' O
② 模型拟合度检验
- H' F% z7 n0 W5 V; c: a! v+ w4 r% V+ V. ~' z- B. r2 l7 N
/ A: R' K2 ]5 m& F4 s' Y( V* `# f8 f8 T" [8 ?
③ 预测的模型参数
7 `0 U) h7 H$ ~( U7 z/ D( ?3 @
. h, S6 o X" h+ [: j r④ 预测结果,准确率
! P( b# S/ M, S: c h4 P w1 H0 P6 D, } o, h6 H' f4 v
1 `2 U. ~$ b0 e! s) Y8 V% h8 v" o( {' y
0 _- \6 _ P9 ~6 ^& q
1 _& m9 |9 Y F. E0 C. R) x; b3 i9 M# l" r(5)特征选择和数据预处理
8 {1 H/ j4 I0 k' f( `0 r
- P1 r& g+ r+ o0 @5 _特征选择,主要是gzh的想法
0 `$ ]6 B6 w: h5 h% v特征筛选的思路: : {. I- Z. L& _3 A
分类变量用1 2 3 4 离散值
8 c" b3 {+ I5 _2 E6 @' N5 f6 Z y对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 4 X$ r7 v6 |( C, R& B: t
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
' p9 I( \/ F+ ~- K3 O
5 V1 l6 S, k+ ^3 ]注意了:
6 x u: V7 ~/ E& \# N筛选特征的时候,重复性要考虑、缺失值要考虑; |' W; W. b" q
' h3 e7 {% X w* M! p8 O, o$ s(6)缺失值的填充
' X: I& {6 `9 @3 E" Z5 `8 ?0 V( ^: c; h8 M4 O
/ [5 z4 B$ p3 N: p' ^0 l
- L& @/ s! {' B0 u& P# n7 o
(7)文档编辑的一些技巧
3 U4 p; [1 P; N
, W2 ~" Y3 P0 chttps://blog.csdn.net/qq_26769591/article/details/808488417 [+ o. v: C K( e+ [
' l h& }3 g% }3 ~
(8)团队合作的一些心得
# W$ G1 A3 w& S L1 R5 L$ u: z# f& S
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
9 ^9 L# I6 u$ e. F6 x" n2.不会乱 不会重复做功 不会丢失工作
: n, s0 u* \1 X4 d7 E: K3.经验丰富 总能拿出一种解决方案
9 G' W( V, e/ n4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近
9 A R9 w9 E( Z' {; ~+ N5.大致方向总是不差 错也只是参数不是思路 不是算法 5 u& B! L8 U0 _, h
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 % P% m3 u4 x' F
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线$ P# W: Z& B: b
---------------------
; |& W; R$ n) ~$ n Z/ u$ U# M$ W( Z% w5 N
7 Y6 B' e* I7 [# H6 n$ `1 x' J
" e# d9 g: A) q( C- E% K+ Y |
zan
|