- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563312 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174216
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结:
* [6 R: x- W; J/ L1 q9 Z3 _- M. V C5 V0 b2 p+ N6 u3 {0 l+ M5 f
(1)写作缘由4 T) z; ]/ i+ k" f" E& R
(2)统计描述:3 d7 `0 z0 I/ G1 l* ~5 c1 [% f
追加用excel 做频率统计
. T$ h Y ~' C$ G/ }4 }1 L$ ^( E(3)相关分析(点二列相关 ). C/ m @6 D# E; D+ e! m8 w% I
(4)回归分析1 j3 S' O* V( \3 J
(5)特征选择和数据预处理
7 a( N$ f( n9 ^(6)缺失值的填充
$ `) B0 v1 q; o i Z" P/ L0 @, x(7)文档编辑的一些技巧8 R/ Z; H( `1 `6 |( C
(8)团队合作的一些心得- b. R- T3 t) U5 j S$ E
(1)写作缘由
0 g( f+ W( |0 c. B4 y5 y* l; `7 k! i; d; O
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下* _0 y- M' L; Q1 g# E5 j2 g4 O) ]
: Q, d$ o3 B" [& ?5 @(2)统计描述: ~( m! C- |- F- C( \8 c" z
* J& B4 Q: `0 F2 G5 K① 频率统计
$ l3 x0 }" I5 E" t- v/ E; x$ ^" o n② 中位数
9 `" k8 o$ M ` S9 F( v, F③ 众数
* @1 k# g" H- g7 x3 Y8 Z& B④ 平均数 $ r7 q% h# [' E4 L) |( a
⑤ 方差
6 h+ g, ?0 ]- \6 o7 {! V0 Z⑥ 标准差
1 A& g7 `! F* \2 Q0 S* c( _' `) ~用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 ; C7 f$ J: X- ^* }9 x( x0 P
" S# ?8 {6 T0 j! s追加用excel 做频率统计
3 o4 r/ F& r* k9 F: Q
2 P8 t7 j6 z8 {3 Whttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html9 K; N6 {, h( m
; c: `: x. @0 T(3)相关分析(点二列相关 )
( E+ _7 F5 h; C- g$ y
- X5 y8 C: s" g8 f$ n. q! n6 G! G/ Y' u* v: o
# e! ~( Y! e) Y% O' h
# @" A: _" J+ b4 @" E+ P6 Y t' u6 j
(4)回归分析
/ X: a1 W# _) ^$ \. v1 ]; e5 J' p7 R y. r; J
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
4 {5 U9 K; U' D8 J$ ^" u- s
6 d" C* d5 l3 S( e: s7 R3 Y) H, }因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。" z5 U6 g- y. f" S
' N' l) t% x; R: ?% k* Z回归分析一般有这几个操作:
% d a8 a( n9 T- M) G① 设置筛选条件,刷选数据集 valid 8 k6 X4 \6 |! a2 F1 P' P7 f
8 W- J9 |' B9 h" o* q! z* W& T
; X0 d# o* Q; b0 O# A
/ z5 K9 y: c5 D4 F4 S8 H/ f② 模型拟合度检验 g# x% f9 Q6 H- H. D
3 ]$ t4 M7 K2 W5 }2 q: t5 M( H: ~$ A- o' w# Q2 W8 {/ s+ _
1 m6 j1 s* d8 I
③ 预测的模型参数 8 K( }& P o( D
3 R5 r2 l: f. W" J7 u
④ 预测结果,准确率. b% {* |# [/ ?6 S: }
- o: X# k, `" b+ k+ w9 K9 T
& ^# a' q! @" z9 P, {6 O
. |/ c1 t" r7 m8 A
) I8 l- }: c( [0 r(5)特征选择和数据预处理' t6 o* b p6 I6 A
. Y- J# T4 e5 [5 Z/ ]6 F0 k+ {4 S
特征选择,主要是gzh的想法
$ W+ ?. B& S) q6 K+ ], C: U特征筛选的思路:
9 Z& Y$ I# ~7 e! K6 h分类变量用1 2 3 4 离散值 9 Y2 H* T+ _% T! K7 O9 M7 ]
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
) i5 ?- o/ m6 V. r对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
1 z# w1 N; e6 e( a4 k
- P9 t- d8 w Z4 E$ L6 u注意了: ( ?' e/ y/ v7 n2 b4 \
筛选特征的时候,重复性要考虑、缺失值要考虑
4 I. a4 ~+ }1 K: }0 @1 D3 T+ i3 I2 e/ u5 k
(6)缺失值的填充
1 G9 S1 @1 p0 s1 {) t1 I3 @) N5 s0 G( N
: I( [: y5 H) o
" @$ e2 C0 c( g
(7)文档编辑的一些技巧
7 G. M' r0 J1 A& a$ Z6 M# h3 [
, _, a0 T# E# c( Ohttps://blog.csdn.net/qq_26769591/article/details/808488416 u: W. f9 s2 f2 F
8 b) ?! D$ Z! c) S. x6 \# ~0 y( J
(8)团队合作的一些心得
) U# }1 V7 W' p
; P+ g$ u0 b* W1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
4 M' X: V3 y9 Z8 w! h* B% r3 U3 h% I: g" _2.不会乱 不会重复做功 不会丢失工作 5 V$ _! u7 T$ F a; R
3.经验丰富 总能拿出一种解决方案 & s3 O" L2 N3 d- T2 r
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近 ; a! o6 V+ S. K! z% k
5.大致方向总是不差 错也只是参数不是思路 不是算法
2 ]0 G% o: w R8 D) Z% \- P* m, n6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 ]4 ^" C7 D2 {5 Q
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线: ]- L% l4 ~3 p
---------------------
+ i: V) s" H. [3 o% J f d4 {0 f, D; M& ^1 R
/ J& i+ }5 ]/ G0 \5 }, Q! {
7 x* e" N1 L. v2 ?) g7 P& b. a7 O |
zan
|