- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563283 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174208
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
2021年研究生数模B题论文记录7 E, v- f7 \& l* c: \& H
( ?6 m3 f' C- h! h1 J3 L
2021年研究生数模B题论文记录
, x. Q6 c: q# E1 c4 ?3 H: [1.常见数据处理方法:
) o% \! Z7 Y. o( R2.相关性系数选择
- L5 }9 c3 { T! _* ~! b3.聚类算法
" r4 J: w2 g0 t0 Z: k, Q5 D4.一种数据降维方式
" T% n- v M4 f6 o5 I) K. V5.预测模型* e4 Q, M/ M. z4 B8 k2 m6 t9 ]
文章来源 2021年全国大学生研究生数学建模竞赛优秀论文集合,B题,文章编号:B21100130067% G& C8 c6 c* j ]
8 s1 L' J) ]$ q, \7 Z
1.常见数据处理方法:5 R2 F% t/ |) [3 Q! {( {
针对缺失值,文章使用的是拉格朗日插值法,相较于平均值插值法,更加适用于有时间序列性质的数据,同时插值后的数据属于预测的一部分,文章中的观点是保留小数% M) U! K% G+ Y+ V B
针对异常值,一种是不符合实际意义的数据,需要通过文献查找进行删除,一方面可以通过箱线图进行判断,也可以使用3σ准则进行判断,3σ准则解释:
$ D" X9 r9 S9 q& ~& h
9 c) `9 D4 m4 w0 {0 O2.相关性系数选择$ T! R5 N+ f( ]- }0 ~
常见的有三种,皮尔森相关系数,肯德尔相关系数,斯皮尔曼相关系数,知乎解释
! g; l( c9 t& [. ?2 C
+ ^& X" _6 U3 d5 ~5 \) s
( \1 A7 W; g N t4 D5 t P/ [0 s9 v5 G ^$ L% y$ _
3.聚类算法
1 O( O" h- S5 |( c% X, _8 v' g3 [文章中主要提到了两类,基于EM的GMM聚类,K-means聚类8 x0 `2 L1 e, m8 L9 }7 h
K-means聚类算法! g4 `3 ? w9 w [' o% g
GMM聚类算法+ x- @' S( k V
* G. k# I" ^3 T+ B0 y3 x$ c- P( R8 `, P |7 Q+ M- b% W
/ n, K+ l7 w9 J" l; y8 T4.一种数据降维方式
4 y! v/ R! n9 C. l: N. g论文中提到的将22维的数据进行降维处理,判断降维后的数据是否容易进行聚类,进而推论出高维是否容易聚类,提到的算法是t-SNE t-SNE算法, h# G$ h {9 t" ^. ` W
" q' E5 ~: ?' ?" E
) s- L) t# Y7 H- M. l+ a
5.预测模型
4 B1 I0 [& F/ _ T0 p* z文中使用的是XGBoost算法,论文中的第三问和第四问都是用的这个算法,使用时候,作者将数据进行纵向合并,数据集划分等操作,同时由于输入的维度过高,达到22维,而输出维度很低,还通过了输入特征与输出值的相关性,将维度进行降低,提出相关性不高的特征,最后图像看起来很好。XGBoost算法讲解8 l& }. I2 O/ i7 Q' {2 _7 T
- ?0 B- j( Z+ y1 ~, A5 ?( N0 I. j% U, g" s
————————————————
# v" x$ h- N' x: J2 Q, s1 }版权声明:本文为CSDN博主「Philo`」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
+ M. c, s9 L4 {% e: A! Z原文链接:https://blog.csdn.net/qq_44864833/article/details/126650997: T/ n8 W5 f4 S% q3 E: D* y
% H9 H! V6 t* J! _
4 P0 ~$ h3 Q6 D+ M) A" h! m8 D& l |
zan
|