- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564698 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174632
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
2021年研究生数模B题论文记录
: G2 R2 H7 y: S
6 y) U0 p' p$ b# y! g2021年研究生数模B题论文记录' f' z2 m; c; H4 V+ n( ]
1.常见数据处理方法:2 q% p. b3 h- h
2.相关性系数选择/ q2 g9 S* y3 P0 T6 _
3.聚类算法
+ h! J; w1 s; d- \1 C% ]4.一种数据降维方式8 ?1 X2 L% o$ H5 ~$ r
5.预测模型4 W/ V2 ^! n+ S/ [5 y' z' i: J
文章来源 2021年全国大学生研究生数学建模竞赛优秀论文集合,B题,文章编号:B21100130067
- o K# u, v h( p
! z# s; Z- l, ]2 s9 k. y1.常见数据处理方法:
5 d4 S* l, |8 R; z: e针对缺失值,文章使用的是拉格朗日插值法,相较于平均值插值法,更加适用于有时间序列性质的数据,同时插值后的数据属于预测的一部分,文章中的观点是保留小数+ _" n w5 z) b; p& v' @, S
针对异常值,一种是不符合实际意义的数据,需要通过文献查找进行删除,一方面可以通过箱线图进行判断,也可以使用3σ准则进行判断,3σ准则解释:
* }) N3 W- a9 e! \6 [6 H$ x: e- Q e7 j' e2 w D+ M- K2 x8 F& J
2.相关性系数选择! r/ s! k6 f0 X' f' {/ w
常见的有三种,皮尔森相关系数,肯德尔相关系数,斯皮尔曼相关系数,知乎解释
6 F" V7 ?1 X2 P7 _
) o# }6 {* F/ e* c
' f7 ^- ^% E1 r1 u5 I0 M$ v. t' A, E' e0 b7 n9 r
3.聚类算法
' L& V7 H* U% s( p! K# O) p文章中主要提到了两类,基于EM的GMM聚类,K-means聚类' Y% Y. B0 |8 M, o4 y7 v
K-means聚类算法7 ], Z& s7 Q( V4 P! v
GMM聚类算法& `. ` O( ~% \5 x- D! S
( I& _( F. I! w& l
/ m5 R9 y8 Q Z. L% ~
. }) s8 m5 c: l# P) h' ^4.一种数据降维方式
7 C. ]- {: H9 ]5 \ S! F2 L5 G论文中提到的将22维的数据进行降维处理,判断降维后的数据是否容易进行聚类,进而推论出高维是否容易聚类,提到的算法是t-SNE t-SNE算法, t6 c6 E4 h+ R2 i
6 n( i7 |, A& b- [2 F9 G- v1 l0 z9 g/ h" Y7 |4 E
5.预测模型0 p' m/ S! Y" x# Z" o* G* i+ Z
文中使用的是XGBoost算法,论文中的第三问和第四问都是用的这个算法,使用时候,作者将数据进行纵向合并,数据集划分等操作,同时由于输入的维度过高,达到22维,而输出维度很低,还通过了输入特征与输出值的相关性,将维度进行降低,提出相关性不高的特征,最后图像看起来很好。XGBoost算法讲解
1 e1 N9 S* W; I; D) F% Y
0 z+ v$ b2 O" a: P+ A; V2 h d1 {( H1 K' t7 b; R( u
————————————————. P& C( ~6 ?& {' s: z
版权声明:本文为CSDN博主「Philo`」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。& Z E$ c! M: S7 a
原文链接:https://blog.csdn.net/qq_44864833/article/details/126650997
+ y" ?# l6 P2 ^ t3 S% D, w' j" m8 L, `0 r( @2 {5 S' ?
- \* T9 b0 l1 A2 J1 b: j |
zan
|