- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564700 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174633
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
2021年研究生数模B题论文记录, l* e& Z& K, Z" ^8 z8 ^
9 r2 \, y; D" t9 T, w2021年研究生数模B题论文记录
5 D/ n9 W7 {; a1.常见数据处理方法:, d, ?! d b U3 S, X
2.相关性系数选择5 Z9 e; h W* E6 t
3.聚类算法
1 r8 O0 m8 `' ?( P# P- w1 K; m4.一种数据降维方式
1 {4 b( [8 x U" t0 S5.预测模型: w; j! F7 B( @1 [. i) \& @* w0 {, w
文章来源 2021年全国大学生研究生数学建模竞赛优秀论文集合,B题,文章编号:B21100130067
$ U! c* A% I8 u& T; p ^" b
8 [' e# n/ I8 N C2 T1.常见数据处理方法:
' D& S. D" o$ ?' m! Q: A& u) E针对缺失值,文章使用的是拉格朗日插值法,相较于平均值插值法,更加适用于有时间序列性质的数据,同时插值后的数据属于预测的一部分,文章中的观点是保留小数3 |( o8 R0 \, C, k# _4 O
针对异常值,一种是不符合实际意义的数据,需要通过文献查找进行删除,一方面可以通过箱线图进行判断,也可以使用3σ准则进行判断,3σ准则解释:# v8 m5 {; `6 I. ~9 ~2 e: f
0 S% E ~/ Y0 g; a
2.相关性系数选择- L" y0 _. t" V' T+ T
常见的有三种,皮尔森相关系数,肯德尔相关系数,斯皮尔曼相关系数,知乎解释
1 a5 z. \5 F( K* I z- g+ [" U' {+ _* _+ R
5 p$ h8 r- w( t+ m" d4 F* g7 o
& X) H* | D: m* ^4 w" }3.聚类算法8 K6 A- V8 {* i: n8 N- x! b2 D- D8 D
文章中主要提到了两类,基于EM的GMM聚类,K-means聚类
4 m3 p: I1 s/ ^: M' I1 } PK-means聚类算法
1 B- g$ C& `; s. yGMM聚类算法
. e: o6 ]0 ^) m/ x; o H" Y2 i2 c6 G- Q7 y* a% l7 d
+ A0 B* e; P$ ~( Y3 F
0 t9 ~- T- H% h$ d# B. ^3 c4.一种数据降维方式
& a: Z% a! k1 f: j, f论文中提到的将22维的数据进行降维处理,判断降维后的数据是否容易进行聚类,进而推论出高维是否容易聚类,提到的算法是t-SNE t-SNE算法
) d( ]; }3 l0 J8 \) R4 c& t
/ {2 y: x: s6 T3 p6 s8 O& N M- Y* p: }0 H0 L j& D
5.预测模型% v8 o8 L# E" }5 ]+ j% j6 v! F
文中使用的是XGBoost算法,论文中的第三问和第四问都是用的这个算法,使用时候,作者将数据进行纵向合并,数据集划分等操作,同时由于输入的维度过高,达到22维,而输出维度很低,还通过了输入特征与输出值的相关性,将维度进行降低,提出相关性不高的特征,最后图像看起来很好。XGBoost算法讲解
7 B! @; S) o( ~" n' w
' Y/ B0 U6 T, C
' T; q+ B0 C, I, P————————————————! ], ]9 _( J, q% _
版权声明:本文为CSDN博主「Philo`」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。! J1 v/ `1 ]$ ?
原文链接:https://blog.csdn.net/qq_44864833/article/details/1266509977 x: |2 Y) |* ` K% G1 {" H
- d+ O0 C8 G+ W2 L' S2 [& k" P
' M/ d2 p4 I4 ?( z8 F |
zan
|