查看: 3562|回复: 0

[其他资源] 2021年研究生数模B题论文记录

字体大小: 正常放大

杨利霞

5273 主题	82 听众	17万积分

TA的每日心情

	开心 2021-8-11 17:59

签到天数: 17 天

[LV.4]偶尔看看III

网络挑战赛参赛者

自我介绍: 本人女，毕业于内蒙古科技大学，担任文职专业，毕业专业英语。

群组: 2018美赛大象算法课程

群组: 2018美赛护航培训课程

群组: 2019年数学中国站长建

群组: 2019年数据分析师课程

群组: 2018年大象老师国赛优

电梯直达

1^#

发表于 2022-9-5 16:31 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

2021年研究生数模B题论文记录

2021年研究生数模B题论文记录
1.常见数据处理方法：
2.相关性系数选择
3.聚类算法
4.一种数据降维方式
5.预测模型
文章来源 2021年全国大学生研究生数学建模竞赛优秀论文集合，B题，文章编号：B21100130067

1.常见数据处理方法：
针对缺失值，文章使用的是拉格朗日插值法，相较于平均值插值法，更加适用于有时间序列性质的数据，同时插值后的数据属于预测的一部分，文章中的观点是保留小数
针对异常值，一种是不符合实际意义的数据，需要通过文献查找进行删除，一方面可以通过箱线图进行判断，也可以使用3σ准则进行判断,3σ准则解释:

2.相关性系数选择
常见的有三种，皮尔森相关系数，肯德尔相关系数，斯皮尔曼相关系数，知乎解释

3.聚类算法
文章中主要提到了两类，基于EM的GMM聚类，K-means聚类
K-means聚类算法
GMM聚类算法

4.一种数据降维方式
论文中提到的将22维的数据进行降维处理，判断降维后的数据是否容易进行聚类，进而推论出高维是否容易聚类，提到的算法是t-SNE t-SNE算法

5.预测模型
文中使用的是XGBoost算法，论文中的第三问和第四问都是用的这个算法，使用时候，作者将数据进行纵向合并，数据集划分等操作，同时由于输入的维度过高，达到22维，而输出维度很低，还通过了输入特征与输出值的相关性，将维度进行降低，提出相关性不高的特征，最后图像看起来很好。XGBoost算法讲解

————————————————
版权声明：本文为CSDN博主「Philo`」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/qq_44864833/article/details/126650997

zan