数学建模社区-数学中国

标题: 2021年研究生数模B题论文记录 [打印本页]

作者: 杨利霞    时间: 2022-9-5 16:31
标题: 2021年研究生数模B题论文记录
2021年研究生数模B题论文记录
$ r6 \' u3 t. J' K- A
  I& h- J" N3 I# p2021年研究生数模B题论文记录3 N% Y+ `3 A& V# P4 W2 E
1.常见数据处理方法:8 @* k# F3 ^/ D; S
2.相关性系数选择7 V: u- m( X8 A! V) s* Q
3.聚类算法
6 S* b' o0 C" m3 k6 c4.一种数据降维方式2 X% [5 Q, U/ m6 M/ Q: e
5.预测模型; x9 y2 `  v" [* z$ N0 C
文章来源 2021年全国大学生研究生数学建模竞赛优秀论文集合,B题,文章编号:B21100130067
  N8 h/ p0 R( M+ r% L
6 x" _( a) [: s5 \- W9 r7 {1.常见数据处理方法:- Y1 m# [: a2 S" Q5 K) }
针对缺失值,文章使用的是拉格朗日插值法,相较于平均值插值法,更加适用于有时间序列性质的数据,同时插值后的数据属于预测的一部分,文章中的观点是保留小数
. D) S6 ^" r) @针对异常值,一种是不符合实际意义的数据,需要通过文献查找进行删除,一方面可以通过箱线图进行判断,也可以使用3σ准则进行判断,3σ准则解释:
; j1 c' E) F3 h& f' ]' Y2 x( n9 h0 X9 O9 u2 c! Z- o5 W2 p. ^9 o  k
2.相关性系数选择
) {- c' h  Q7 i0 R; `% d/ i; |- ~常见的有三种,皮尔森相关系数,肯德尔相关系数,斯皮尔曼相关系数,知乎解释7 Q$ A2 M# a" F+ `6 F) u
9 `: C0 [- N* Q# r$ A
3 f6 H1 d1 x1 \, X
7 q) k  X5 c" G% G( \; Y6 Y, }
3.聚类算法
1 Y2 m7 c6 U: I6 ?% f( b) }文章中主要提到了两类,基于EM的GMM聚类,K-means聚类
( X0 c  I' C, n( GK-means聚类算法% J- ]8 L$ q+ @
GMM聚类算法
& E+ w- m' M9 _! `- C: h
7 U( h, A; d4 c3 p5 y8 K+ U  i# \
5 Y6 O) I2 E1 E  K( M' f8 O: R0 D0 L$ `- z) _& i
4.一种数据降维方式4 y% u. N/ \4 F2 [, c% E
论文中提到的将22维的数据进行降维处理,判断降维后的数据是否容易进行聚类,进而推论出高维是否容易聚类,提到的算法是t-SNE t-SNE算法
6 V1 p$ r+ M% M4 G1 `  c! V
& h0 q+ M1 H9 {! R  o% p" s/ C
+ ^$ V$ F4 R" N- F7 o# O+ ], X( J% s5.预测模型
6 z9 p5 Y) G" f; }0 C文中使用的是XGBoost算法,论文中的第三问和第四问都是用的这个算法,使用时候,作者将数据进行纵向合并,数据集划分等操作,同时由于输入的维度过高,达到22维,而输出维度很低,还通过了输入特征与输出值的相关性,将维度进行降低,提出相关性不高的特征,最后图像看起来很好。XGBoost算法讲解
# ?- h5 ]; F/ t$ P9 ]  {& }! `5 P( R. f  q7 r$ {! g+ q

# T  x" f; I1 h7 }% x————————————————
" s+ A: E9 {" [0 I3 s: ^4 U版权声明:本文为CSDN博主「Philo`」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。: f& a% D2 K8 V5 B7 q' m6 P5 d, e
原文链接:https://blog.csdn.net/qq_44864833/article/details/1266509974 J0 t4 X3 M0 H' h- `

" b- G' q: ]8 r5 k7 T3 n4 t
) z' X6 G2 D: Q) @4 g+ V0 ^) x6 X




欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5