数学建模社区-数学中国

标题: 一种基于高斯过采样的集成学习算法 [打印本页]

作者: 杨利霞    时间: 2020-11-20 15:28
标题: 一种基于高斯过采样的集成学习算法
一种基于高斯过采样的集成学习算法
' n5 \& R. [, ~( J

( F; Q! ~) Z- a6 [; U2 C4 a2 d5 l! K. K; |, f- J* T% Y
/ Q% W4 i% f" h0 `, @7 ~
在数据挖掘研究领域, 分类任务广泛存在着数据分布不均衡问题, 例如制造状态检测, 医疗
. {% F7 T; v' }9 g' u+ {诊断, 金融服务, 等等. SMOTE 是处理不均衡数据分类问题的常用技术, 与 Boosting 算法相结合可2 Q/ m1 w( \. m6 Z
进一步提升分类系统性能, 但是这种集成学习容易导致基分类器多样性缺失. 基于此, 本文提出了
2 o+ v- N4 J, b/ R# A, I一种基于高斯过程 SMOTE过采样的 Boosting集成学习算法, 即(Gaussian-based SMOTE in Boosting, $ p  K7 L8 G, T, r" v) h
GSMOTEBoost). 该算法在 Boosting 集成框架下构建不均衡学习模型, 为了提高分类系统的鲁棒性,3 J9 R3 ?$ U5 t0 A; F' _
采用基于高斯过程 SMOTE 过采样技术来增加基分类器训练样本的多样性, 从而提高基分类器之9 j* u9 |# p) y) y
间的差异. 为了验证算法的有效性, 以常用的处理不均衡分类问题的算法作为对比方法, 采用 KEEL
  s, f# j: m' g# P+ G# y' ~数据库里的 20 个标准数据集对算法进行测试, 以 G-mean, F-measure 以及 AUC 作为算法的评价指: K/ K8 u" o- z8 e5 T5 m& f
标, 利用统计检验手段对实验结果进行分析. 实验结果表明, 相对于其他算法, 本文提出的
# R' Y8 `; H3 D3 FGSMOTEBoost 具有显著的优势.- x* ~  c; ~% G0 n3 R1 W
$ p2 D+ A0 Y6 w  z& G: j
& G& s8 b+ O; |0 V- g  F$ t* @

. M  i0 j6 Q8 a- \- X! p% ?9 V
4 G; J2 R2 ~  w% X: e0 c

一种基于高斯过采样的集成学习算法.pdf

559.04 KB, 下载次数: 0, 下载积分: 体力 -2 点






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5