数学建模社区-数学中国
标题:
一种基于高斯过采样的集成学习算法
[打印本页]
作者:
杨利霞
时间:
2020-11-20 15:28
标题:
一种基于高斯过采样的集成学习算法
一种基于高斯过采样的集成学习算法
) U( ^# m+ L8 f1 ]4 L
S& u0 C$ c2 W1 ]$ K7 e, R
7 ~" G' Q& [4 }% V
8 j( p1 r3 P" y/ e4 z0 q/ [8 j$ J' A& v
在数据挖掘研究领域, 分类任务广泛存在着数据分布不均衡问题, 例如制造状态检测, 医疗
$ h I) d; ]- v+ g: a
诊断, 金融服务, 等等. SMOTE 是处理不均衡数据分类问题的常用技术, 与 Boosting 算法相结合可
0 X1 S7 r6 v" B6 t0 M+ K, I: y
进一步提升分类系统性能, 但是这种集成学习容易导致基分类器多样性缺失. 基于此, 本文提出了
. E; {1 P9 P/ k0 ^ K2 B: [6 e2 H
一种基于高斯过程 SMOTE过采样的 Boosting集成学习算法, 即(Gaussian-based SMOTE in Boosting,
- r2 g9 ~' _- S# b# k
GSMOTEBoost). 该算法在 Boosting 集成框架下构建不均衡学习模型, 为了提高分类系统的鲁棒性,
! j' S% W- b% [# V
采用基于高斯过程 SMOTE 过采样技术来增加基分类器训练样本的多样性, 从而提高基分类器之
* m7 k/ f' @: D4 \
间的差异. 为了验证算法的有效性, 以常用的处理不均衡分类问题的算法作为对比方法, 采用 KEEL
% c8 I8 X4 ]* U8 k+ ?0 p- c! Y! z
数据库里的 20 个标准数据集对算法进行测试, 以 G-mean, F-measure 以及 AUC 作为算法的评价指
3 V3 V/ t$ Y; V# F
标, 利用统计检验手段对实验结果进行分析. 实验结果表明, 相对于其他算法, 本文提出的
! y4 w7 v- P( S( d2 f: Z/ x' Z
GSMOTEBoost 具有显著的优势.
K4 }& u& U. l% P& c4 U- Z8 T
4 U: f8 g! ~; q
( y. \8 z- F; V9 I
4 n8 ^- Y+ h+ u$ P" i1 x
G# d- v; Y R$ R
一种基于高斯过采样的集成学习算法.pdf
2020-11-20 15:27 上传
点击文件名下载附件
下载积分: 体力 -2 点
559.04 KB, 下载次数: 0, 下载积分: 体力 -2 点
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5