数学建模社区-数学中国

标题: 一种基于高斯过采样的集成学习算法 [打印本页]

作者: 杨利霞    时间: 2020-11-20 15:28
标题: 一种基于高斯过采样的集成学习算法
一种基于高斯过采样的集成学习算法

9 P0 l( E' \8 L4 _3 ]0 h: A# V, g. ^7 Y8 ~6 s

9 U& E% r+ E, k3 D" I
1 P4 h; m  f; G在数据挖掘研究领域, 分类任务广泛存在着数据分布不均衡问题, 例如制造状态检测, 医疗
& C! Q! f% [6 |1 F6 a2 `1 T8 G" p诊断, 金融服务, 等等. SMOTE 是处理不均衡数据分类问题的常用技术, 与 Boosting 算法相结合可
1 e( d. t: O+ F+ K  M进一步提升分类系统性能, 但是这种集成学习容易导致基分类器多样性缺失. 基于此, 本文提出了) A& N0 @# ^! P9 C0 u% r
一种基于高斯过程 SMOTE过采样的 Boosting集成学习算法, 即(Gaussian-based SMOTE in Boosting,
! j1 ^8 N. w4 jGSMOTEBoost). 该算法在 Boosting 集成框架下构建不均衡学习模型, 为了提高分类系统的鲁棒性,
) }/ m/ D* N: }. A采用基于高斯过程 SMOTE 过采样技术来增加基分类器训练样本的多样性, 从而提高基分类器之
/ h7 u" y$ F$ h间的差异. 为了验证算法的有效性, 以常用的处理不均衡分类问题的算法作为对比方法, 采用 KEEL
. x3 S  \$ `! e0 Z0 p/ ]# c数据库里的 20 个标准数据集对算法进行测试, 以 G-mean, F-measure 以及 AUC 作为算法的评价指2 M9 X* J7 N8 P1 P
标, 利用统计检验手段对实验结果进行分析. 实验结果表明, 相对于其他算法, 本文提出的" r& C% K- Z, Z- z
GSMOTEBoost 具有显著的优势.; n. [7 z( e+ Y) P
. e4 z2 y, Z! b% v& c2 H

- T$ V2 G7 k1 P8 R0 W6 `
6 S" l  Q6 E) L1 c/ [: I5 r4 q
* o  p2 C$ W& J9 c7 a

一种基于高斯过采样的集成学习算法.pdf

559.04 KB, 下载次数: 0, 下载积分: 体力 -2 点






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5