- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564620 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174609
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
一种基于高斯过采样的集成学习算法
3 Q: _! P5 H% T! {( x
6 T' `) @! F4 U" D. V, K! f; K" c' L) R$ s0 g3 y8 \+ n. c
1 W6 k, G/ T) Y( \. P
在数据挖掘研究领域, 分类任务广泛存在着数据分布不均衡问题, 例如制造状态检测, 医疗- {* f9 X5 o/ w# F; Z4 W1 K1 d5 c, m
诊断, 金融服务, 等等. SMOTE 是处理不均衡数据分类问题的常用技术, 与 Boosting 算法相结合可* W6 U! n, f v% l! h7 j
进一步提升分类系统性能, 但是这种集成学习容易导致基分类器多样性缺失. 基于此, 本文提出了
1 o0 i" o( T: _3 H8 @: z, |一种基于高斯过程 SMOTE过采样的 Boosting集成学习算法, 即(Gaussian-based SMOTE in Boosting,
. F# u0 T& p: r" E# A) x2 @GSMOTEBoost). 该算法在 Boosting 集成框架下构建不均衡学习模型, 为了提高分类系统的鲁棒性,
o5 c& y8 V% ~" N) ~( k. ]采用基于高斯过程 SMOTE 过采样技术来增加基分类器训练样本的多样性, 从而提高基分类器之 f! Z7 m% l$ s4 R+ ]" ^& L! q* K* p
间的差异. 为了验证算法的有效性, 以常用的处理不均衡分类问题的算法作为对比方法, 采用 KEEL
9 `# o1 g6 e6 u1 |% P. `数据库里的 20 个标准数据集对算法进行测试, 以 G-mean, F-measure 以及 AUC 作为算法的评价指. |, C* y) f& F; c, ~
标, 利用统计检验手段对实验结果进行分析. 实验结果表明, 相对于其他算法, 本文提出的" g3 z8 E0 v8 `4 O7 ?; u+ n
GSMOTEBoost 具有显著的优势.
8 Y* k- t5 q4 E7 A3 G1 y( P6 i% a' k% @ w6 p/ F
% I: R5 j( {& `& U
+ B) l4 u/ i) F8 P: e& q( m! l6 C- K* [4 I9 ?! w5 l- E4 u+ C, w& y) e
|
zan
|