- 在线时间
- 113 小时
- 最后登录
- 2022-8-4
- 注册时间
- 2018-9-18
- 听众数
- 5
- 收听数
- 0
- 能力
- 0 分
- 体力
- 4361 点
- 威望
- 0 点
- 阅读权限
- 255
- 积分
- 1540
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 464
- 主题
- 473
- 精华
- 0
- 分享
- 0
- 好友
- 1
TA的每日心情 | 衰 2021-1-13 09:31 |
---|
签到天数: 8 天 [LV.3]偶尔看看II
|
针对当前聚类算法应用于大规模多类别数据集中时,计算量较大,且算法性能严重依赖于K值的不足,提出一种改进的加速K均值聚类算法。算法主要由两种策略组成:一是基于质心下界(PLB)的跳跃过程,新引入称为质心的固定点来计算对象和矩心间距离的下界,避免了常见聚类算法在收敛早期过程中的距离计算过程;二是基于不变矩心对(ICP)的跳跃过程,如果矩心更新步骤完成后被分配及未被分配矩心的位置保持不变,则维持对象分配策略不变且无需计算与未被分配矩心之间的距离。此外,还给出了将本文算法与Hamerly算法相结合的拓展算法以进一步提升聚类加速效果。对大规模高维图像数据集进行了仿真实验,结果表明,与Hamerly算法相比,本文算法在获得相同聚类效果的同时,极大地压缩了距离计算量。当K值较大时,本文算法的平均压缩率更高,平均耗时更少。 ) W7 D- k8 r5 Q6 V( \3 d- d b: c
1 V- t/ z) {4 W$ a6 H$ v7 Q7 h |
zan
|