数学建模社区-数学中国
标题:
基于Spark的主动重叠K-means聚类算法
[打印本页]
作者:
雩风三日
时间:
2021-1-28 17:19
标题:
基于Spark的主动重叠K-means聚类算法
基于Spark的主动重叠K-means聚类算法
% K) u L3 e& o8 P0 r
9 e, e4 N" @: x7 ]9 h0 P* Q
别大规模数据的潜在模式.但其存在两个问题:多次迭代Master和Worker节点间数据交换,导致算法运行效率低;对初始聚类中心敏感,导致聚类结果不稳定且收敛速度慢.为提高算法运行效率和结果稳定性,提出了一种主动重叠K-means聚类算法.其在各个分区上执行重叠K-mean、算法获得局部聚类中心,将结果汇总回收到Mastc:节点,在Mastc:节点运行重叠K-mean、算法聚合所有聚类中心,作为最终聚类中心;同时采用并行化主动选择策略获得更优的初始簇中心,提高算法准确性、收敛速度.实验结果表明,改进后的主动重叠聚类算法提高了算法准确性,降低了算法运行时间.
4 F! R' ^0 ^4 I4 m
0 s! [0 L& l# [) T
关键词:
Spark框架;主动学习;重叠聚类;并行计算
9 G. K" P \* e; O
. ~& h5 }5 s: e# H
基于Spark的主动重叠K_means聚类算法_柴变芳.pdf
2021-1-28 17:18 上传
点击文件名下载附件
下载积分: 体力 -2 点
364.35 KB, 下载次数: 3, 下载积分: 体力 -2 点
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5