基于密度峰值与密度聚类的集成算法
基于密度峰值与密度聚类的集成算法针对快速搜索和发现密度峰值聚类( CFSFDP) 算法需人工在决策图上选择聚类中心的问题,提出一种基于密度峰值和密度聚类的集成算法。首先,借鉴CFSFDP 思想,将局部密度最大的数据作为第一个中心; 接着,从该中心点出发采用一种利用Warshall 算法求解密度相连改进的基于密度的噪声应用空间聚类( DBSCAN) 算法进行聚类,得到第一个簇; 最后,在尚未被划分的数据中找出最大局部密度的数据,将它作为下一个簇的中心后再次采用上述算法进行聚类,直到所有数据被聚类或有部分数据被视为噪声。所提算法既解决了CFSFDP 选择中心需人工干预的问题,又优化了DBSCAN 算法,即每次迭代都是从当前最好的点( 局部密度最大的点) 出发寻找簇。通过可视化数据集和非可视化数据集与经典算法( CFSFDP、DBSCAN、模糊C 均值( FCM) 算法和K 均值( K-means) 算法) 的对比实验结果表明,所提算法聚类效果更好,准确率更高,优于对比算法。
关键词: 密度峰值; 密度聚类; Warshall 算法; 决策图; 聚类中心
页:
[1]