【论文】基于MapReduce的K_means并行算法及改进
针对传统kmeans聚类算法在处理海量数据时所面临的内存不足、运算速度慢等问题,提出了一种基于Map Reduce的Kmeans并行算法,同时为了改善kmeans算法在初始值确定方面的盲目性,采用canopy算法进行改进.实验结果表明,基于Map Reduce的Kmeans并行算法和改进后的算法均能产生良好的聚类效果,不仅提高了聚类质量,而且在处理大数据集方面,改进后的算法的还能够得到趋近于线性的加速比.顶顶顶 感谢分享
页:
[1]