qq_1537237806 发表于 2021-1-4 11:29

【论文】基于MapReduce的K_means并行算法及改进

针对传统kmeans聚类算法在处理海量数据时所面临的内存不足、运算速度慢等问题,提出了一种基于Map Reduce的Kmeans并行算法,同时为了改善kmeans算法在初始值确定方面的盲目性,采用canopy算法进行改进.实验结果表明,基于Map Reduce的Kmeans并行算法和改进后的算法均能产生良好的聚类效果,不仅提高了聚类质量,而且在处理大数据集方面,改进后的算法的还能够得到趋近于线性的加速比.

JIAXUAN TONG 发表于 2021-2-5 20:52

顶顶顶 感谢分享
页: [1]
查看完整版本: 【论文】基于MapReduce的K_means并行算法及改进