数学建模社区-数学中国

标题: 基于Spark的FP_Growth算法的并行与优化.pdf [打印本页]

作者: 1047521767    时间: 2022-7-12 17:58
标题: 基于Spark的FP_Growth算法的并行与优化.pdf
PFP_Growth算法是FP_Growth算法在Hadoop平台上基于MapReduce的并行化,该算法在分组过程中没有考虑负载均衡问题,导致各个节点完成任务时间不一致,甚至相差很大,从而降低了算法的执行效率。为了提高算法的执行效率,提出了一种基于Spark的RPFP算法,该算法对PFP_Growth算法在均衡分组和降低时间复杂度两方面进行优化,通过把负载大的项放在负载总和最小的组里面实现均衡分组,通过在链头表结构中加入一张哈希表达到快速访问元素地址的目的,从而降低时间复杂度。实验结果表明,RPFP通过优化PFP算法,有效提高了频繁项集的挖掘效率。1 `: B; g8 a( C( K/ Z* b) j

8 |2 Q7 [3 `* R0 W' l! N+ U

基于Spark的FP_Growth算法的并行与优化.pdf

783.98 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5