[其他资源] 基于Spark的并行关联规则挖掘算法研究综述

[复制链接]

字体大小: 正常放大

雩风三日

395 主题	3 听众	5027 积分

TA的每日心情

	衰 2021-3-28 15:16

签到天数: 25 天

[LV.4]偶尔看看III

电梯直达

1^#

发表于 2020-12-21 10:18 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

基于Spark的并行关联规则挖掘算法研究综述

关联规则挖掘是数据挖掘的一个重要分支，但随着数据的快速增长，传统关联规则挖掘算法不能很好地适应大数据的要求，需要在分布式、并行计算的平台上寻找突破。Spark 是专门为大数据处理而设计的一个适合迭代运算的并行计算模型，相比MapReduce 具有更高效、充分利用内存、更适合迭代计算和交互式处理的优点。对已有的基于Spark 的并行关联规则挖掘算法进行了分类和综述，并总结了各自的优缺点和适用范围，为下一步的研究提供参考。

关键词：Spark；并行；关联规则挖掘；Apriori；FP-Growth