- 在线时间
- 130 小时
- 最后登录
- 2025-7-19
- 注册时间
- 2020-11-26
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 16038 点
- 威望
- 0 点
- 阅读权限
- 255
- 积分
- 5021
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 419
- 主题
- 395
- 精华
- 0
- 分享
- 0
- 好友
- 0
TA的每日心情 | 衰 2021-3-28 15:16 |
|---|
签到天数: 25 天 [LV.4]偶尔看看III
 |
基于Spark的并行关联规则挖掘算法研究综述
+ f8 _, B1 y# E. D$ e0 c- Q: X( g, m) Q! f! j6 H; ~
关联规则挖掘是数据挖掘的一个重要分支,但随着数据的快速增长,传统关联规则挖掘算法不能很好地适应大数据的要求,需要在分布式、并行计算的平台上寻找突破。Spark 是专门为大数据处理而设计的一个适合迭代运算的并行计算模型,相比MapReduce 具有更高效、充分利用内存、更适合迭代计算和交互式处理的优点。对已有的基于Spark 的并行关联规则挖掘算法进行了分类和综述,并总结了各自的优缺点和适用范围,为下一步的研究提供参考。 G. M0 g V9 N# c( \9 S
% N, B! k, j5 A: v/ i+ z* s* r关键词:Spark;并行;关联规则挖掘;Apriori;FP-Growth
. {9 b( ]% }* ~; A5 P) H0 Q/ L |
zan
|