- 在线时间
- 130 小时
- 最后登录
- 2025-7-19
- 注册时间
- 2020-11-26
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 16028 点
- 威望
- 0 点
- 阅读权限
- 255
- 积分
- 5018
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 419
- 主题
- 395
- 精华
- 0
- 分享
- 0
- 好友
- 0
TA的每日心情 | 衰 2021-3-28 15:16 |
|---|
签到天数: 25 天 [LV.4]偶尔看看III
 |
基于Spark的并行关联规则挖掘算法研究综述; Q! |9 Z" R6 D( J& B0 [0 r
* w! x; ^$ k& A6 \, L. G
关联规则挖掘是数据挖掘的一个重要分支,但随着数据的快速增长,传统关联规则挖掘算法不能很好地适应大数据的要求,需要在分布式、并行计算的平台上寻找突破。Spark 是专门为大数据处理而设计的一个适合迭代运算的并行计算模型,相比MapReduce 具有更高效、充分利用内存、更适合迭代计算和交互式处理的优点。对已有的基于Spark 的并行关联规则挖掘算法进行了分类和综述,并总结了各自的优缺点和适用范围,为下一步的研究提供参考。5 a; Q% [& g8 |/ d5 J7 M3 \' T1 l
9 l2 R4 I1 f+ Q6 a( J" ~关键词:Spark;并行;关联规则挖掘;Apriori;FP-Growth
( A3 p3 d k* R |
zan
|