- 在线时间
- 130 小时
- 最后登录
- 2025-7-19
- 注册时间
- 2020-11-26
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 16024 点
- 威望
- 0 点
- 阅读权限
- 255
- 积分
- 5017
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 419
- 主题
- 395
- 精华
- 0
- 分享
- 0
- 好友
- 0
TA的每日心情 | 衰 2021-3-28 15:16 |
|---|
签到天数: 25 天 [LV.4]偶尔看看III
 |
基于Spark的并行关联规则挖掘算法研究综述
) H1 l, d" w$ q
0 I' K3 g# D- G$ d& d7 m/ u 关联规则挖掘是数据挖掘的一个重要分支,但随着数据的快速增长,传统关联规则挖掘算法不能很好地适应大数据的要求,需要在分布式、并行计算的平台上寻找突破。Spark 是专门为大数据处理而设计的一个适合迭代运算的并行计算模型,相比MapReduce 具有更高效、充分利用内存、更适合迭代计算和交互式处理的优点。对已有的基于Spark 的并行关联规则挖掘算法进行了分类和综述,并总结了各自的优缺点和适用范围,为下一步的研究提供参考。
6 @2 ~/ P% g& L8 U% F# Y9 ]) {1 y8 h4 p8 n" v4 m# Q
关键词:Spark;并行;关联规则挖掘;Apriori;FP-Growth
5 s# \4 I4 l; Q% Z. {" S3 k+ I0 x |
zan
|