标题: 数据挖掘——如何利用Python实现产品关联性分析apriori算法篇 [打印本页] 作者: 杨利霞 时间: 2022-9-12 18:44 标题: 数据挖掘——如何利用Python实现产品关联性分析apriori算法篇 数据挖掘——如何利用Python实现产品关联性分析apriori算法篇) T( n. X& w- u3 P$ O. u V
& E( U, A% r: q% P9 M* E在实际业务场景中,我们常常会探讨到产品的关联性分析,本篇文章将会介绍一下如何在Python环境下如何利用apriori算法进行数据分析。7 z+ l6 P) d4 i$ z1 [* d3 ?0 s/ D
& R3 K( l- k4 a) ]- z/ N6 }1.准备工作: X; X9 R6 y5 c, X. `9 I
如果需要在Python环境下实现apriori算法,就离不开一个关键的机器学习库mlxtend,运行以下代码进行安装: ( F! Z8 @& y6 Y5 W, D; K/ { % o! b. b" i9 a* a, E. L* Cpip install mlxtend ; } { e; ~" V' J. w& O1 7 ?( _2 b& D- W6 c) c/ |5 E: i! p为方便进行过程的演示,在此构建测试数据: 4 n. A# w' k. w9 E- \# C 9 `8 ~1 w& O0 w# w5 r2 a$ Z- Aimport pandas as pd" C1 c1 @; b3 @) X
df=pd.DataFrame({'product_list':['A-C', 'D', 'A-B-C-D','A-C','A-C-D','A-C-B']})% f5 x5 I; ~& E# a5 |! ]! L
1 " @: M! w* X) u2 . O& Z# j1 M8 R! {7 c测试数据截图如下: + O1 M; M; f) F7 j7 Q" h$ ~( U 6 \) r$ m; ], l2 Q& g * N2 a+ I7 `. y6 f对上述的数据进行以下处理: / \' v% R/ ^" D, i# j9 x4 d: b. W% P) n3 A2 \9 u" t3 R
df_chg=df['product_list'].str.split("-")$ ~ B9 x8 e5 ?7 u% U) h6 |- y- J
1 ! L3 P5 O% ^" C/ [+ n数据处理后,结果截图如下:9 |: V5 [: `: l' L) M