|
据说上个世纪九十年代,沃尔玛超市的管理人员发现了一个奇怪现象,同一个订单里经常会同时出现婴儿纸尿裤和啤酒,并且购买者大多为父亲。有人就进行了分析,发现从时间上,周末比工作日购买纸尿裤喝啤酒的频率更多;其次,爸爸们喜欢看体育节目,而且更爱边喝啤酒边看,且美国的体育节目多在周末扎堆。所以,当周末母亲需要给孩子换纸尿裤时,通常会让正在看球的奶爸去买。奶爸出去买纸尿裤,会顺便带些啤酒回来。无论这个案例真假,但他带来的启发却是巨大的,这让我们意识到可以通过研究用户消费数据,将两种看上去完全没关系的产品关联在一起,这就叫做商品关联分析法,也叫作“购物篮分析”。购物篮分析常用于零售行业,需要通过「支持度」、「置信度」、「提升度」三个指标判断商品之间的关联程度。三个「度」具体指什么: 4 S: R" p+ N" ]) U) M0 v
01 「支持度」A商品和B商品同时被购买的概率,显然支持度越大,商品间关联性越强。计算公式:同时购买A和B订单数 / 总购买订单数举例:今天共有10笔订单,其中同时购买可乐和薯片的次数是7次,那么可乐+薯片组合的支持度就是7/10=70%。
( P+ ~. v5 X3 {; K" C' E! o02 「置信度」因为购买了A所以购买了B的概率,注意与支持度区分。计算公式:同时购买A和B订单数 / 购买A的订单数举例:今天共有10笔订单,其中购买可乐的次数是4,同时购买可乐和薯片的次数是3,则其置信度是3/4=75%。
6 o. S. ]" R& x/ E1 @" u$ A03 「提升度」先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,大于1说明该组合方式有效,小于1则说明无效。计算公式:支持度 / ( (购买A次数/总购买订单数)*(购买B次数/总购买订单数) )举例:今天共有10笔订单,购买可乐的次数是8,购买薯片的次数是6,购买可乐+薯片的次数是6,那么提升度是0.6 /(0.8*0.6)>1,因此可乐+薯片的组合方式是有效的 ~7 J; S# U' }& E6 J8 J
本文推荐几篇论文,及博客来帮助大家解决商品关联性分析2 x9 y! _0 Z- I& @6 N. F. G
【数据挖掘实战—商品零售购物篮分析】https://blog.csdn.net/weixin_46649052/article/details/115471055#:~:text=%E8%B4%AD%E7%89%A9%E7%AF%AE%E5%88%86%E6%9E%90%E6%98%AF%E9%80%9A%E8%BF%87%E5%8F%91%E7%8E%B0%E9%A1%BE%E5%AE%A2%E5%9C%A8%E4%B8%80%E6%AC%A1%E8%B4%AD%E4%B9%B0%E8%A1%8C%E4%B8%BA%E4%B8%AD%E6%94%BE%E5%85%A5%E8%B4%AD%E7%89%A9%E7%AF%AE%E4%B8%AD%E4%B8%8D%E5%90%8C%E5%95%86%E5%93%81%E4%B9%8B%E9%97%B4%E7%9A%84%E5%85%B3%E8%81%94%EF%BC%8C%E7%A0%94%E7%A9%B6%E9%A1%BE%E5%AE%A2%E7%9A%84%E8%B4%AD%E4%B9%B0%E8%A1%8C%E4%B8%BA%EF%BC%8C%E4%BB%8E%E8%80%8C%E8%BE%85%E5%8A%A9%E9%9B%B6%E5%94%AE%E4%BC%81%E4%B8%9A%E5%88%B6%E5%AE%9A%E8%90%A5%E9%94%80%E7%AD%96%E7%95%A5%E7%9A%84%E4%B8%80%E7%A7%8D%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E6%96%B9%E6%B3%95%E3%80%82%20%E6%9C%AC%E6%96%87%E4%BD%BF%E7%94%A8,Apriori%E5%85%B3%E8%81%94%E8%A7%84%E5%88%99%E7%AE%97%E6%B3%95%20%E5%AE%9E%E7%8E%B0%E8%B4%AD%E7%89%A9%E7%AF%AE%E5%88%86%E6%9E%90%EF%BC%8C%E5%8F%91%E7%8E%B0%E8%B6%85%E5%B8%82%E4%B8%8D%E5%90%8C%E5%95%86%E5%93%81%E4%B9%8B%E9%97%B4%E7%9A%84%E5%85%B3%E8%81%94%E5%85%B3%E7%B3%BB%EF%BC%8C%E5%B9%B6%E6%A0%B9%E6%8D%AE%E5%95%86%E5%93%81%E4%B9%8B%E9%97%B4%E7%9A%84%E5%85%B3%E8%81%94%E8%A7%84%E5%88%99%E5%88%B6%E5%AE%9A%E9%94%80%E5%94%AE%E7%AD%96%E7%95%A5%E3%80%82
0 o- R0 Y1 e$ @【原理 + 代码 | Apriori 算法与基于关联规则的购物篮推荐(附源数据)】
V- D6 ~: X2 Fhttps://zhuanlan.zhihu.com/p/161340720
* ]; ~+ B1 r9 A6 ~9 l' k《网状图的蚁群算法在购物篮中的分析研究》
, v6 i$ s9 c& N0 a% u2 Z<Market basketball analysis algorithm for determining products association>
$ x; \/ V) J, v( a4 _9 s/ d<Consumer Buying Pattern Analysis using Apriori Association Rule >) X4 W4 h, \" I5 s W2 _& U5 n% e
《基于Apriori算法的零售商品购买关联分析》$ N X2 ?' k9 I6 ~" V0 o7 }3 J
《基于关联分析的多目标商品组合选择方法》
) O; N! a( o: l《Market Basket Analysis for a Supermarket based on Frequent Itemset Mining》
0 N2 a/ S% B- q& Q; c, p
8 w; d4 C; W1 h% R, @
' d# l T2 e; V' k1 e5 R9 L |