|
据说上个世纪九十年代,沃尔玛超市的管理人员发现了一个奇怪现象,同一个订单里经常会同时出现婴儿纸尿裤和啤酒,并且购买者大多为父亲。有人就进行了分析,发现从时间上,周末比工作日购买纸尿裤喝啤酒的频率更多;其次,爸爸们喜欢看体育节目,而且更爱边喝啤酒边看,且美国的体育节目多在周末扎堆。所以,当周末母亲需要给孩子换纸尿裤时,通常会让正在看球的奶爸去买。奶爸出去买纸尿裤,会顺便带些啤酒回来。无论这个案例真假,但他带来的启发却是巨大的,这让我们意识到可以通过研究用户消费数据,将两种看上去完全没关系的产品关联在一起,这就叫做商品关联分析法,也叫作“购物篮分析”。购物篮分析常用于零售行业,需要通过「支持度」、「置信度」、「提升度」三个指标判断商品之间的关联程度。三个「度」具体指什么: " A; \" ~4 T9 p( X1 \+ F: Q
01 「支持度」A商品和B商品同时被购买的概率,显然支持度越大,商品间关联性越强。计算公式:同时购买A和B订单数 / 总购买订单数举例:今天共有10笔订单,其中同时购买可乐和薯片的次数是7次,那么可乐+薯片组合的支持度就是7/10=70%。 ' a7 c+ |! e% A, B0 e
02 「置信度」因为购买了A所以购买了B的概率,注意与支持度区分。计算公式:同时购买A和B订单数 / 购买A的订单数举例:今天共有10笔订单,其中购买可乐的次数是4,同时购买可乐和薯片的次数是3,则其置信度是3/4=75%。 0 W& U6 j3 b4 X4 P- Y( k. q
03 「提升度」先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,大于1说明该组合方式有效,小于1则说明无效。计算公式:支持度 / ( (购买A次数/总购买订单数)*(购买B次数/总购买订单数) )举例:今天共有10笔订单,购买可乐的次数是8,购买薯片的次数是6,购买可乐+薯片的次数是6,那么提升度是0.6 /(0.8*0.6)>1,因此可乐+薯片的组合方式是有效的 . K6 f: n5 R! N: x2 b/ d% l
本文推荐几篇论文,及博客来帮助大家解决商品关联性分析3 i( U$ G$ a2 _9 m+ w6 ]' `' p
【数据挖掘实战—商品零售购物篮分析】https://blog.csdn.net/weixin_46649052/article/details/115471055#:~:text=%E8%B4%AD%E7%89%A9%E7%AF%AE%E5%88%86%E6%9E%90%E6%98%AF%E9%80%9A%E8%BF%87%E5%8F%91%E7%8E%B0%E9%A1%BE%E5%AE%A2%E5%9C%A8%E4%B8%80%E6%AC%A1%E8%B4%AD%E4%B9%B0%E8%A1%8C%E4%B8%BA%E4%B8%AD%E6%94%BE%E5%85%A5%E8%B4%AD%E7%89%A9%E7%AF%AE%E4%B8%AD%E4%B8%8D%E5%90%8C%E5%95%86%E5%93%81%E4%B9%8B%E9%97%B4%E7%9A%84%E5%85%B3%E8%81%94%EF%BC%8C%E7%A0%94%E7%A9%B6%E9%A1%BE%E5%AE%A2%E7%9A%84%E8%B4%AD%E4%B9%B0%E8%A1%8C%E4%B8%BA%EF%BC%8C%E4%BB%8E%E8%80%8C%E8%BE%85%E5%8A%A9%E9%9B%B6%E5%94%AE%E4%BC%81%E4%B8%9A%E5%88%B6%E5%AE%9A%E8%90%A5%E9%94%80%E7%AD%96%E7%95%A5%E7%9A%84%E4%B8%80%E7%A7%8D%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E6%96%B9%E6%B3%95%E3%80%82%20%E6%9C%AC%E6%96%87%E4%BD%BF%E7%94%A8,Apriori%E5%85%B3%E8%81%94%E8%A7%84%E5%88%99%E7%AE%97%E6%B3%95%20%E5%AE%9E%E7%8E%B0%E8%B4%AD%E7%89%A9%E7%AF%AE%E5%88%86%E6%9E%90%EF%BC%8C%E5%8F%91%E7%8E%B0%E8%B6%85%E5%B8%82%E4%B8%8D%E5%90%8C%E5%95%86%E5%93%81%E4%B9%8B%E9%97%B4%E7%9A%84%E5%85%B3%E8%81%94%E5%85%B3%E7%B3%BB%EF%BC%8C%E5%B9%B6%E6%A0%B9%E6%8D%AE%E5%95%86%E5%93%81%E4%B9%8B%E9%97%B4%E7%9A%84%E5%85%B3%E8%81%94%E8%A7%84%E5%88%99%E5%88%B6%E5%AE%9A%E9%94%80%E5%94%AE%E7%AD%96%E7%95%A5%E3%80%823 n& v! c# t* ~2 k- z: t
【原理 + 代码 | Apriori 算法与基于关联规则的购物篮推荐(附源数据)】
9 s" ~% N: r0 N9 C% G- jhttps://zhuanlan.zhihu.com/p/1613407202 K( k r3 M7 ~, E, N R& W$ |
《网状图的蚁群算法在购物篮中的分析研究》! X, i6 [. W; y( \' U9 W# ]
<Market basketball analysis algorithm for determining products association>
+ }8 u/ u1 E9 Q. a0 n% r( q<Consumer Buying Pattern Analysis using Apriori Association Rule >: w) F4 v* K/ E% F5 K
《基于Apriori算法的零售商品购买关联分析》
N- s5 L4 x8 m$ C3 u《基于关联分析的多目标商品组合选择方法》
6 H( z2 i1 l: T5 I* P* O《Market Basket Analysis for a Supermarket based on Frequent Itemset Mining》
" ]+ b# ]4 o7 M1 Z; Y
# p5 I' S1 N) f5 \* Q6 h
1 d+ P" V2 J: N! m/ z! N |