|
据说上个世纪九十年代,沃尔玛超市的管理人员发现了一个奇怪现象,同一个订单里经常会同时出现婴儿纸尿裤和啤酒,并且购买者大多为父亲。有人就进行了分析,发现从时间上,周末比工作日购买纸尿裤喝啤酒的频率更多;其次,爸爸们喜欢看体育节目,而且更爱边喝啤酒边看,且美国的体育节目多在周末扎堆。所以,当周末母亲需要给孩子换纸尿裤时,通常会让正在看球的奶爸去买。奶爸出去买纸尿裤,会顺便带些啤酒回来。无论这个案例真假,但他带来的启发却是巨大的,这让我们意识到可以通过研究用户消费数据,将两种看上去完全没关系的产品关联在一起,这就叫做商品关联分析法,也叫作“购物篮分析”。购物篮分析常用于零售行业,需要通过「支持度」、「置信度」、「提升度」三个指标判断商品之间的关联程度。三个「度」具体指什么: ! s: a# P7 ~" Z0 ?4 j5 s
01 「支持度」A商品和B商品同时被购买的概率,显然支持度越大,商品间关联性越强。计算公式:同时购买A和B订单数 / 总购买订单数举例:今天共有10笔订单,其中同时购买可乐和薯片的次数是7次,那么可乐+薯片组合的支持度就是7/10=70%。 / c* I; U; G& [$ \! f
02 「置信度」因为购买了A所以购买了B的概率,注意与支持度区分。计算公式:同时购买A和B订单数 / 购买A的订单数举例:今天共有10笔订单,其中购买可乐的次数是4,同时购买可乐和薯片的次数是3,则其置信度是3/4=75%。
5 Y9 n1 S; p5 |4 R' s2 ^03 「提升度」先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,大于1说明该组合方式有效,小于1则说明无效。计算公式:支持度 / ( (购买A次数/总购买订单数)*(购买B次数/总购买订单数) )举例:今天共有10笔订单,购买可乐的次数是8,购买薯片的次数是6,购买可乐+薯片的次数是6,那么提升度是0.6 /(0.8*0.6)>1,因此可乐+薯片的组合方式是有效的 4 I' N: m! N1 Z/ e, E* g( _3 U0 ^
本文推荐几篇论文,及博客来帮助大家解决商品关联性分析8 E8 o4 Z4 Z+ y% z% X- Y# z
【数据挖掘实战—商品零售购物篮分析】https://blog.csdn.net/weixin_46649052/article/details/115471055#:~:text=%E8%B4%AD%E7%89%A9%E7%AF%AE%E5%88%86%E6%9E%90%E6%98%AF%E9%80%9A%E8%BF%87%E5%8F%91%E7%8E%B0%E9%A1%BE%E5%AE%A2%E5%9C%A8%E4%B8%80%E6%AC%A1%E8%B4%AD%E4%B9%B0%E8%A1%8C%E4%B8%BA%E4%B8%AD%E6%94%BE%E5%85%A5%E8%B4%AD%E7%89%A9%E7%AF%AE%E4%B8%AD%E4%B8%8D%E5%90%8C%E5%95%86%E5%93%81%E4%B9%8B%E9%97%B4%E7%9A%84%E5%85%B3%E8%81%94%EF%BC%8C%E7%A0%94%E7%A9%B6%E9%A1%BE%E5%AE%A2%E7%9A%84%E8%B4%AD%E4%B9%B0%E8%A1%8C%E4%B8%BA%EF%BC%8C%E4%BB%8E%E8%80%8C%E8%BE%85%E5%8A%A9%E9%9B%B6%E5%94%AE%E4%BC%81%E4%B8%9A%E5%88%B6%E5%AE%9A%E8%90%A5%E9%94%80%E7%AD%96%E7%95%A5%E7%9A%84%E4%B8%80%E7%A7%8D%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E6%96%B9%E6%B3%95%E3%80%82%20%E6%9C%AC%E6%96%87%E4%BD%BF%E7%94%A8,Apriori%E5%85%B3%E8%81%94%E8%A7%84%E5%88%99%E7%AE%97%E6%B3%95%20%E5%AE%9E%E7%8E%B0%E8%B4%AD%E7%89%A9%E7%AF%AE%E5%88%86%E6%9E%90%EF%BC%8C%E5%8F%91%E7%8E%B0%E8%B6%85%E5%B8%82%E4%B8%8D%E5%90%8C%E5%95%86%E5%93%81%E4%B9%8B%E9%97%B4%E7%9A%84%E5%85%B3%E8%81%94%E5%85%B3%E7%B3%BB%EF%BC%8C%E5%B9%B6%E6%A0%B9%E6%8D%AE%E5%95%86%E5%93%81%E4%B9%8B%E9%97%B4%E7%9A%84%E5%85%B3%E8%81%94%E8%A7%84%E5%88%99%E5%88%B6%E5%AE%9A%E9%94%80%E5%94%AE%E7%AD%96%E7%95%A5%E3%80%820 ^4 R1 p1 B% w( S
【原理 + 代码 | Apriori 算法与基于关联规则的购物篮推荐(附源数据)】+ g/ X- k7 A6 f- \2 f6 j) A
https://zhuanlan.zhihu.com/p/161340720# X# S9 f& O- S3 a! n' Y+ P
《网状图的蚁群算法在购物篮中的分析研究》
; T; ~9 z5 L% N<Market basketball analysis algorithm for determining products association>
: V8 Q' T) ^& [5 a<Consumer Buying Pattern Analysis using Apriori Association Rule >
' t% ~, D0 [# X( B0 l/ q3 \《基于Apriori算法的零售商品购买关联分析》
2 ]% _. e; G! q8 E, s( c5 j《基于关联分析的多目标商品组合选择方法》; L( o$ W+ `7 V- h% U
《Market Basket Analysis for a Supermarket based on Frequent Itemset Mining》$ p4 Z( i9 l3 P: S; l D
0 _+ A2 y2 T, d" v- `7 C/ N" s' S/ y7 s, t8 l" ^$ L- D$ G
|