|
据说上个世纪九十年代,沃尔玛超市的管理人员发现了一个奇怪现象,同一个订单里经常会同时出现婴儿纸尿裤和啤酒,并且购买者大多为父亲。有人就进行了分析,发现从时间上,周末比工作日购买纸尿裤喝啤酒的频率更多;其次,爸爸们喜欢看体育节目,而且更爱边喝啤酒边看,且美国的体育节目多在周末扎堆。所以,当周末母亲需要给孩子换纸尿裤时,通常会让正在看球的奶爸去买。奶爸出去买纸尿裤,会顺便带些啤酒回来。无论这个案例真假,但他带来的启发却是巨大的,这让我们意识到可以通过研究用户消费数据,将两种看上去完全没关系的产品关联在一起,这就叫做商品关联分析法,也叫作“购物篮分析”。购物篮分析常用于零售行业,需要通过「支持度」、「置信度」、「提升度」三个指标判断商品之间的关联程度。三个「度」具体指什么:
# t; T( n2 D* M) @5 X01 「支持度」A商品和B商品同时被购买的概率,显然支持度越大,商品间关联性越强。计算公式:同时购买A和B订单数 / 总购买订单数举例:今天共有10笔订单,其中同时购买可乐和薯片的次数是7次,那么可乐+薯片组合的支持度就是7/10=70%。 % T' q3 z& R& q$ y' e- A
02 「置信度」因为购买了A所以购买了B的概率,注意与支持度区分。计算公式:同时购买A和B订单数 / 购买A的订单数举例:今天共有10笔订单,其中购买可乐的次数是4,同时购买可乐和薯片的次数是3,则其置信度是3/4=75%。 6 y" W" {7 d6 W, c2 a' n/ W9 o
03 「提升度」先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,大于1说明该组合方式有效,小于1则说明无效。计算公式:支持度 / ( (购买A次数/总购买订单数)*(购买B次数/总购买订单数) )举例:今天共有10笔订单,购买可乐的次数是8,购买薯片的次数是6,购买可乐+薯片的次数是6,那么提升度是0.6 /(0.8*0.6)>1,因此可乐+薯片的组合方式是有效的 ) a; m! R n ]* [: d6 l/ a$ }* v0 y4 M
本文推荐几篇论文,及博客来帮助大家解决商品关联性分析
( d, L: C( D5 ?, v \9 o9 O! v【数据挖掘实战—商品零售购物篮分析】https://blog.csdn.net/weixin_46649052/article/details/115471055#:~:text=%E8%B4%AD%E7%89%A9%E7%AF%AE%E5%88%86%E6%9E%90%E6%98%AF%E9%80%9A%E8%BF%87%E5%8F%91%E7%8E%B0%E9%A1%BE%E5%AE%A2%E5%9C%A8%E4%B8%80%E6%AC%A1%E8%B4%AD%E4%B9%B0%E8%A1%8C%E4%B8%BA%E4%B8%AD%E6%94%BE%E5%85%A5%E8%B4%AD%E7%89%A9%E7%AF%AE%E4%B8%AD%E4%B8%8D%E5%90%8C%E5%95%86%E5%93%81%E4%B9%8B%E9%97%B4%E7%9A%84%E5%85%B3%E8%81%94%EF%BC%8C%E7%A0%94%E7%A9%B6%E9%A1%BE%E5%AE%A2%E7%9A%84%E8%B4%AD%E4%B9%B0%E8%A1%8C%E4%B8%BA%EF%BC%8C%E4%BB%8E%E8%80%8C%E8%BE%85%E5%8A%A9%E9%9B%B6%E5%94%AE%E4%BC%81%E4%B8%9A%E5%88%B6%E5%AE%9A%E8%90%A5%E9%94%80%E7%AD%96%E7%95%A5%E7%9A%84%E4%B8%80%E7%A7%8D%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E6%96%B9%E6%B3%95%E3%80%82%20%E6%9C%AC%E6%96%87%E4%BD%BF%E7%94%A8,Apriori%E5%85%B3%E8%81%94%E8%A7%84%E5%88%99%E7%AE%97%E6%B3%95%20%E5%AE%9E%E7%8E%B0%E8%B4%AD%E7%89%A9%E7%AF%AE%E5%88%86%E6%9E%90%EF%BC%8C%E5%8F%91%E7%8E%B0%E8%B6%85%E5%B8%82%E4%B8%8D%E5%90%8C%E5%95%86%E5%93%81%E4%B9%8B%E9%97%B4%E7%9A%84%E5%85%B3%E8%81%94%E5%85%B3%E7%B3%BB%EF%BC%8C%E5%B9%B6%E6%A0%B9%E6%8D%AE%E5%95%86%E5%93%81%E4%B9%8B%E9%97%B4%E7%9A%84%E5%85%B3%E8%81%94%E8%A7%84%E5%88%99%E5%88%B6%E5%AE%9A%E9%94%80%E5%94%AE%E7%AD%96%E7%95%A5%E3%80%82
8 Y6 j5 t; f) K* `) C【原理 + 代码 | Apriori 算法与基于关联规则的购物篮推荐(附源数据)】, g* X. A1 O* W$ H% f/ k* a( b) K9 [
https://zhuanlan.zhihu.com/p/161340720 L* n* h% ~6 E3 r
《网状图的蚁群算法在购物篮中的分析研究》
5 ~/ q* l$ T# \. B8 _<Market basketball analysis algorithm for determining products association>9 N) Q' t. I( F$ F6 Y9 N
<Consumer Buying Pattern Analysis using Apriori Association Rule >& ^$ @( e/ y6 S# x3 _1 O' N1 A
《基于Apriori算法的零售商品购买关联分析》
% j; R: \/ d2 \" Z9 x. d- \《基于关联分析的多目标商品组合选择方法》' Y. [* V5 [: Y# Z
《Market Basket Analysis for a Supermarket based on Frequent Itemset Mining》! m9 B& I, e$ H, x- {8 ?
: p9 k, B0 R/ I% J2 l; k+ j
) o; g6 Q% t& g9 R8 [ |