QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2453|回复: 0
打印 上一主题 下一主题

KXEN关联规则模块KAR进行捆绑销售

[复制链接]
字体大小: 正常 放大
seawolff        

5

主题

3

听众

26

积分

升级  22.11%

该用户从未签到

新人进步奖

跳转到指定楼层
1#
发表于 2007-6-12 20:00 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
<h4 class="TextColor1" id="subjcns!A20FD7ACCE991E94!392" style="MARGIN-BOTTOM: 0px;"></h4><div class="bvMsg" id="msgcns!A20FD7ACCE991E94!392"><div><p style="LINE-HEIGHT: 150%;"><span style="FONT-FAMILY: 宋体;"><font color="#000000" size="3" style="FONT-SIZE: 11pt;">&nbsp;&nbsp;&nbsp; </font><font color="#000000" size="2">我在淘宝网开了一个网店,卖各种运动装,最近生意越来越火,我根本不能理清我的顾客和商品,以及烦多的交易。在经营的同时,我想通过一些捆绑销售来增大销售额;另外的问题是,展示商品的页面越来越多,除了按照商品的类别来展示商品,我也想有另外的一种商品陈列方式:即在一页上展示一个商品的系统,这个系列是按照个人的喜好来组合的,譬如,把一种很新潮的袜子跟一双运动鞋放在一起。这样,顾客在购买一双鞋子的同时会顺便带上一双袜子。上面的这些,归结为一点,都是一个问题:我要找到最优的产品组合。我有的信息是顾客的交易记录。</font></span></p></div><div><p style="LINE-HEIGHT: 150%;"><font color="#000000" size="2"><span style="FONT-FAMILY: 宋体;">&nbsp;&nbsp;&nbsp; KXEN的</span><span lang="EN-US"><font face="Times New Roman">3.2</font></span><span style="FONT-FAMILY: 宋体;">版本没有关联规则和时间序列,</span><span lang="EN-US"><font face="Times New Roman">3.3</font></span><span style="FONT-FAMILY: 宋体;">版本提供了这两个模块。</span></font></p></div><div><p style="LINE-HEIGHT: 150%;"><font color="#000000" size="2"><span style="FONT-FAMILY: 宋体;">&nbsp;&nbsp;&nbsp; 目前,我有所有顾客的历史购买记录,格式如图</span><span lang="EN-US"><font face="Times New Roman">1</font></span><span style="FONT-FAMILY: 宋体;">,</span><span lang="EN-US"><font face="Times New Roman">UserID</font></span><span style="FONT-FAMILY: 宋体;">表示顾客的</span><span lang="EN-US"><font face="Times New Roman">ID</font></span><span style="FONT-FAMILY: 宋体;">号,</span><span lang="EN-US"><font face="Times New Roman">ItemPurchased</font></span><span style="FONT-FAMILY: 宋体;">是购买的商品,后面是购买时间,数量(无用)那么,我要做的是:通过这些购买记录,来找寻商品之间的关联性。</span></font></p></div><div><p style="LINE-HEIGHT: 150%;"><font color="#000000" size="2" style="FONT-WEIGHT: 700;"><span lang="EN-US"><font face="Times New Roman">KXEN</font></span><span style="FONT-FAMILY: 宋体;">关联规则基本概念</span></font></p></div><div><p style="LINE-HEIGHT: 150%;"><font color="#000000" size="2"><span lang="EN-US"><font face="Times New Roman">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;</font></span><span style="FONT-FAMILY: 宋体;">一个</span><span lang="EN-US"><font face="Times New Roman">session</font></span><span style="FONT-FAMILY: 宋体;">的概念是一个顾客,而一个</span><span lang="EN-US"><font face="Times New Roman">item</font></span><span style="FONT-FAMILY: 宋体;">就相当于一次交易,每个</span><span lang="EN-US"><font face="Times New Roman">item</font></span><span style="FONT-FAMILY: 宋体;">涉及到一种商品,用</span><span lang="EN-US"><font face="Times New Roman">A</font></span><span style="FONT-FAMILY: 宋体;">,</span><span lang="EN-US"><font face="Times New Roman">B</font></span><span style="FONT-FAMILY: 宋体;">,</span><span lang="EN-US"><font face="Times New Roman">C</font></span><span style="FONT-FAMILY: 宋体;">表示。则发现</span><span lang="EN-US"><font face="Times New Roman">item</font></span><span style="FONT-FAMILY: 宋体;">之间的关联就是求一些条件概率</span><span lang="EN-US"><font face="Times New Roman"></font></span><span style="FONT-FAMILY: 宋体;">(</span><span lang="EN-US"><font face="Times New Roman">B|A</font></span><span style="FONT-FAMILY: 宋体;">),</span><span lang="EN-US"><font face="Times New Roman"></font></span><span style="FONT-FAMILY: 宋体;">(</span><span lang="EN-US"><font face="Times New Roman">C|</font></span><span style="FONT-FAMILY: 宋体;">(</span><span lang="EN-US"><font face="Times New Roman">A</font></span><span style="FONT-FAMILY: 宋体;">,</span><span lang="EN-US"><font face="Times New Roman">B</font></span><span style="FONT-FAMILY: 宋体;">))(这种是延深关联规则,长度为</span><span lang="EN-US"><font face="Times New Roman">3</font></span><span style="FONT-FAMILY: 宋体;">,在寻找关联规则的参数设置中,可以限制关联规则的长度)等。</span></font></p></div><div><p style="LINE-HEIGHT: 150%;"><font color="#000000" size="2"><span style="FONT-FAMILY: 宋体;">&nbsp;&nbsp;&nbsp; 几个易理解的基本概念是支持度</span><span lang="EN-US"><font face="Times New Roman"></font></span><span style="FONT-FAMILY: 宋体;">(</span><span lang="EN-US"><font face="Times New Roman">A</font></span><span style="FONT-FAMILY: 宋体;">,</span><span lang="EN-US"><font face="Times New Roman">B</font></span><span style="FONT-FAMILY: 宋体;">),置信度</span><span lang="EN-US"><font face="Times New Roman"></font></span><span style="FONT-FAMILY: 宋体;">(</span><span lang="EN-US"><font face="Times New Roman">B|A</font></span><span style="FONT-FAMILY: 宋体;">),提升:</span><span lang="EN-US"><font face="Times New Roman"></font></span><span style="FONT-FAMILY: 宋体;">(</span><span lang="EN-US"><font face="Times New Roman">B|A</font></span><span style="FONT-FAMILY: 宋体;">)</span><span lang="EN-US"><font face="Times New Roman">/P</font></span><span style="FONT-FAMILY: 宋体;">(</span><span lang="EN-US"><font face="Times New Roman">B</font></span><span style="FONT-FAMILY: 宋体;">),</span><span lang="EN-US"><font face="Times New Roman">KI</font></span><span style="FONT-FAMILY: 宋体;">(</span><span lang="EN-US"><font face="Times New Roman">KXEN</font></span><span style="FONT-FAMILY: 宋体;">特有的),支持度越大,说明</span><span lang="EN-US"><font face="Times New Roman">AB</font></span><span style="FONT-FAMILY: 宋体;">同时发生的概率越高;置信度越大,说明</span><span lang="EN-US"><font face="Times New Roman">A</font></span><span style="FONT-FAMILY: 宋体;">的购买导致</span><span lang="EN-US"><font face="Times New Roman">B</font></span><span style="FONT-FAMILY: 宋体;">的购买的可能性越大;而提升相当于置信度本身除掉</span><span lang="EN-US"><font face="Times New Roman">B</font></span><span style="FONT-FAMILY: 宋体;">本身发生所带来的影响;应该说,提升是最有说服力的。</span></font></p></div><div><p style="LINE-HEIGHT: 150%;"><b><font color="#000000" size="2"><span lang="EN-US"><font face="Times New Roman">KXEN </font></span><span style="FONT-FAMILY: 宋体;">关联规则模块</span><span lang="EN-US"><font face="Times New Roman">----KAR</font></span><span style="FONT-FAMILY: 宋体;">的使用</span></font></b></p></div><div><p style="LINE-HEIGHT: 150%;"><font color="#000000" size="2"><span style="FONT-FAMILY: 宋体;">&nbsp;&nbsp;&nbsp; 原则上,直接输入如图</span><span lang="EN-US"><font face="Times New Roman">1</font></span><span style="FONT-FAMILY: 宋体;">的表格中的交易数据,就可以进行关联分析,也许</span><span lang="EN-US"><font face="Times New Roman">KXEN</font></span><span style="FONT-FAMILY: 宋体;">为了显示它对交易数据的特别的对待方式,在</span><span lang="EN-US"><font face="Times New Roman">KXEN</font></span><span style="FONT-FAMILY: 宋体;">中进行关联分析,要输入两个表,一是上述的事件记录表(相当于副表),另外一个是建模表(主表),在建模表中只要有</span><span lang="EN-US"><font face="Times New Roman">Session</font></span><span style="FONT-FAMILY: 宋体;">即可,表明必须按照主表中提供的</span><span lang="EN-US"><font face="Times New Roman">Session</font></span><span style="FONT-FAMILY: 宋体;">在副表中寻找相应</span><span lang="EN-US"><font face="Times New Roman">session</font></span><span style="FONT-FAMILY: 宋体;">所对应的</span><span lang="EN-US"><font face="Times New Roman">item</font></span><span style="FONT-FAMILY: 宋体;">。</span></font></p></div><div><p style="LINE-HEIGHT: 150%;"><span style="FONT-FAMILY: 宋体;"><font color="#000000" size="2">&nbsp;&nbsp;&nbsp; 下面解释一下各个步骤及一些参数的意义(略去次要步骤):</font></span><font size="2">&nbsp;</font></p></div><div><p style="LINE-HEIGHT: 150%;"><font color="#000000" size="2"><span style="FONT-FAMILY: 宋体;">&nbsp;&nbsp;&nbsp; 依照向导的模式操作,首先是图</span><span lang="EN-US"><font face="Times New Roman">2</font></span><span style="FONT-FAMILY: 宋体;">是输入主表,之后再输入副表,就会出现如图</span><span lang="EN-US"><font face="Times New Roman">3</font></span><span style="FONT-FAMILY: 宋体;">的界面,参照数据集是指主表,交易数据集是指副表,两个表的</span><span lang="EN-US"><font face="Times New Roman">join</font></span><span style="FONT-FAMILY: 宋体;">列都选取</span><span lang="EN-US"><font face="Times New Roman">Session</font></span><span style="FONT-FAMILY: 宋体;">号,在副表中选取</span><span lang="EN-US"><font face="Times New Roman">Item Column</font></span><span style="FONT-FAMILY: 宋体;">。下面有一个是否激活序列模式,当选择激活时,</span><span lang="EN-US"><font face="Times New Roman"></font></span><span style="FONT-FAMILY: 宋体;">(</span><span lang="EN-US"><font face="Times New Roman">B|A</font></span><span style="FONT-FAMILY: 宋体;">)中</span><span lang="EN-US"><font face="Times New Roman">A</font></span><span style="FONT-FAMILY: 宋体;">一定要发生在</span><span lang="EN-US"><font face="Times New Roman">B</font></span><span style="FONT-FAMILY: 宋体;">之前,在激活之后,还要选定一个表示</span><span lang="EN-US"><font face="Times New Roman">item</font></span><span style="FONT-FAMILY: 宋体;">发生的时间列。在高级设置里面,有</span><span lang="EN-US"><font face="Times New Roman">Chunk Size</font></span><span style="FONT-FAMILY: 宋体;">的设置,这个数目代表发现关联度时装载的</span><span lang="EN-US"><font face="Times New Roman">Session</font></span><span style="FONT-FAMILY: 宋体;">数目,是为了调节速度与性能的一个取值。一次装入的</span><span lang="EN-US"><font face="Times New Roman">session</font></span><span style="FONT-FAMILY: 宋体;">越多,则装入的</span><span lang="EN-US"><font face="Times New Roman">item</font></span><span style="FONT-FAMILY: 宋体;">项也越多,那么,计算量也越大。另外一个有用的设置是,你可以限制找寻到的规则中包的</span><span lang="EN-US"><font face="Times New Roman">item</font></span><span style="FONT-FAMILY: 宋体;">和排除的</span><span lang="EN-US"><font face="Times New Roman">item</font></span><span style="FONT-FAMILY: 宋体;">,这可以剔除一些发生率比较高的普遍项,譬如我在用关联规则研究红楼梦人物之间的关联的文章中,用这个选项剔除贾宝玉,就可以除掉最后的关联规则中带有贾宝玉的选项,因为这个混在女人堆里面几乎与任何MM有着各种各样千丝万缕联系的人物并不是我所关心的。</span></font></p></div><div><p style="LINE-HEIGHT: 150%;"><font color="#000000" size="2"><span style="FONT-FAMILY: 宋体;">&nbsp;&nbsp;&nbsp; 图</span><span lang="EN-US"><font face="Times New Roman">4</font></span><span style="FONT-FAMILY: 宋体;">是得到模型训练结束后的显示面板,分别介绍一下:模型综述是模型的一些基本情况;关联规则探索是显示找到的关联规则,在这个面板里面,仍然可以通过各种过滤(譬如支持度,关联度的大小等)来进行关联度的细选,这也是非常有用的,通常说来,我们可能需要找寻支持度比较小而置信度却比较大的规则,那么在这里就派上用场了。</span></font></p></div><div><p style="LINE-HEIGHT: 150%;"><span style="FONT-FAMILY: 宋体;"><font color="#000000" size="2">&nbsp;&nbsp;&nbsp; 在统计汇报中,显示一些基本关联规则的统计量和项的统计量;最后一个模型参数的显示,一般来说对于开发人员才有用</font></span></p></div><div><p style="LINE-HEIGHT: 150%;"><font color="#000000" size="2"><span lang="EN-US"><font face="Times New Roman">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; KXEN</font></span><span style="FONT-FAMILY: 宋体;">的任何一种模型,不管是描述型还是预测型,都可以</span><span lang="EN-US"><font face="Times New Roman">apply</font></span><span style="FONT-FAMILY: 宋体;">,既然这样,我觉得就没有必要区分描述型和预测型模型了。在KAR中也是同样,当对一个交易数据集应用关联规则的模型之后,就可以通过</span><span lang="EN-US"><font face="Times New Roman">session</font></span><span style="FONT-FAMILY: 宋体;">的</span><span lang="EN-US"><font face="Times New Roman">item</font></span><span style="FONT-FAMILY: 宋体;">来找寻它们可能要有的</span><span lang="EN-US"><font face="Times New Roman">item</font></span><span style="FONT-FAMILY: 宋体;">。根据这些规则进行目标市场的选择,将是非常有效的.</span></font><span lang="EN-US"><font face="Times New Roman" color="#000000" size="2">&nbsp;</font></span></p></div><div><p style="LINE-HEIGHT: 150%;"><span style="FONT-WEIGHT: 700; FONT-FAMILY: 宋体;"><font color="#000000" size="2">后记</font></span></p></div><div><p style="LINE-HEIGHT: 150%;"><font color="#000000" size="2"><span style="FONT-FAMILY: 宋体;">&nbsp;&nbsp;&nbsp; 这种关联规则的分析也可以用到</span><span lang="EN-US"><font face="Times New Roman">Web</font></span><span style="FONT-FAMILY: 宋体;">数据挖掘上,譬如,一个大的网站系统,可以通过网民的访问信息发现各个网页之间的关联性,灵活的进行网站设计;更进一步,可以直接为每个访客定制个性化的访问页面。譬如,新浪网站是一个不错的新闻系统,可是,不管何种职业何种人物登录网站,都是一样的界面。三岁的小孩子也不可避免的看到杀人抛尸与丰胸产品,这种不和谐是如此的荒谬,可是我们却不去避免。设想一下,不同年龄层次、不同爱好、不同性别的人打开一个网站,将会看到一个符合自己要求的世界,这将是一种全面的和谐。</span></font></p></div><div><p style="LINE-HEIGHT: 150%;"><span style="FONT-FAMILY: 宋体;"><font color="#000000" size="2">&nbsp;&nbsp;&nbsp; 目前在商务智能的数据挖掘中,关联规则应用还是比较少的,我们经常会拿啤酒和尿布的关联来说事,以显示数据挖掘的巨大威力,可以真正的关联规则应用成功案例是少之又少,一个原因是数据挖掘工具的非人性化,另外一个原因是使用人员的非专业化,一个分不清支持度与关联度等基本概念的数据挖掘人员去用一个非人性化的工具,那同给希特勒一颗原子弹没有什么区别,据一个证券公司的挖掘报告显示:他们所发现的一个重要的关联是:上市开户的股民必然也在深市开户。这成了业界的一大笑话。几百万上马的数据挖掘项目,往往成为一文不值的摆设。所以,我们的数据挖掘软件在销售的同时,应该与良好的培训联系在一起的。</font></span></p></div><div><p style="LINE-HEIGHT: 150%;"><span style="FONT-FAMILY: 宋体;"><font color="#000000" size="2">&nbsp;&nbsp;&nbsp; 仍然需要说明的是,在KAR中,你仍然可以发现KXEN的应用理念,她善解人意,总是给你真正需要的东西。我想起钱钟书 先生的一句话:只要一个鸡蛋,何必去认识这只下蛋的母鸡呢。对于商务应用,我们最终是要得到一个可解释的性能良好的模型,这如同我们要得到一只营养丰富的鸡蛋,传统的数据挖掘工具去建模,就相当于把一排母鸡摆在你的面前,让你去选择一只下蛋的母鸡,如果你和所有的母鸡都混得很熟,那么当然可以保证鸡蛋的质量,可是,我们难道是养鸡专业户吗?KXEN的理念就是非常人性化的,你要鸡蛋,OK,我就给你一个最好的鸡蛋</font></span></p></div></div>
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2024-4-29 16:47 , Processed in 0.342885 second(s), 51 queries .

回顶部