- 1、本文档共33页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八讲 广义规则归纳(GRI)
CLEMENTINE 12CLEMENTINE 12
ASSOCIATIONASSOCIATION ((GRIGRI))
关联规则
在描述有关关联规则的一些细节之前,我们先
来看一个有趣的故事:尿布与啤酒的故事。
在一家超市里,有一个有趣的现象:尿布和啤
酒赫然摆在一起出售。但是这个奇怪的举措却
使尿布和啤酒的销量双双增加了。这不是一个
笑话,而是发生在美国沃尔玛连锁店超市的真
实案例,并一直为商家所津津乐道。
关联规则
经过大量实际调查和分析,揭示了一个隐藏在
“尿布与啤酒”背后的美国人的一种行为模式:
在美国,一些年轻的父亲下班后经常要到超市
去买婴儿尿布,而他们中有30%~40%的人同时
也为自己买一些啤酒。产生这一现象的原因是:
美国的太太们常叮嘱她们的丈夫下班后为小孩
买尿布,而丈夫们在买尿布后又随手带回了他
们喜欢的啤酒。
关联规则
数据关联是数据库中存在的一类重要的可被发现的
知识。若两个或多个变量的取值之间存在某种规律
性,就称为关联。
关联可分为简单关联、时序关联、因果关联等。
关联分析的目的是找出数据库中隐藏的关联网。有
时并不知道数据库中数据的关联函数,即使知道也
是不确定的,因此关联分析生成的规则带有可信度。
关联规则挖掘发现大量数据中项集之间有趣的关联
或相关联系。
关联规则
提出:
关联规则(association rules)的挖掘是数据挖掘中
一个重要的问题。关联规则发现最初的形式是
零售商的货篮分析,货篮分析是通过发现顾客
放入其货篮中的不同商品,即不同项之间的关
联,帮助零售商制定营销战略。Agrawal 、
Imielinski和Swami于1993年首先提出挖掘顾客事
务数据库中项集间的关联规则问题。
定义:
关联规则是发现事务数据库中不同商品(项)之
间的联系,这些规则找出顾客购买行为模式,
如购买了某一商品对购买其他商品的影响。
关联规则
分类
1、基于规则中处理的变量的类别,关联规则可以分为布尔
型和数值型。
布尔型关联规则处理的值都是离散的、种类化的,它显示
了这些变量之间的关系;而数值型关联规则可以和多维关
联或多层关联规则结合起来,对数值型字段进行处理,将
其进行动态的分割,或者直接对原始的数据进行处理,当
然数值型关联规则中也可以包含种类变量。
例如:性别=“女”=职业=“秘书”,是布尔型关联规则;
性别=“女”=avg (收入)=2300 ,涉及的收入是数值类型,
所以是一个数值型关联规则。
关联规则
2.基于规则中数据的抽象层次,可以分为单层
关联规则和多层关联规则。在单层的关联规则
中,所有的变量都没有考虑到现实的数据是具
有多个不同的层次的;而在多层的关联规则中,
对数据的多层性已经进行了充分的考虑。例如:
IBM台式机=Sony打印机,是一个细节数据
上的单层关联规则;台式机=Sony打印机,
是一个较高层次和细节层次之间的多层关联规
则。
关联规则
3 、基于规则中涉及到的数据的维数,关联规则可以分为单维
的和多维的。在单维的关联规则中,我们只涉及到数据的一
个维,如用户购买的物品;而在多维的关联规则中,要处理
的数据将会涉及多个维。换成另一句话,单维关联规则是处
理单个属性中的一些关系;多维关联规则是处理各个属性之
间的某些关系。
例如:啤酒=尿布,这条规则只涉及到用户的购买的物品;
性别=“女”=职业=“秘书”,这条规则就涉及到两个字段的
信息,是两个维上的一条关联规则。
4. 基于约束的关联规则、定量关联规则、负关联规则等
关联规则
应用
(1)商业零售行业
对商场销售数据进行分析,从而得到顾客的购
买特性。
(2 )金融和保险服务行业
证券分析家运用关联规则挖掘技术去分析大量
的金融数据,从而为投资活动建立贸易和风险
模型。
文档评论(0)