关联规则-方匡南的个人网站.PDF

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关联规则-方匡南的个人网站

关 联 规 则 A s s o c i a t i o n R u l e s 方匡南 厦门大学 “尿布与啤酒”的故事是营销界 的神话,一直为人们津津乐道。 按常规思维,尿布与啤酒风马牛 不相及,若不是借助数据挖掘技 术对大量交易数据进行挖掘分析 ,沃尔玛是不会发现隐藏于其中 的关联规律的。 2 数据关联是数据库中存在的一类重要的可被发现的知识 。若两个或多个变量的取值之间存在某种规律性,就称 为关联规则(association rules, AR)。关联规则可分为 简单关联规则、时序关联规则、因果关联规则。关联规 则分析的目的是找出数据库中隐藏的关联网。关联规则 挖掘就是在事务数据库、关系数据库、交易数据库等信 息载体中,发现存在于大量项目集合或者对象集合中有 趣或有价值的关联或相关关系。 3 Agrawal,R等于1993年在分析购物篮问题时首先提出了关联 规则挖掘,以后又经过诸多研究人员对其进行研究和发展, 到目前它已经成为数据挖掘领域最活跃的分支之一。关联规 则的应用十分广发,比如在购物篮分析(Market Basket Analysis ),网络连接(Web Link Analysis )和基因分析等 领域均有所应用,具体应用场景包括优化货架商品摆放、交 叉销售和捆绑销售、异常识别等。 4 目录 Contents 一、基本概念 二、基本分类 三、基本方法 四、案例分析 1 基本概念 Basic Concepts 基本概念 基本分类 基本方法 案例分析 项与项集 I {I , I ,...I ,..., I } I (p 1,2,...,m) 定义1 设 1 2 p m 是m个不同项目的集合,p 称为数据项 (Item),简称项;数据项集合I称为数据项集(Itemset ),简称项集。I 的 任何非空子集X ,若集合X 中包含k个项,则称为k项集 (k-Itemset )。 项集其实就是不同属性取不同值的组合,不会存在相同属性、不同属性值的 项集。例如,二项集{性别= 男,性别=女} 中两项是互斥的,现实中不会存在 7 基本概念 基本分类 基本方法 案例分析 事务与事务集 T (k 1,2,..., n) 定义2 关联挖掘的事务集记为D , , D {T ,T ,...,T ,...,T } k 1 2 k n 是项集I 的非空子集,即Tk  I ,称为事务(Transaction )。每一个 事务有且仅有一个标识符,称为TID (Transaction ID )。 8 基本概念 基本分类 基本方

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档