10章节 关联规则.pptVIP

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
10章节 关联规则

;10.8 约束性关联规则挖掘 10.9 数量关联规则挖掘 10.10 负关联规则挖掘算法 10.11 加权关联规则挖掘算法 10.12 应用实例分析 10.13 小结;10.1 关联规则基本概念;10.1.1关联规则定义;最小支持度minsup 即用户规定的关联规则必须满足的最小支持度,它表示了一组物品集在统计意义上的需满足的最低程度。 最小置信度minconf 即用户规定的关联规则必须满足的最小置信度,它反应了关联规则的最低可靠度。;10.1.2关联规则分类; 2.基于规则中数据的抽象层次,可以分为单层关联规则和多层关联规则 例如: IBM台式机→Sony打印机是一个细节数据上的单层关联规则; 台式机→Sony打印机,(此处台式机是IBM台式机的较高层次抽象)。; 3.基于规则中涉及到的数据维数,可以分为单维关联规则和多维关联规则 例如: 啤酒→尿布 (单维) 性别=“女”→职???=“秘书” (多维); 10.2关联规则算法原理 ;10.2.1关联规则挖掘算法的两个步骤 ;关联规则挖掘的基本模型;10.2.2基本关联规则算法 ;●深度优先算法 此类算法中必威体育精装版最高效的是J.Han等人提出的FP-growth(Frequent-pattern Growth)算法。 ●划分算法 划分算法的基本思想是将整个数据集划分成可以存放在内存中进行处理的数据块,以节省访问外存的I/0开销。 ●抽样算法 ? 如何计算负边界以找回部分遗漏的频繁项集是抽样算法的关键。 ;10.2.3复杂关联规则算法 ;10.3 分层有哪些信誉好的足球投注网站算法-Apriori算法 ;举例: 已知事务数据库D如表10.1所示,最小支持度计数为2,即 minsupport=2/9, 利用Apriori算法挖掘所有满足minsup的频繁集。 ; (1)第一次扫描,扫描数据库获得每个候选项的计数,从而获得频繁1-项集。如表10-2所示。 ;18; (3) L2进行自连接得到C3={{I1, I4, I5},{ I1, I2, I4},{ I1, I3, I4},{ I1, I3, I5},{ I2, I3, I4}, { I3, I4, I5}} 因为{ I1, I2, I4}的子集{ I1, I2,}和 { I1, I3, I4}、{ I1, I3, I5}的子集{ I1, I3,}及 { I2, I3, I4}的子集{ I2, I3}不在L2中 因此,从C3中删除{ I1, I2, I4}、{ I1, I3, I4}、{ I1, I3, I5}、 { I2, I3, I4}得: C3={{ I1, I4, I5},{ I3, I4, I5}}。然后再扫描数据库D,计算各项集的支持度计数,如表10.5所示,从而得到频繁3-项集L3,如表10.6所示。 ;(4)L3进行自连接得到C4={{ I1, I3, I4 , I5}},由于{ I1, I3, I4 , I5}的子集{ I1, I3, I4 ,}不在L3中,因此删除{ I1, I3, I4 , I5}后C4=?,进而L4=?,算法终止。;10.3.2产生关联规则 ;利用频繁项集生成规则的算法描述如下: for all 频繁k项集 ,k?2 do begin H1={ 中规则的后件,该规则的后件中只有一个项目}; Call ap_genrules( ,H1); end; Procedure ap_genrules( :频繁项集, Hm:m个项目的后件的集合) ;if(km+1) then begin Hm+1=apriori_gen(Hm) for all hm+1? Hm+1 do begin conf=support( )/support( -hm+1); if(conf?minconf) then output 规则 -hm+1→hm+1 with confidence=conf and support=support( ); ;例10-2 以表10.1所示数据为例,来说明关联规则的生成过程。频繁项集 l ={ I1, I4, I5},以下将给出根据l所产生的关联规则。L 的非空子集为:{ I1}、{ I4}、{I5}、{ I1, I4}、{ I4, I5}和{ I1,

文档评论(0)

sheppha + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5134022301000003

1亿VIP精品文档

相关文档