- 1、本文档共38页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(数据挖掘)关联规则挖掘——Apriori算法、fp—Tree算法
关联规则挖掘;1、Apriori算法;Apriori的性质: ;Apriori的步骤: ;Apriori算法;Apriori算法实例;实例解答;支持度50;Apriori算法的不足;提高Apriori算法的方法;Hash-based itemset counting(散列项集计数);Transaction reduction(事务压缩);Partitioning(划分);Sampling(采样);2000年,Han等提出了一个称为FP-tree的算法。 FP-tree算法只进行2次数据库扫描。它不使用候选集,直接压缩数据库成一个频繁模式树,最后通过这棵树生成关联规则。
FP-tree算法由两个主要步骤完成:①利用事务数据库中的数据构造FP-tree;②从FP-tree中挖掘频繁模式。
;具体过程:
扫描数据库一次,得到频繁1-项集
把项按支持度递减排序
再一次扫描数据库,建立FP-tree;完备:
不会打破交易中的任何模式
包含了频繁模式挖掘所需的全部信息
紧密
去除不相关信息—不包含非频繁项
支持度降序排列: 支持度高的项在FP-tree中共享的机会???高
决不会比原数据库大(如果不计算树节点的额外开销);步骤2:频繁模式的挖掘; FP-tree算法的一个例子; 第一步、构造FP-tree; 重新调整事务数据库; 创建根结点和频繁项目表; 加入第一个事务(I2,I1,I5); 加入第二个事务(I2,I4); 加入第三个事务(I2,I3); 加入第四个事务(I2,I1,I4); 加入第五个事务(I1,I3); 加入第六个事务(I2,I3); 加入第七个事务(I1,I3); 加入第八个事务(I2,I1,I3,I5); 加入第九个事务(I2,I1,I3); 第二步、FP-growth; 第二步、FP-growth; 第二步、FP-growth; 第二步、FP-growth; 第二步、FP-growth;FP - tree 算法的优缺点;
谢谢大家!
您可能关注的文档
- 活用郎教授理论.doc
- 孙献斌——无烟煤CFB锅炉的开发研究及工程应用.ppt
- 走进佳节话中秋---综合实践活动案例.doc
- 2013年事业单位公开招聘教师——学前教育(历年真题十八套).doc
- 《能源资源的开发——以我国山西省为例》导学案.doc
- 《高层民用建筑设计防火规范》GB50045-95(2005年版.doc
- 数字电路多路彩灯课程设计报告.doc
- 采制样理论知识测试(答案).docx
- 2013年计算机等级考试三级—信息安全技术考试试卷.docx
- 木结构设计规范 GBJ5—88(上).doc
- 七章货物的保险.pptx
- 三章国际间接投资.pptx
- 人性假设理论.pptx
- 外研高一英语必修三ModuleIntroduction汇总市公开课获奖课件省名师示范课获奖课件.pptx
- 月相成因优质获奖课件.pptx
- 小学二年级语文课件《狐假虎威》省名师优质课赛课获奖课件市赛课一等奖课件.pptx
- 养羊业概况专题知识讲座.pptx
- 微生物的实验室培养市公开课获奖课件省名师示范课获奖课件.pptx
- 人教版六年级下册式与方程整理与复习市公开课获奖课件省名师示范课获奖课件.pptx
- 必威体育精装版高中精品语文教学:第二单元-第7课-诗三首:涉江采芙蓉、-短歌行、归园田居市公开课获奖课件省名师.pptx
文档评论(0)