- 1、本文档共54页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
6_第六讲(关联规则分析)(必威体育精装版修正版).ppt
3、根据规则集所涉及的抽象层 单层关联规则(关联规则表达时不涉及到概念分层) 多层关联规则(关联规则表达时涉及到概念分层,其内部隐含有概念分层的关系) 4、根据关联挖掘的各种扩充 挖掘最大的频繁模式(该模式的任何真超模式都是非频繁的,意味着这个模式是最大的频繁模式) 挖掘频繁闭项集(一个项集c是频繁闭项集,如果不存在其真超集c`,使得每个包含c的事务也包含c`,意味着c的任何一个真超集都不可能是频繁的,我们就说c是频繁闭项集) * 由事务数据库挖掘单维布尔关联规则 最简单的关联规则挖掘,即单维、单层、布尔关联规则的挖掘,而且我们的举例尽量不涉及概念分层。 首先挖掘频繁项集,其前提条件是: 最小支持度 50%,且最小置信度 50% 对规则A ? C,其支持度 =50% 置信度分A推导C和由C推导A,以A推导C为例: * Apriori算法(计算大型数据库时挖掘关联规则的常用算法之一) Apriori算法利用频繁项集性质的先验知识(prior knowledge),通过逐层有哪些信誉好的足球投注网站的迭代方法,即将k-项集用于探察(k+1)-项集,来穷尽数据集中的所有频繁项集(通过先验知识挖掘未知知识)。 先找到频繁1-项集集合(即单个项出现的频率)L1,然后用L1找到频繁2-项集集合L2,接着用L2找L3,直到找不到频繁k-项集,找每个Lk需要一次数据库扫描,过程用到下面性质。 Apriori性质:频繁项集的所有非空子集也必须是频繁的。( 模式不可能比A更频繁的出现,即A与B的非空交集不可能比A大,只能被包含) Apriori算法是反单调的,即一个集合如果不能通过测试,则该集合的所有超集(注意超集与真超集概念是怎么样的?其定义与子集相对!)也不能通过相同的测试。 * Apriori算法步骤 Apriori算法由连接和剪枝两个步骤组成。 连接:为了找Lk,通过Lk-1与自己连接产生候选k-项集的集合,该候选k项集记为Ck。 Lk-1中的两个元素L1和L2可以执行连接操作 的条件是 Ck是Lk的超集,即它的成员可能不是频繁的,但是所有频繁的k-项集都在Ck中(为什么?)。因此可以通过扫描数据库,通过计算每个k-项集的支持度来得到Lk 。 为了减少计算量,可以使用Apriori性质,即如果一个k-项集的(k-1)-子集不在Lk-1中,则该候选不可能是频繁的,可以直接从Ck删除。 * Apriori算法—示例(如何挖掘满足最小支持度的关联的频繁项集) Database TDB 1st scan C1 L1 L2 C2 C2 2rd scan C3 L3 3rd scan Tid Items 10 A, C, D 20 B, C, E 30 A, B, C, E 40 B, E Itemset sup {A} 2 {B} 3 {C} 3 {D} 1 {E} 3 Itemset sup {A} 2 {B} 3 {C} 3 {E} 3 Itemset {A, B} {A, C} {A, E} {B, C} {B, E} {C, E} Itemset sup {A, B} 1 {A, C} 2 {A, E} 1 {B, C} 2 {B, E} 3 {C, E} 2 Itemset sup {A, C} 2 {B, C} 2 {B, E} 3 {C, E} 2 Itemset {B, C, E} Itemset sup {B, C, E} 2 注意:我们假设最小支持度是50%,则最小支持计数是2个,则L1时删除D,则任何包含D的超集其出现次数都不可能再超过1次,即Apriori性质所讲的内容。 剪枝结果 连接! 最终,挖掘出2项集中4个 和3项集中1个频繁项集! C3 Itemset 不在L2中 {A,B,C} {A,B} {B,C,E} 都在 {A,C,E} {A,E} 连接! * Apriori算法—示例使用Apiori性质由L2产生C3 1 .连接:至少有一个元素相同时,才能进行两两连接 C3=L2 L2= {{A,C},{B,C},{B,E}{C,E}} {{A,C},{B,C},{B,E}{C,E}} = {{A,B,C},{A,C,E},{B,C,E}}, 我们认为任何频繁的三项集都包含在此C3中! 2.使用Apriori性质剪枝:频繁项集的所有子集必须是频繁的,对候选项C3,我们可以删除其子集为非频繁的选项: {A,B,C}的2项子集是{A,B},{A,C},{B,C},其中{A,B}不是L2的元素,所以删除这个选项; {A,C,E}的2项子集是{A,C},{A,E},
您可能关注的文档
- 5S与现场管理(必威体育精装版修正版).ppt
- 5、农业生产全程社会化服务推广情况汇报20140728(必威体育精装版修正版).doc
- 5五年级语文上册第三单元日积月累《四时之风》记忆方法(必威体育精装版修正版).ppt
- 5月1日前后工程发票开具税率的税法规定 10%还是11%(必威体育精装版修正版).doc
- 6.燃料电池汽车产业发展现状分析-20180510(必威体育精装版修正版).ppt
- 60道益智题目及答案(必威体育精装版修正版).doc
- 6s管理在儿科护理管理中的应用(必威体育精装版修正版).ppt
- 6、4M40压缩机检修标准(必威体育精装版修正版).doc
- 6工程项目投资的财务分析(必威体育精装版修正版).ppt
- 6年级人物形象分析(必威体育精装版修正版).ppt
- 人教版高中物理选择性必修第一册精品课件 第二章 机械振动 第二章 机械振动-4 单摆.ppt
- 人教版高中物理选择性必修第一册精品课件 第三章 机械波 第三章 机械波-4 波的干涉.ppt
- 人教版高考物理一轮总复习课后习题 第四章 曲线运动 万有引力与航天 课时规范练13 万有引力定律及其应用.doc
- 高考物理一轮总复习精品课件 第10章 磁场 研专项 素养提升 (4).ppt
- 人教版高中物理选择性必修第一册精品课件 第一章 动量守恒定律 第一章 动量守恒定律-重难专题2 动量守恒定律的应用.ppt
- 人教版高中物理选择性必修第一册精品课件 第四章 第四章-4 实验_用双缝干涉测量光的波长.ppt
- 人教版高中物理选择性必修第一册精品课件 第三章 机械波 第三章 机械波-重难专题6 机械波的多解问题.ppt
- 人教版高中物理选择性必修第一册精品课件 第四章 第四章-实验_测量玻璃的折射率.ppt
- 人教版高中物理选择性必修第一册精品课件 第四章 光 第四章 光-1 光的折射.ppt
- 人教版高中物理选择性必修第一册精品课件 第一章 动量守恒定律 第一章 动量守恒定律-4 实验_验证动量守恒定律.ppt
最近下载
- 外研版(2024)Unit 5 Reading课件 2024-2025学年七年级英语上册.pptx VIP
- 糖尿病诊疗指南2024.pptx VIP
- 【新教材】北师大版(2024)七年级上册数学第四章 基本平面图形 综合素质评价测试卷(Word版,含答案).docx
- 2024年在线网课学习课堂《Entrepreneur Growth Plan(辽宁大学 )》单元测试考核答案.pdf
- 公安专业知识 易混易错知识点法律和公专(讲义+笔记)(辅警系统班).pdf
- 核心素养下的大单元教学培训心得(通用).pptx
- 二年级上册美术教案与反思-第6课 下雨了 ▏人美版 .pdf VIP
- 2024年华医网继续教育临床静脉用药质量管理与风险防范答案.docx VIP
- NAD T757 A&V 环绕声接收器用户手册.pdf
- 新能源汽车的品牌推广.pptx
文档评论(0)