- 1、本文档共110页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘第3章关联规则挖掘要点
(4)频繁序列挖掘 在映射后的序列数据库TN中挖掘出所有序列模式:首先得到候选频繁1-序列模式集CS1,扫描序列数据库TN,从CS1中删除支持度低于最小支持MinS的序列,得到频繁1-序列模式集FS1。 然后循环由频繁k-序列集FSk,生成候选频繁(k+1)-序列集CSk+1,再利用定理8-5对CSk+1进行剪枝,并从CSk+1中删除支持度低于最小支持度MinS的序列,得到频繁(k+1)-序列集FSk+1,直到FSk+1=?为止。 例题12 设有频繁3-序列集FS3={{1},{2},{3}, {1},{2},{4},{1},{3},{4},{1},{3},{5},{2},{3},{4}} 解:先利用频繁3-序列集FS3连接生成候选4-序列集,即 将序列{1},{2},{3}和{1},{2},{4}连接生成 {1},{2},{3},{4}和{1},{2},{4},{3}, 将序列{1},{3},{4}和{1},{3},{5}连接生成 {1},{3},{4},{5}和{1},{3},{5},{4} 因此,得到候选4-序列集CS4={{1},{2},{3},{4},{1},{2},{4},{3}, {1},{3},{4},{5},{1},{3},{5},{4}} 根据频繁序列的性质(定理3-5),对C4进行剪枝操作。 首先将4-序列{1},{2},{4},{3}从C4中删除,因为它存在一个3-序列{2},{4},{3}不在FS3之中,即它不会是频繁4-序列。 类似地可以将{1},{3},{4},{5},{1},{3},{5},{4}从CS4中删除。 因此,得到最终的候选频繁4-序列集CS4={{1},{2},{3},{4}}。 例题13 设最小支持数为2,对于表8-16转换映射后的序列数据库TN挖掘出所有的序列模式。 解:在序列数据库的转换和映射过程中已得到频繁1-序列 FS1={ {l},{2},{3},{4},{5}}。 利用频繁1-序列集FS1生成候选频繁2-序列集 CS2={{1},{2},{2}, {1},{1},{3},{3},{1},{1},{4}, {4},{1},{1},{5},{5},{1},{2},{3},{3},{2},{2},{4}, {4},{2},{2},{5},{5},{2},{3},{4},{4},{3},{3},{5}, {5},{3},{4},{5},{5},{4}}。 共有20个候选频繁2-序列。 扫描序列数据库TN并对候选频繁2-序列计算支持数,如{1},{2}的支持数为2,{2}, {1}的支持数为0,{1},{5}支持数为3等,取支持数不低于2的序列组成频繁2-序列集 FS2={{1},{2},{1},{3},{1},{4},{1},{5},{2},{3},{2},{4},{2},{5},{3},{4},{3},{5},{4},{5}} 对频繁2-序列集FS2进行自身连接并剪枝后得到候选3-序列集 CS3={{1},{2},{3},{1},{2},{4},{1},{2},{5},{1},{3},{4},{1},{3},{5},{1},{4},{5},{2},{3},{4},{2},{3},{5}, {2},{4},{5},{3},{4},{5}} 说明:频繁2-序列连接生成20个候选频繁3-序列,其中10个候选频繁3-序列被剪枝,如{1},{3},{2}被剪枝是因其子序列{3},{2}不是频繁2-序列。 对候选频繁3-序列集CS3中每个序列计算支持数,保留支持数不小于2的序列形成频繁3-序列集 FS3={{1},{2},{5},{1},{3},{5},{1},{4},{5}}。 由于FS3不能再产生候选频繁4-序列,故最后得到频繁序列模式集 FS=FS2?FS3={{1},{2},{1},{3},{1},{4},{1},{5},{2},{3},{2},{4},{2},{5},{3},{4},{3},{5},{4},{5}, {1},{2},{5},{1},{3},{5} } 根据需要,将FS中的序列模式转换为真实商品编号的序列模式。比如序列模式{1},{2}对应于{30},{40}, {1},{3},{5}对应于{30},{70},{90},
您可能关注的文档
- 11-004《燃料集控值班员》技师理论试卷d要点.doc
- 11,西汉的建立和“文景之治”要点.ppt
- 11-035《电机检修工(第二版)》技师理论试卷1D要点.doc
- 11,商务礼仪要点.ppt
- 数据分析培训要点.ppt
- 11--20各数的认识要点.ppt
- 11-035《电机检修工(第二版)》技师理论试卷2D要点.doc
- 11(矿物质版本)要点.ppt
- 11-1 算法与程序框图要点.ppt
- 数据库6版讲稿第十四章---基于对象的数据库要点.ppt
- 部编版一年级语文下册第四单元《8 夜色》教学课件(2025年春-新编教材).pptx
- 江苏省盐城市五校2024-2025学年高一下学期4月期中联考数学试卷(含答案).pdf
- 2025年高一语文教师工作总结简单版(六).docx
- 第12课《台阶》课件 2024—2025学年统编版语文七年级下册(共39张PPT).pptx
- 部编版一年级语文下册第四单元《语文园地四》教学课件(2025年春-新编教材).pptx
- 部编版一年级语文下册第四单元《9 端午粽》教学课件(2025年春-新编教材).pptx
- 指导技能的关键要素与提升的策略研究与分享.docx
- 湖南省永州四中直升班2025届高三(下)适应性数学试卷(含答案).pdf
- 湖北省荆荆宜襄·四地七校联盟2024-2025学年高一(下)期中联考数学试卷(含答案).pdf
- 2025年04月17日袁荣的初中历史组卷.docx
文档评论(0)