网站大量收购闲置独家精品文档,联系QQ:2885784924

关联规则挖掘算法综述教材.pdf

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2005年4月 中国工程科学 Apr.2005 第7卷第4期 Science V01.7No.4 Engineering -缣:i簪i避-:糍 关联规则挖掘算法综述 毕建欣,张岐山 (福州大学管理学院,福州 350002) [摘要] 介绍了关联规则挖掘算法的基本原理,并按照挖掘中涉及到的变量数目(维数)、数据的抽象层次和 处理变量的类别(布尔型和数值型),依次对关联规则挖掘算法的研究进行综述,并对一些典型的算法进行分析 和比较,最后展望了关联规则挖掘算法的研究方向。 [关键词] 数据挖掘;关联规则;算法;综述 [中图分类号]TP311[文献标识码]A 1 引言 2 关联规则基本原理 数据挖掘是指从大型数据库或数据仓库中提取 设J={i1,i2,…,i。}是m个不同的项目 隐含的、先前未知的、对决策有潜在价值的知识和 组成的集合,给定一个事务数据库D,其中的每 规则。它是人工智能和数据库发展相结合的产物, 一个事务T是J中一组项目的集合,即TCI,T 是国际上数据库和信息决策系统最前沿的研究方向 有一个唯一的标志符TID。若项集xcJ且xc 之一。数据挖掘主要的算法有分类模式、关联规 T,则事务集丁包含项集x。一条关联规则就是 则、决策树、序列模式、聚类模式分析、神经网络 形如x≥Y的蕴涵式,其中x[J,YC工,xny 算法等等。关联规则是数据挖掘领域中的一个非常 =⑦。关联规则x净Y成立的条件:a.它具有支 重要的研究课题,广泛应用于各个领域,既可以检 持度s,即事务数据库D中至少有s%的事务包 含xU 验行业内长期形成的知识模式,也能够发现隐藏的 Y。b.它具有置信度C,即在事务数据库D 新规律。有效地发现、理解、运用关联规则是完成 中包含x的事务至少有C%同时也包含y。 数据挖掘任务的重要手段,因此对关联规则的研究 关联规则挖掘问题就是在事务数据库D中找 具有重要的理论价值和现实意义。 出具有用户给定的最小支持度minsup和最小置信 R.Agrawal等人u1于1993年首先提出了挖掘度minconf的关联规则。关联规则挖掘问题可以分 顾客交易数据库中项集间的关联规则问题,其核心 解为以下2个子问题u,21。 方法是基于频集理论的递推方法。此后人们对关联 1)找出存在与事务数据库中的所有强项集x 的支持度support(X)不小于用户给定的最小支持 规则的挖掘问题进行了大量研究,包括对Apriori itemset)。 算法优化[2~19|、多层次关联规则算法c7,20|、多值 度minsup,则称x为强项集(1arge 属性关联规则算法121’22|、其他关联规则算 2)利用强项集生成关联规则。对于每个强项 法幢3q3J等,以提高算法挖掘规则的效率。 (B)≥minconf,则有关联规则B=(A—B)。 [收稿日期] 2004—04—24;修回日期2004—06—02 [基金项目] 福建省自然科学基金资助项目(A0210013);福建省教育厅资助项目(JA03006) [作者简介] 毕建欣(1974一),女,吉林九台市人

文档评论(0)

xiaofei2001129 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档