- 1、本文档共14页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
知识发现方法
第9章知识发现方法 9.1数据开采和知识发现的区别与联系 KDD的结构模型如图9.1所示: 9.2知识发现概念 知识发现的定义: KDD是从大量数据中提取出可信的、新颖的、有效的并能被人理解的模式的处理过程,这种处理的过程是非常繁琐的过程。 KDD的特点: 1、从现实世界中存在的一些具体数据中提取知识 。 2、所处理的数据的完整性、一致性和正确性都很难保证 。 3、是对数据背后隐藏的特征和趋势进行分析,最终给出关于数据的总体特征和发展趋势 。 知识发现的研究方向: 效率和可扩放性 数据的时序性 和其他系统的集成 交互性 发现模式的精练 互联网上的知识发现 知识发现的典型应用领域 一、市场 二、工业 三、金融 四、科学研究 五、医疗保健 9.4基于数据库中的知识发现 KDD处理过程 : 数据开采的目标及方法 数据开采主要是利用各种知识发现算法,从数据库数据中发现有关的知识,根据发现知识的不同种类,可以将数据开采的目标分为以下几类: (1) 特征 (characterization) (2) 区分(discrimination) (3) 分类(classification) (4) 关联规则(association) (5) 聚类(clustering) (6) 预测(prediction) 数据挖掘在KDD中所使用主要方法 : (1) 数学统计方法 (2) 机器学习方法 (3) 面向数据库方法 (4) 混合方法 (5) 其他方法 KDD的一些基本特征: 数据库中的知识发现就是对数据库中蕴含的、未知的、非平凡的、有潜在应用价值的模式的提取,KDD 特征如下: (1) 模式 (2) 知识 (3) 置信度 (4) 兴趣度 (5) 有效性 (6) 非平凡性(nontrivial) KDD系统简介 目前KDD的研究已引起各研究机构和公司的关注,一些KDD的原型系统相继建立,下面简单介绍两个KDD系统: DBMiner和Quest ; (1)DBMiner是加拿大Simon Fraser大学研制的一个原型系统,其结构如图9.4所示。DBMiner主要由3个模块组成: 图形用户界面、DBMiner引擎和通信模块。 DBMiner结构图 (2)Quest是由IBM Almaden研究中心开发的KDD系统,其目标是开发各种数据开采方法以更好地用于决策支持。Quest的系统结构如图9.5所示。 Quest的系统结构 * KDD是利用数据采掘算法,按指定方式和阈值抽取有价值的知识 发现有用知识的全过程 ,是应用数据采掘算法和评价解释模式的一个循环过程 知识发现 数据采掘是KDD的一个关键步骤 采掘过程的一个特定步骤 数据开采 联系 区别 图9.1 知识发现系统的结构 图9.3 KDD处理过程 图9.4 DBMiner系统框图 图9.5 Quest的系统结构 * *
文档评论(0)