知识发现方法.pptVIP

下载本文档

146
0
约1.31千字
约 14页
2017-11-20 发布于江苏
举报
版权申诉

知识发现方法.ppt

1、本文档共14页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

知识发现方法

第9章知识发现方法 9.1数据开采和知识发现的区别与联系 KDD的结构模型如图9.1所示: 9.2知识发现概念知识发现的定义：ＫＤＤ是从大量数据中提取出可信的、新颖的、有效的并能被人理解的模式的处理过程，这种处理的过程是非常繁琐的过程。 KDD的特点： 1、从现实世界中存在的一些具体数据中提取知识。 2、所处理的数据的完整性、一致性和正确性都很难保证。 3、是对数据背后隐藏的特征和趋势进行分析，最终给出关于数据的总体特征和发展趋势。知识发现的研究方向：效率和可扩放性数据的时序性和其他系统的集成交互性发现模式的精练互联网上的知识发现知识发现的典型应用领域一、市场二、工业三、金融四、科学研究五、医疗保健 9.4基于数据库中的知识发现ＫＤＤ处理过程：数据开采的目标及方法数据开采主要是利用各种知识发现算法，从数据库数据中发现有关的知识，根据发现知识的不同种类，可以将数据开采的目标分为以下几类：（1）特征 (characterization）（2）区分（discrimination）（3）分类（classification）（4）关联规则（association）（5）聚类(clustering) （6）预测(prediction) 数据挖掘在KDD中所使用主要方法： (1) 数学统计方法 (2) 机器学习方法 (3) 面向数据库方法 (4) 混合方法 (5) 其他方法 KDD的一些基本特征：数据库中的知识发现就是对数据库中蕴含的、未知的、非平凡的、有潜在应用价值的模式的提取，KDD 特征如下：（1）模式（2）知识（3）置信度（4）兴趣度（5）有效性（6）非平凡性（nontrivial）ＫＤＤ系统简介目前ＫＤＤ的研究已引起各研究机构和公司的关注，一些ＫＤＤ的原型系统相继建立，下面简单介绍两个ＫＤＤ系统： DBMiner和Quest ；（1）DBMiner是加拿大Simon Fraser大学研制的一个原型系统，其结构如图9.4所示。DBMiner主要由3个模块组成：图形用户界面、DBMiner引擎和通信模块。 DBMiner结构图（2）Quest是由IBM Almaden研究中心开发的ＫＤＤ系统，其目标是开发各种数据开采方法以更好地用于决策支持。Quest的系统结构如图9.5所示。 Quest的系统结构 * KDD是利用数据采掘算法,按指定方式和阈值抽取有价值的知识发现有用知识的全过程，是应用数据采掘算法和评价解释模式的一个循环过程知识发现数据采掘是KDD的一个关键步骤采掘过程的一个特定步骤数据开采联系区别图9.1 知识发现系统的结构图9.3 ＫＤＤ处理过程图9.4 DBMiner系统框图图9.5 Quest的系统结构 * *