数据挖掘与知识发现程.pptxVIP

  1. 1、本文档共96页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

知识发现与数据挖掘的基本概念

数据挖掘方法和技术

数据挖掘的知识表示;知识发现的定义

知识发现的研究问题

知识发现的过程

知识发现系统的结构;知识发现是用一种简洁的方式从大量数据中抽取信息的一种技术,所抽取的信息是隐含的、未知的,并且具有潜在应用价值。

知识发现可看成是一种有价值信息的搜寻过程,它不必预先假设或提出问题,仍然能够找到那些非预期的令人关注的信息,这些信息表示了不同研究对象之间的关系和模式。它还能通过全面的信息发现与分析,找到有价值的商业规则。

知识发现意味着在数据仓库或数据集市的几千兆、几万兆字节数据中寻找预先未知的商业模式与事实。;定性知识和定量知识的发现

知识发现方法

知识发现的应用;数据准备

数据挖掘

结果的解释和评估;数据准备

数据集成:对数据进行合并处理、数据检查和清洗工作

数据选择:缩小处理数据的范围,提高数据挖掘的质量

数据预处理:削减数据维数或降维,克服数据挖掘工具的局限性;数据挖掘

探索性数据分析:利用图形化方式对数据进行探索

描述建模:描述数据的所有特征

预测建模:建立一个根据已知变量预测其它变量的模型

分类

回归

寻找模式和规则:进行模式探测

根据内容检索:根据用户感兴趣的模式建立相似的模式;结果的解释和评估

结果的解释

结果不满足用户要求,换一种挖掘方法

结果非常抽象,换一种容易理解的方法

结果的评估

所采用的数据挖掘技术的有效性

用于挖掘的数据质量和数量;知识发现系统管理器

知识库和商业分析员

数据仓库的数据库接口

数据选择

知识发现引擎

知识发现评价

知识发现描述;知识发现系统管理器:

作用是控制并管理整个知

识发现过程;知识库和商业分析员

知识库包含了源于各方面

的知识。商业分析员要按

一种有效的方式指导关注

信息的发现。;数据仓库的数据库接口

知识发现系统的数据库接口

可以直接与数据仓库通信。;数据选择

确定从数据仓库中需要抽

取的数据及数据结构;知识发现引擎

将知识库中的抽取算法提

供给数据选择构件抽取的

数据;知识发现评价

有助于商业分析员筛选模式,

选出那些关注性的信息;知识发现描述

发现、评价并辅助商业分

析员在知识库中保存关注

性发现结果以备将来引用,

并保持知识发现与管理人

员的通信;数据挖掘的进化历程

数据挖掘的任务

数据挖掘的分类

数据挖掘的对象

数据挖掘与专家系统的区别;数据挖掘的进化历程

数据挖掘的任务

数据挖掘的分类

数据挖掘的对象

数据挖掘与专家系统的区别;进化阶段;数据挖掘的范围

数据库可以由此拓展深度和广度;数据挖掘的范围

数据库可以由此拓展深度和广度;“数据挖掘”这个名字来源于它有点类似于在山脉中挖掘有价值的矿藏

在商业应用里,它就表现为在大型数据库里面有哪些信誉好的足球投注网站有价值的商业信息

这两种过程都需要对巨量的材料进行详细地过滤,并且需要智能且精确地定位潜在价值的所在。

对于给定了大小的数据库,数据挖掘技术可以用它如下的超能力产生巨大的商业机会:

自动趋势预测

自动探测以前未发现的模式;“数据挖掘”这个名字来源于它有点类似于在山脉中挖掘有价值的矿藏

在商业应用里,它就表现为在大型数据库里面有哪些信誉好的足球投注网站有价值的商业信息

这两种过程都需要对巨量的材料进行详细地过滤,并且需要智能且精确地定位潜在价值的所在。

对于给定了大小的数据库,数据挖掘技术可以用它如下的超能力产生巨大的商业机会:

自动趋势预测

自动探测以前未发现的模式;数据挖掘能自动在大型数据库里面找寻潜在的预测信息。传统上需要很多专家来进行分析的问题,现在可以快速而直接地从数据中间找到答案。

一个典型的利用数据挖掘进行预测的例子就是目标营销。数据挖掘工具可以根据过去邮件推销中的大量数据找出其中最有可能对将来的邮件推销作出反应的客户。;“数据挖掘”这个名字来源于它有点类似于在山脉中挖掘有价值的矿藏

在商业应用里,它就表现为在大型数据库里面有哪些信誉好的足球投注网站有价值的商业信息

这两种过程都需要对巨量的材料进行详细地过滤,并且需要智能且精确地定位潜在价值的所在。

对于给定了大小的数据库,数据挖掘技术可以用它如下的超能力产生巨大的商业机会:

自动趋势预测

自动探测以前未发现的模式;数据挖掘工具扫描整个数据库并辨认出那些隐藏着的模式,比如通过分析零售数据来辨别出表面上看起来没联系的产品,实际上有很多情况下是一起被售出的情况。

数据挖掘技术可以让现有的软件和硬件更加自动化,并且可以在升级的或者新开发的平台上执行。

当数据挖掘工具运行于高性能的并行处理系统上的时候,它能在数分钟内分析一个超大型的数据库。这种更快的处理速度意味着用户有更多的机会来分析数据,让分析的结果更加准确可靠,并且易于理解。;数据挖掘的范围

数据库可以由此拓展深度和广度;深度上,允许有更多的列存在。

以往,在进行较复杂的数据分析时,专家们限于时间因素,不得不

文档评论(0)

HappyPanda + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档