网站大量收购闲置独家精品文档,联系QQ:2885784924

数据挖掘习题二.pdfVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据挖掘习题二--第1页

数据挖掘习题二

简答:

1.何谓数据挖掘?它有哪些方面的功能?

2.何谓数据仓库?为什么要建立数据仓库?

3.常见的分箱方法有哪些?数据平滑处理的方法有哪些?

4.何谓数据规范化?规范化的方法有哪些?写出对应的变换公式。

数据挖掘讨论题

1、(20分)讨论::下列每项活动是否是数据挖掘任务?简单陈述

你的理由。

(a)根据性别划分公司的顾客。

(b)根据可赢利性划分公司的顾客。

(c)预测投一对骰子的结果。

(d)使用历史记录预测某公司未来的股票价格。

数据挖掘习题二--第1页

数据挖掘习题二--第2页

简答:

5.何谓数据挖掘?它有哪些方面的功能?

从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、

人们事先不知道的、但又是潜在有用的信息和知识的过程称为数据挖掘。相关的名称

有知识发现、数据分析、数据融合、决策支持等。

数据挖掘的功能包括:概念描述、关联分析、分类与预测、聚类分析、趋势分析、

孤立点分析以及偏差分析等。

6.何谓数据仓库?为什么要建立数据仓库?

数据仓库是一种新的数据处理体系结构,是面向主题的、集成的、不可更新的(稳

定性)、随时间不断变化(不同时间)的数据集合,为企业决策支持系统提供所需的集成

信息。

建立数据仓库的目的有3个:

一是为了解决企业决策分析中的系统响应问题,数据仓库能提供比传统事务数据

库更快的大规模决策分析的响应速度。

二是解决决策分析对数据的特殊需求问题。决策分析需要全面的、正确的集成数

据,这是传统事务数据库不能直接提供的。

三是解决决策分析对数据的特殊操作要求。决策分析是面向专业用户而非一般业

务员,需要使用专业的分析工具,对分析结果还要以商业智能的方式进行表现,这是

事务数据库不能提供的。

7.常见的分箱方法有哪些?数据平滑处理的方法有哪些?

分箱的方法主要有:

①统一权重法(又称等深分箱法)

②统一区间法(又称等宽分箱法)

③最小熵法

④自定义区间法

数据平滑的方法主要有:平均值法、边界值法和中值法。

8.何谓数据规范化?规范化的方法有哪些?写出对应的变换公式。

将数据按比例缩放(如更换大单位),使之落入一个特定的区域(如0.0~1.0),称

为规范化。规范化的常用方法有:

(1)最大-最小规范化:maxmin

x(xmin)min

(maxmin)00

00

(2)零-均值规范化:xX

x0

X

(

文档评论(0)

132****2834 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档