- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据挖掘习题二--第1页
数据挖掘习题二
简答:
1.何谓数据挖掘?它有哪些方面的功能?
2.何谓数据仓库?为什么要建立数据仓库?
3.常见的分箱方法有哪些?数据平滑处理的方法有哪些?
4.何谓数据规范化?规范化的方法有哪些?写出对应的变换公式。
数据挖掘讨论题
1、(20分)讨论::下列每项活动是否是数据挖掘任务?简单陈述
你的理由。
(a)根据性别划分公司的顾客。
(b)根据可赢利性划分公司的顾客。
(c)预测投一对骰子的结果。
(d)使用历史记录预测某公司未来的股票价格。
数据挖掘习题二--第1页
数据挖掘习题二--第2页
简答:
5.何谓数据挖掘?它有哪些方面的功能?
从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、
人们事先不知道的、但又是潜在有用的信息和知识的过程称为数据挖掘。相关的名称
有知识发现、数据分析、数据融合、决策支持等。
数据挖掘的功能包括:概念描述、关联分析、分类与预测、聚类分析、趋势分析、
孤立点分析以及偏差分析等。
6.何谓数据仓库?为什么要建立数据仓库?
数据仓库是一种新的数据处理体系结构,是面向主题的、集成的、不可更新的(稳
定性)、随时间不断变化(不同时间)的数据集合,为企业决策支持系统提供所需的集成
信息。
建立数据仓库的目的有3个:
一是为了解决企业决策分析中的系统响应问题,数据仓库能提供比传统事务数据
库更快的大规模决策分析的响应速度。
二是解决决策分析对数据的特殊需求问题。决策分析需要全面的、正确的集成数
据,这是传统事务数据库不能直接提供的。
三是解决决策分析对数据的特殊操作要求。决策分析是面向专业用户而非一般业
务员,需要使用专业的分析工具,对分析结果还要以商业智能的方式进行表现,这是
事务数据库不能提供的。
7.常见的分箱方法有哪些?数据平滑处理的方法有哪些?
分箱的方法主要有:
①统一权重法(又称等深分箱法)
②统一区间法(又称等宽分箱法)
③最小熵法
④自定义区间法
数据平滑的方法主要有:平均值法、边界值法和中值法。
8.何谓数据规范化?规范化的方法有哪些?写出对应的变换公式。
将数据按比例缩放(如更换大单位),使之落入一个特定的区域(如0.0~1.0),称
为规范化。规范化的常用方法有:
(1)最大-最小规范化:maxmin
x(xmin)min
(maxmin)00
00
(2)零-均值规范化:xX
x0
X
(
您可能关注的文档
最近下载
- 附件2.安徽省老年大学(学校)建设指导标准(试行).doc
- 《职业素养》知识考试题库(含答案).docx
- DBJ33_T 1321-2024《建筑施工拉杆式悬挑脚手架安全技术规程》.pdf
- 2025年公务员考试时事政治100题及答案(含知识点).docx
- 2024年江西电力职业技术学院单招职业技能测试题库及答案(各地真题).docx VIP
- 新项目方法验证能力确认报告2023简化模板:空气质量 甲醛的测定 乙酰丙酮分光光度法GBT 15516-1995.pdf VIP
- 美的面包机食谱-官方通用版.pdf
- 抗凝剂皮下注射护理规范.pptx VIP
- 学校物业管理服务方案(精选8篇).docx VIP
- 自动控制原理(全套课件1085P).ppt
文档评论(0)