- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库与数据挖掘习题答案
第1章 数据仓库的概念与体系结构
1。 面向主题的,相对稳定的。
2 。 技术元数据,业务元数据。
3 。 联机分析处理OLAP 。
4. 切片(Slice ),钻取(Drill—down 和Roll—up 等)。
5 。 基于关系数据库。
6 。 数据抽取,数据存储与管理。
7. 两层架构,独立型数据集市,依赖型数据集市和操作型数据存储,逻辑型数据集市和实时
数据仓库。
8。 可更新的,当前值的.
9 。 接近实时。
10. 以报表为主,以分析为主,以预测模型为主, 以营运导向为主.
11。 答:
数据仓库就是一个面向主题的( Subject Oriented )、集成的(Integrate) 、相对稳定的
(Non-Volatile)、反映历史变化(Time Variant)的数据集合,通常用于辅助决策支持.
数据仓库的特点包含以下几个方面:
(1)面向主题。操作型数据库的数据组织是面向事务处理任务,各个业务系统之间各
自分离;而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指
用户使用数据仓库进行决策时所关心的重点领域,一个主题通常与多个操作型业务系统或外
部档案数据相关。
(2)集成的.面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互
独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据作抽取、清理
的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓
库内的信息是关于整个企事业单位一致的全局信息。也就是说存放在数据仓库中的数据应使
用一致的命名规则、格式、编码结构和相关特性来定义.
(3 )相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。
数据仓库的数据主要供单位决策分析之用,对所涉及的数据操作主要是数据查询和加载,一
旦某个数据加载到数据仓库以后,一般情况下将作为数据档案长期保存,几乎不再做修改和
删除操作,也就是说针对数据仓库,通常有大量的查询操作及少量定期的加载(或刷新)操
作。
(4 )反映历史变化。操作型数据库(OLTP)主要关心当前某一个时间段内的数据,而
数据仓库中的数据通常包含较久远的历史数据,因此总是包括一个时间维,以便可以研究趋
势和变化。数据仓库系统通常记录了一个单位从过去某一时点(如开始启用数据仓库系统的
时点)到目前的所有时期的信息,通过这些信息,可以对单位的发展历程和未来趋势做出定
量分析和预测.
12. 答:
(1 )两层架构(Generic Two-Level Architecture)。
(2 )独立型数据集市(Independent Data Mart).
(3 )依赖型数据集市和操作型数据存储 (Dependent Data Mart and Operational Data
Store)。
(4)逻辑型数据集市和实时数据仓库(Logical Data Mart and Real-Time Data Warehouse).
13。 答:
数据仓库技术的发展包括数据抽取、存储管理、数据表现和方法论等方面。在数据抽取
方面,未来的技术发展将集中在系统集成化方面。它将互连、转换、复制、调度、监控纳入
标准化的统一管理, 以适应数据仓库本身或数据源可能的变化,使系统更便于管理和维护。
在数据管理方面,未来的发展将使数据库厂商明确推出数据仓库引擎,作为数据仓库服务器
产品与数据库服务器并驾齐驱.在这一方面,带有决策支持扩展的并行关系数据库将最具发
展潜力。在数据表现方面,数理统计的算法和功能将普遍集成到联机分析产品中,并与
Internet/Web 技术紧密结合。按行业应用特征细化的数据仓库用户前端软件将成为产品作为
数据仓库解决方案的一部分。数据仓库实现过程的方法论将更加普及,将成为数据库设计的
一个明确分支,成为管理信息系统设计的必备。
14。 答:
(1)IBM 公司提供了一套基于可视化数据仓库的商业智能(BI)解决方案,包括:Visual
Warehouse (VW )、Essbase/DB2 OLAP Server 5.0、IBM DB2 UDB, 以及来自第三方的前端数
据展现工具(如 BO)和数据挖掘工具(如 SAS )。其中,VW 是一个功
文档评论(0)