- 1、本文档共38页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * 数据仓库和数据集市 Copyright?2007-2009 创智新程 *Copyright? 2007 创智新程 数据仓库和数据集市 目标 什么是数据仓库 数据仓库系统体系结构 操作数据库与数据仓库的区别 维度建模的相关概念 维度建模的基本步骤 数据集市 *Copyright? 2007 创智新程 数据仓库的定义 数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volation)、反映历史变化(Time Variant)的集合数据,用于支持管理决策和信息的全局共享。 --W.H.Inmon *Copyright? 2007 创智新程 面向主题的 数据仓库是面向不同的主题域进行组织。一个主题通常与多个操作型信息系统相关。 *Copyright? 2007 创智新程 集成的 数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。 *Copyright? 2007 创智新程 相对稳定的 数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。 *Copyright? 2007 创智新程 反映历史变化的 数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。 *Copyright? 2007 创智新程 数据仓库系统体系结构 *Copyright? 2007 创智新程 数据仓库系统体系结构 数据源 数据存储及管理 OLAP引擎 前端工具 *Copyright? 2007 创智新程 操作数据库与数据仓库的区别 操作数据库系统的主要任务是联机事务处理OLTP。 数据仓库在数据分析和决策方面为用户提供服务,这种系统称为联机分析处理OLAP。 *Copyright? 2007 创智新程 维度建模的相关概念 数据仓库 数据集市 事实 维度 数据挖掘 *Copyright? 2007 创智新程 维度建模的相关概念 分析空间 数据仓库中一定量的数据,用于进行数据挖掘以发现新信息同时支持管理决策。 切片 一种用来在数据仓库中将多个维度中的分析空间限制为数据子集的技术。 星型模型 一种使用关系数据库实现多维分析空间的模型。 雪花模型 不管什么原因,当星型模型的维度需要进行规范化时,星型模型就演化为雪花模型。 *Copyright? 2007 创智新程 多维数据模型 一种非规范化的关系模型。 由一组属性构成的表所组成。 表跟表之间的关系通过关键字和外键来定义。 以良好的可理解性和方便的产生报表来进行数据组织,很少考虑修改的性能。 通过SQL或者相关的工具实现数据的查询和维护。 *Copyright? 2007 创智新程 多维数据模型 数据仓库和OLAP工具基于多维数据模型,该模型将数据看作数据立方体形式。 数据立方体允许以多维对数据建模和观察。 一个具有 x、y、z 维度的方块 *Copyright? 2007 创智新程 多维数据模型的组成 维 事实 数据立方体 *Copyright? 2007 创智新程 多维数据模型举例 关系表与多维Cube *Copyright? 2007 创智新程 多维建模技术 星型和雪花模式是主要的存在形式。 星型模式包含一个大的包含大批数据的事实表和一系列维表。 雪花模式是星型模式的变种,不同的是将某些维表规范化。 *Copyright? 2007 创智新程 定单号 . . . 日期标识 . . 定单号 定货日期 日期标识 日 月 事实表 定货表 日期表 星型模式 *Copyright? 2007 创智新程 维表进一步层次化,改善查询性能,增加表数量,增加查询复杂性。 定单号 . . . 日期标识 . . 定单号 定货日期 日期标识 日 月 事实表 定货表 日期表 月 年 年 雪花模式 *Copyright? 2007 创智新程 事实表 每一个事实表通常包含了处理所关心的一系列的度量值。 每一个事实表的行包括: 具有可加性的数值型的度量值。 文本事实通常具有不可预见的内容,很难进行分析。 与维表相连接的外键。 通常具有两个和两个以外的外键。 外键之间表示维表之间多对多的关系。 *Copyright? 2007 创智新程 事实表 事实表的特征 非常大 包含几百几千条甚至几万、几十万的记录。 内容相对的窄 列数较少 经常发生变化 现实世界中新事件的发生-〉事实表中增加一条
您可能关注的文档
- 第六章电子商务物流系统.ppt
- 第六章电子商务盈利模式.ppt
- 第六章电子商务网站的建设.ppt
- 第六章电子政务信息资源管理.ppt
- 第六章第五节物流技术与物流信息技术1.ppt
- 第六章货币资金的业务流程与核算方法设计.ppt
- 第六章配电网馈线自动化.ppt
- 第六讲ERP的主要模块.ppt
- 第六讲-软件工程.ppt
- 第六讲电子商务物流管理(适合经管专业).ppt
- 温州乐成寄宿中学2023年高三第二次模拟考试语文试卷含解析.doc
- 湖南省浏阳市第二中学2022-2023学年高三第一次调研测试语文试卷含解析.doc
- 甘肃省张掖市高台县重点名校2024年中考一模英语试题含答案.doc
- 甘肃省会宁县第四中学2024届高三下学期第六次检测语文试卷含解析.doc
- 滁州市重点中学2024届高三第四次模拟考试语文试卷含解析.doc
- 福建省福州市仓山区福建师范大学附属中学2023届高考冲刺模拟英语试题含解析.doc
- 福建省平和县一中2022-2023学年高考压轴卷语文试卷含解析.doc
- 湖南省长沙市一中、湖南师大附中2023年高三英语第一学期期末学业质量监测模拟试题含解析.doc
- 监狱警察职业道德培训课件.pptx
- 福建省漳州市平和一中、南靖一中等五校2023年高三第六次模拟考试语文试卷含解析.doc
文档评论(0)